理论

一文读懂 Agentic RAG 技术点滴

大型语言模型(Large Language Models, LLMs)彻底改变了我们与信息的交互方式。 然而,LLMs 完全依赖内部知识的局限性,常常限制了其在处理复杂问题时的准确性和深度。 正是在这一背景下,检索增强生成(Retrieval-Augmented Generation, RAG)应运而生。

人人都可定制Agent应用,阿里云百炼全面支持MCP服务部署与调用

4月9日,阿里云百炼上线业界首个全生命周期MCP服务,无需用户管理资源、开发部署、工程运维等工作,5分钟即可快速搭建一个连接MCP服务的 Agent(智能体)。 百炼平台首批上线了高德、无影、Fetch、Notion等50多款阿里巴巴集团和三方MCP服务,覆盖生活信息、浏览器、信息处理、内容生成等领域,可满足不同场景的Agent应用开发需求。 阿里云百炼MCP服务上线,全面支持MCP服务部署与调用MCP已被公认为大模型连接软件应用的标准协议,短短数月,兼容MCP协议的软件应用呈现指数型增长,极大地拓宽了大模型的应用边界。

阿里云刘伟光:AI正在推动各行各业的生产力变革

“阿里云大模型的战略就是服务企业市场创造社会价值,AI正在推动各行各业的生产力变革,通义大模型将深耕企业市场。 ”4月9日,阿里云在京召开AI势能大会,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光称,大模型的社会价值正在企业市场释放,阿里云将坚定投入,打造全栈领先的技术,持续开源开放,为AI应用提速。 近一年多来,通义大模型技术加速迭代,在to B和to C赛道都取得了一些进展,在消费端表现为用户体验的优化,在产业侧表现为生产力的极大提升。

量化单个细胞中表达的一半蛋白质组,质谱技术最新进展推动SCP发展

编辑丨coisini单细胞蛋白质组学(single-cell proteomics,SCP)是研究单个细胞内蛋白质表达多样性的研究领域。 自 2020 年以来,蛋白质组学在可达到的灵敏度方面实现了超过 100 倍的提升,这一成就得益于质谱仪设计的一系列改进以及结合机器学习的数据处理算法。 SCP 有潜力扩展现有分析工具集,但在吞吐量和蛋白质组深度方面仍受到限制。

AI发论文被顶会接收?拿到6/7/6同行评审的AI Scientist-v2有多强,技术细节来了

编辑 | ScienceAI还记得 2024 年 8 月 Sakana AI 发布的 AI Scientist 吗? 全球首个用于自动化科学研究和开放式发现的 AI 系统。 如今它已经进化到了 AI Scientist-v2 版本,并且它生成的论文几乎达到被 AI 顶会接收的水平了!

孪生世界动态仿真新突破!北大发布RainyGS:降雨/洪涝/风速精准可控

神经辐射场(NeRF)及三维高斯泼溅(3D Gaussian Splatting,3DGS)虽能构建静态数字孪生,却无法模拟真实世界的动态,不仅限制了虚拟现实和混合现实的真实感,也是智能训练与Real2Sim2Real范式突破的关键瓶颈。 如何让数字孪生世界具备真实物理规律,实现可预测、可操控的动态环境,是自动驾驶、具身智能等空间智能应用亟待解决的核心挑战。 为此,北京大学陈宝权教授研究团队提出RainyGS技术(合作者为楚梦渝、陈文拯助理教授,博士生戴启宇、倪星宇和本科生沈千帆),探索了一条通向「孪生世界动态仿真」的新路径。

5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持

今早,谷歌Deep Research迎来史上最强升级,正式搭载了Gemini 2.5 Pro全球顶尖模型。 这一次,新版本在以下方面得到显著的提升:分析推理:逻辑更清晰,结论更有深度信息整合:从海量数据中快速提炼要点,化繁为简报告洞察力:生成的报告不仅详尽,还能提供独到的见解。 谷歌CEO劈柴哥转发力挺。

南洋理工&普渡大学提出CFG-Zero*:在Flow Matching模型中实现更稳健的无分类器引导方法

本篇论文是由南洋理工大学 S-Lab 与普渡大学提出的无分类引导新范式,支持所有 Flow Matching 的生成模型。 目前已被集成至 Diffusers 与 ComfyUI。 论文标题:CFG-Zero*: Improved Classifier-Free Guidance for Flow Matching Models论文地址::: AI 的快速发展,文本生成图像与视频的扩散模型(Diffusion Models)已成为计算机视觉领域的研究与应用热点。

CVPR 2025 HighLight|打通视频到3D的最后一公里,清华团队推出一键式视频扩散模型VideoScene

论文有两位共同一作。 汪晗阳,清华大学计算机系本科四年级,研究方向为三维视觉、生成模型,已在CVPR、ECCV、NeurIPS等会议发表论文。 刘芳甫,清华大学电子工程系直博二年级,研究方向为生成模型 (3D AIGC和Video Generation等),已在CVPR、ECCV、NeurIPS、ICLR、KDD等计算机视觉与人工智能顶会发表过多篇论文。

论文党狂喜!alphaXiv推出Deep Research一秒搜遍arXiv,研究效率直接爆表

刚刚,alphaXiv 推出了新功能「Deep Research for arXiv」,该功能可协助研究人员更高效地在 arXiv 平台上进行学术论文的检索与阅读,显著提升文献检索及研究效率。 体验链接:,当用户输入「Can you help me do a lit review for self-supervised learning. with relevant applications?」时,系统迅速生成了一篇内容完整、结构清晰的文献综述,并提供了 arXiv 链接。

Llama 4五大疑点曝光,逐层扒皮!全球AI进步停滞,NYU教授称Scaling彻底结束

令人失望的Llama 4,只是前奏而已。 接下来我们恐将看到——全球局势的改变,将彻底阻止AI进步! 最近,一位AI CEO做出长视频,逐级对Llama 4身上的六大疑点进行了扒皮。

"是我创造了第一个LLM"!Kaggle前首席科学家一句话引发AI学术圈考古行动

论如何在技术圈争论中一句话噎到对方:哥们,是我创造了第一个大语言模型。 发言者Jeremy Howard为澳大利亚昆士兰大学名誉教授、曾任Kaggle创始总裁和首席科学家,现answer.ai与fast.ai创始人,。 事情的起因是有人质疑他最近的项目llms.txt在帮助大模型爬取互联网信息上并没太大作用,从而引发了这段争论,迅速引起众人围观。

MySQL遇到AI:字节跳动开源 MySQL 虚拟索引 VIDEX

虚拟索引技术(virtual index,也称为 hypothetical index)在数据库系统的查询优化、索引推荐等场景中扮演着关键角色。 简单来说,虚拟索引可以理解为数据库的'沙盘推演'系统——无需真实构建索引,仅基于统计信息即可精准模拟不同索引方案对查询计划的优化效果。 由于虚拟索引的创建/删除代价极低,使用者可以大量创建和删除索引、反复推演,确定最有效的索引方案。

首个AI科学家发论文进ICLR!得分6/7/6,从选题到实验全程零人工,连GitHub代码库都是AI写的

嚯! 完全由AI生成的论文,通过顶会ICLR评审? !

生图加入CoT,性能提升80%!微软港中文打造天才画手

AI绘画火爆的当下,大家都有过这样的体验:满心欢喜地输入一段描述,满心期待着生成超酷炫的图像,结果AI给出的作品却差强人意,不是没get到重点,就是细节各种「翻车」。 今天要介绍的ImageGen-CoT技术,就像是给AI绘画开了「外挂」,让它变得超智能,创作更轻松! 来自微软和港中文的华人研究者提出了ImageGen-CoT,用思维链(CoT)推理提升文本到图像上下文学习能力。

GPT-4o图像生成架构被“破解”了?自回归主干+扩散解码器,还有4o图像生成全面测评基准

GPT-4o图像生成架构被“破解”了! 最近一阵,“万物皆可吉卜力”让GPT-4o的图像生成功能一炮而红,人们随之好奇:4o图像生成的架构底层逻辑到底是什么? GPT-4o究竟强在哪?

知识图谱驱动!港大LightRAG终结企业碎片化检索,效率飙升200%

1、前言当前的检索增强生成(RAG)技术在实际应用中面临若干挑战。 传统的RAG采用基于向量的扁平化数据表示,难以有效建模实体之间的复杂语义关系,导致在处理复杂领域知识时检索精度不足。 此外,传统RAG在多实体关联推理中容易出现逻辑断层,且全量更新机制使得知识库的维护成本随数据规模指数增长。

三个LLM顶一个OpenAI?2亿条性能记录加持,路由n个「小」模型逆袭

当前大模型研究面临三大困境:算力垄断(顶尖成果集中于大厂)、成本壁垒(单次训练成本高,可能需要数千GPU小时)以及技术路径单一化(过度依赖单一模型的规模扩展)。 为突破这些限制,路由LLM(Routing LLM)范式应运而生——通过智能调度实现多个开源小模型的协同增效,以「组合创新」替代「规模竞赛」。 代码:: : level的MoE(Mixture-of-Experts),传统MoE通过在模型内部扩展专家网络(如稀疏激活的FFN层)提升性能,而路由LLM将完整LLM视为独立「专家」,通过预训练Router动态分配任务输入。