OpenAI 被开源包围了。
昨日,AI 社区最大的新闻当属 OpenAI 发布的全新智能体 Deep Research 了!
作为一个使用推理来综合大量在线信息并为用户完成多步骤研究任务的智能体,Deep Research 旨在帮助用户进行深入、复杂的信息查询与分析。
显然,对于那些在金融、科学、政策和工程等领域从事密集知识工作并需要彻底、精确和可靠研究的用户而言,Deep Research 称得上研究神器了。
项目负责人之一 Zhiqing Sun(孙之清)本科毕业于北京大学计算机科学与技术系。2019 年起在 CMU 语言技术研究所攻读博士学位,现为 OpenAI 研究科学家。
遗憾的是,Deep Research 目前仅供 Pro 订阅用户使用,每月 200 美元着实令很多人望而却步。
所以,在 Deep Research 发布之后,各种开源复现版本纷至沓来。
从 OpenAI 发布的官方博客来看,Deep Research 用到了端到端的强化学习,并且在多个领域的复杂浏览和推理任务上进行了训练,因此才有了现在的性能。
其实,早在去年,来自字节跳动 ByteDance Research 的研究人员就提出了基于强化学习(Reinforcement Learning, RL)的 LLM Agent 框架 ——AGILE。该研究已被NeurIPS接收,这应该是学术界第一个用强化学习做Agent的端到端训练的工作。了解更多内容可以参考AI在线此前报道《端到端优化所有能力,字节跳动提出强化学习LLM Agent框架AGILE》。
接下来,我们看看在一天之内,都有哪些 Deep Research开源复现项目。
一、Open Deep Research
其中一个开源复现版本为「Open Deep Research」。
项目地址:https://github.com/nickscamara/open-deep-research
具体而言,Open Deep Research 是一个 AI 智能体,可以对大量的 web 数据进行推理,该方法没有使用 o3 的微调版本,而是使用了爬虫工具 Firecrawl 的提取 + 搜索功能以及推理模型来深入研究网络。
项目主页还放出了 demo 展示,我们可以发现,在询问 Open Deep Research 关于「2025 年 B2B 领域最大的创业机会」时,Open Deep Research 给出了思考过程,答案也相当完美。
根据项目介绍,我们可以得知 Open Deep Research 背后默认的模型为 gpt-4o,如果你想换个其他模型使用也是可以的,只需几行代码即可切换为 Anthropic、Cohere 等发布的模型。
二、OpenDeepResearcher
另外一个比较热门的复现项目为「OpenDeepResearcher」。
项目地址:https://github.com/mshumer/OpenDeepResearcher
作为一个开源的 AI 智能体,OpenDeepResearcher 可以提供全面的研究。用户只需提供一个主题,该智能体就会展开研究,并返回一份综合报告。
其工作过程非常简单,对于给定的查询,OpenDeepResearcher 执行以下步骤:
执行搜索,查看结果页面,并提取重要信息;
如果它想深入了解,其可以重复此过程,并提出新的查询;
完成后,它会使用上下文生成报告。
三、node-DeepResearch
最后一个复现项目是「node-DeepResearch」,它是由 Jina AI CEO 肖涵(Han Xiao)创建。
他表示,OpenAI 的 Deep Research 只是在 while 循环中进行「搜索 + 读取 + 推理」。他在 nodejs 运行环境中,使用谷歌 gemini-flash 和 jina reader(Jina AI 推出的开源工具,将互联网上的 HTML 网页内容转换为适合 LLM 处理的纯文本格式)进行了复现。
我们来看下运行效果。
下面是「jina ai 最新博客文章内容是什么」(what is the latest blog post from jina ai)的 2/3 步搜索示例:首先找到 jina ai 新闻网站、阅读其内容,然后确定最新帖子内容。
下面视频是关于「who is the biggest, cohere, jina ai, voyage」的 13 步查询,经过搜索、反馈、循环之后,结果是正确的(cohere)。这里视频 2 倍加速。
对于 node-DeepResearch,显然缺少了微调 o3 推理模型的支持。
有人认为,这个项目实现了 OpenAI 准备了半年多的东西所做到的功能。还有人呼吁,赶紧把 UI 做得漂亮一点。
目前,该项目已经收获了近 700 个 Stars。
项目地址:https://github.com/jina-ai/node-DeepResearch
相信后续会有更多类似的开源智能体项目出来。