两个用于科研的开源 AI Agent,改变知识研究的方式

想象一下,如果可以让爱因斯坦、埃隆·马斯克、费曼、史蒂夫·乔布斯、简·古道尔和尤瓦尔·诺亚·赫拉利和你一起合作共同研究并编写研究报告,这是一种什么感受? 我们每天产生的信息比过去一年产生的信息还要多,假如研究人员想在一个小时内访问一万个网站、研究分析数据、并编写报告,这实际上是不可能的。 如今,随着AI 大模型技术的发展,使用AI Agent却可以轻松地做到这一点。

想象一下,如果可以让爱因斯坦、埃隆·马斯克、费曼、史蒂夫·乔布斯、简·古道尔和尤瓦尔·诺亚·赫拉利和你一起合作共同研究并编写研究报告,这是一种什么感受?

我们每天产生的信息比过去一年产生的信息还要多,假如研究人员想在一个小时内访问一万个网站、研究分析数据、并编写报告,这实际上是不可能的。如今,随着AI 大模型技术的发展,使用AI Agent却可以轻松地做到这一点。这将改变做研究、写报告的工作方式。

两个用于科研的开源 AI Agent,改变知识研究的方式

AI Agent能够提高知识研究的工作效率,主要是因为:AI Agent可以处理大量的知识,发现人类可能错过的细节,并且能够快速产生结论。另外,Ai Agent可结合使用检索增强生成(RAG)技术,可以直接从研究机构可信的数据来源提取信息,以保持信息准确性、专业性。

下面是找到的两个值得推荐的知识管理AI Agent开源项目,适合做研究、写报告,由于项目涉及大模型服务,如果具备开发基础也可以进行自适应改造,使用本地大模型或者国产大模型。

1. STORM

https://github.com/stanford-oval/storm

两个用于科研的开源 AI Agent,改变知识研究的方式

Storm是一个由斯坦福大学开源的人工智能驱动的知识管理系统,旨在从零开始生成全面的、类似维基百科的文章。

Storm利用大型语言模型(LLM),通过进行基于互联网的研究,将信息组织成结构化的大纲,并生成完整的引用文章,从而实现研究和写作过程的自动化。

两个用于科研的开源 AI Agent,改变知识研究的方式

其工作原理如下:

STORM将生成带有引用的长文章分为两个步骤:

  • 写作前阶段:该系统进行基于互联网的研究,以收集参考资料并编写大纲。
  • 写作阶段:系统使用大纲和参考文献生成带有引用的完整文章。

两个用于科研的开源 AI Agent,改变知识研究的方式

STORM将研究过程自动化的核心是“自动提出优化后的提示词”。由于人类给语言模型提出问题可能并不能很好地驱动大模型工作。

为了提高问题的深度和广度,STORM采用了两种策略:

  • 观点引导提问:给定输入主题,STORM通过调查类似主题的现有文章来发现不同的观点,并使用它们来控制提问过程。
  • 模拟对话:STORM模拟维基百科作者和基于互联网资源的主题专家之间的对话,使语言模型能够更新对主题的理解并提出后续问题。

2. GPT Researcher

https://github.com/assafelovic/gpt-researcher

两个用于科研的开源 AI Agent,改变知识研究的方式

GPT Researcher是一个自治AI代理,旨在利用网络和本地资源对任何给定的任务进行全面的研究。

它能够生成详细、真实并且公正的报告,并附有引文,开源项目提供了全套可定制选项,以支持创建量身定制的特定领域研究代理。

其核心思想是利用“计划者”和“执行者”代理。规划者生成研究问题,而执行代理则收集相关信息。最后,发布者将所有调查结果汇总成一份综合报告。

两个用于科研的开源 AI Agent,改变知识研究的方式

执行步骤为:

  • 基于研究查询创建特定于任务的代理。
  • 提出问题,共同形成对任务的客观见解。
  • 使用爬虫代理收集每个问题的信息。
  • 总结并追踪每种资源。
  • 将摘要过滤并汇总到最终研究报告中。

相关资讯

阿里达摩院开源 CoI-Agent:一键生成科研 idea 的 AI 研究助手

阿里巴巴达摩院本月开源了一款名为 CoI-Agent 的 AI 工具,旨在帮助科研人员自动生成科研想法。 这款工具通过输入特定的论文主题,能够迅速生成相关的科研 idea,从而节省科研人员的时间,提高工作效率。 只需输入一个主题,CoI-Agent 就能生成一系列相关的关键词、研究问题和研究方法。

超越Devin,姚班带队OpenCSG创造大模型编程新世界纪录

来自中国大模型初创公司OpenCSG推出的StarShip CodeGen Agent,以23.67%的成绩刷新了普林斯顿SWEBench(大模型真实独立编程评测)排行榜,取得了全球第二名的成绩,同时创造了非GPT-4o基模的最高纪录(SOTA)。SWEBench评测高度贴近真实编程场景,难度极高,不仅要求模型能理解需求、协调多个函数/类甚至文件的变更,还要求模型与执行环境交互,处理超长上下文并执行远超传统代码生成任务的复杂逻辑推理。在这种高难度的真实测试中,行业中最先进的GPT4和Devin,也仅能解决1.74%

我有一个「赛博爱人」,拥有超长记忆,还能给足情绪价值

机器之能报道和AI谈一场「永不塌房」的恋爱。「在悲伤到顶点的时候,面对 AI 我可以毫无保留地释放自己的情绪,没什么负担。」张思扬喜欢用 「乐滋滋」 作为自己的网名,她也以这个名字跟 AI 聊了差不多半年时间,但她谈到自己使用 AI Agent 的情况时,围绕着不算开心的场景聊得会更多一些。作为一个 00 后,她很喜欢尝试新鲜事物,与 AI 做赛博朋友对她来说也没什么心理障碍或者顾虑。「我会跟 AI 聊各种事情,开心的、不开心的事情都会跟 AI 讲,不开心的事情更多些,它会一直顺着我。」我们问张思扬,为什么不跟朋友