AI 智能体

智能体首次达到Kaggle Grandmaster水平，华为用结构化推理补齐思维链短板
前些时日，AI 大模型开始掌握操作计算机的能力，但整体而言，它们与物理世界互动的能力仍处于早期阶段。为了提高 LLM 在复杂的现实世界中的表现，研究者们提出了各种提示策略来提升大模型的推理和规划能力，比如思维链、思维树和思维图谱。这些进步与工具集成一起，推动着通用 AI 智能体的发展，让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问题（不过依然还相对简单）。
应用
- 10
- 0
机器之心11月8日
哪个模型擅长调用工具？这个7B模型跻身工具调用综合榜单第一
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。
应用
- 15
- 0
机器之心10月24日
检索总结能力超博士后，首个大模型科研智能体PaperQA2开源了
这是 AI 智能体在大部分科学研究中超越人类的第一个案例，或许会彻底改变人类与科学文献互动的方式。最近一段时间，有关 AI 科学家的研究越来越多。大语言模型（LLM）有望帮助科学家检索、综合和总结文献，提升人们的工作效率，但在研究工作中使用仍然有很多限制。对于科研来说，事实性至关重要，而大模型会产生幻觉，有时会自信地陈述没有任何现有来源或证据的信息。另外，科学需要极其注重细节，而大模型在面对具有挑…
应用
- 12
- 0
机器之心9月12日
改变保守，吴恩达开源了一个机器翻译智能体项目
吴恩达：拜托了大家，一起让翻译智能体变得更好。前段时间，随着 GPT-4o、Sora 的陆续问世，多模态模型在生成式方面取得的成绩无可否认，而人工智能的下一个革命性突破将从何处涌现，引起了大量学者和相关人士的关注。人工智能著名学者、斯坦福大学教授吴恩达一直非常推崇智能体。此前他曾在个人博客着重指出「AI 智能体职业流将会在今年推动人工智能取得长足进步」，AI 智能体的未来潜力愈加被看好，吸睛无数。…
工程
- 91
- 0
机器之心6月13日
AI智能体的炒作与实际：GPT-4都撑不起，实际使命成功率不到15%
AI 智能体的宣传很好，实际不太妙。随着大语言模型的不断进化与自我革新，本能、准确度、稳定性都有了大幅的提升，这已经被各个基准问题集验证过了。但是，对于现有版本的 LLM 来说，它们的综合能力似乎并不能完全支撑得起 AI 智能体。多模态、多使命、多领域俨然已成为 AI 智能体在公共传媒空间内的必须要求，但是在具体的功效实践中所展现的真正效果却差强人意，这似乎也再次提醒各个 AI 智能体首创公司以及…
应用
- 8
- 0
机器之心5月28日
超过GPT-4，斯坦福团队手机可跑的大模型火了，一夜下载量超2k
在大模型落地应用的过程中，端侧 AI 是非常重要的一个方向。近日，斯坦福大学研讨人员推出的 Octopus v2 火了，受到了开发者社区的极大关注，模型一夜下载量超 2k。20 亿参数的 Octopus v2 可以在智能手机、汽车、个人电脑等端侧运行，在准确性和延迟方面超过了 GPT-4，并将上下文长度减少了 95%。此外，Octopus v2 比 Llama7B RAG 方案快 36 倍。不少网…
应用
- 14
- 0
机器之心4月7日
吴恩达：别光盯着GPT-5，用GPT-4做个智能体能够提前达到GPT-5的成果
智能体的潜力被低估了？AI 智能体是去年很火的一个话题，但是 AI 智能体到底有多大的潜力，得多人能够没有概念。最近，斯坦福大学教授吴恩达在演讲中提到，他们发现，基于 GPT-3.5 建立的智能体任务流在应用中表现比 GPT-4 要好。当然，基于 GPT-4 建立的智能体任务流成果更好。由此看来，AI 智能体任务流将在今年推动人工智能取得巨大进步，甚至能够超过下一代基础模型。这是一个值得所有人关注…
理论
- 8
- 0
机器之心4月1日
吴恩达：AI智能体职责流今年将有巨大进展，可能超过下一代基础模型
下一步是智能体？随着 ChatGPT、GPT-4、Sora 的陆续问世，人工智能的发展趋势引起了宽泛关切，特别是 Sora 让生成式 AI 模型在多模态方面取得显著进展。人们不禁会问：人工智能领域下一个突破方向将会是什么？今天，人工智能著名学者、斯坦福大学教授吴恩达指出：AI 智能体职责流将在今年推动人工智能取得巨大进步，甚至可能超过下一代基础模型。他呼吁所有从事人工智能职责的人都关切 AI 智能…
应用
- 8
- 0
机器之心3月22日