Agent

NeurIPS 2024 | LLM智能体真能模拟人类行为吗？答案有了

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

12/11/2024 8:49:00 PM

机器之心

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践

在本篇文章中，我们将深入探讨腾讯大语言模型在多个业务场景中的应用，特别是如何通过前沿技术提升模型的智能化与用户体验。首先介绍腾讯大模型的广泛应用场景，如内容生成、智能客服和角色扮演等，并详细解析 RAG（Retrieval-Augmented Generation）技术及其在实际业务中的创新应用，特别是在文档生成和问答系统中的优势。此外，文章还将探讨 GraphRAG 在角色扮演场景中的应用，如何结合知识图谱优化复杂的知识推理。

12/11/2024 8:28:15 AM

赵喜生

AI Agent重塑微服务治理

1.项目背景传统场景下，软件的研发主要依靠人，需求沟通、开发、测试、部署等阶段都需要大量人力投入。大模型优秀的代码生成和一定的思维链推理能力，能够激发微服务研发、运维等环节“智能涌现”，重塑软件研发全生命周期。商业产品包含效果广告（搜索广告，信息流广告）和展示广告（品牌广告，开屏广告）两大类广告产品，以及基木鱼和观星盘、电商等营销工具。

12/10/2024 9:15:39 AM

百度Geek说

浅析面向场景的大模型应用框架选择

从demo到产品之间存在着鸿沟，大模型应用也是如此。在工程实践的时候，产品/服务提供的功能与性能及成本之间存在着大量的权衡，面向场景来选择大模型的应用框架，则是一种具体的权衡方法。例如，什么时候使用Agent？

12/9/2024 10:18:37 AM

曹洪伟

AI在《我的世界》PK盖楼，新旧Claude差距过于明显，网友：审美也是智力的一种

测评大模型Agent能力，从未如此直观。新旧两版Claude 3.5 Sonnet在《我的世界》里PK盖楼，差距不要太明显，引来大量围观。图片如果让AI不断迭代，甚至能盖出一片建筑群。

11/15/2024 1:22:07 PM

Scaling Law遭遇瓶颈，OpenAI被曝押注智能体“Operator”

继Anthropic之后，OpenAI也要接管人类电脑了？！就在刚刚，彭博社爆料OpenAI将在明年1月推出Agent“Operator（操作员）”，为用户自动执行任务。

11/14/2024 6:40:57 PM

LLM-R：基于RAG和层次化Agent落地案例解析

在这个由智能设备主导的时代，维护工作的重要性愈发凸显，几乎成了生产活动的守护神。想象一下，当一台精密的机器在深夜突发故障，而维护手册却像天书一样难以理解，这时，交互式电子技术手册（IETMs）就像一束温暖的灯塔，指引着维护人员安全渡过难关。面对从图形用户界面（GUIs）到自然语言用户界面（LUIs）的转变，以及复杂逻辑关系的梳理，传统的IETMs显得有些力不从心。

11/14/2024 6:39:23 PM

哎呀AIYA

Agent不是被卡住了，其实在思考

在与用户进行自然对话时，智能体承担着两大核心任务：一是流畅的对话交流，二是精准的推理与规划。智能体必须整合所有可用信息以作出回应，同时确保其行为始终围绕既定目标展开。基于人类“快速思考”和“慢速思考”的认知系统灵感，丹尼尔·卡尼曼提出了一个全新的架构Talker-Reasoner，旨在模拟人类的这两种思维模式。

11/7/2024 8:28:53 AM

哎呀AIYA

谷歌 Agent 首次发现真实世界代码漏洞：抢救全球数亿设备，有望挽回数十亿美元损失

AI 首次发现真实世界中的重大安全漏洞？ SQLite 中的一个漏洞，幸运地被谷歌研究者的 AI Agent 发现了，修复后并未造成任何损失。莫非 AI 再进化一番，微软的全球蓝屏事故就可以永久避免了？

11/2/2024 1:32:26 PM

清源

阿里达摩院开源 CoI-Agent：一键生成科研 idea 的 AI 研究助手

阿里巴巴达摩院本月开源了一款名为 CoI-Agent 的 AI 工具，旨在帮助科研人员自动生成科研想法。这款工具通过输入特定的论文主题，能够迅速生成相关的科研 idea，从而节省科研人员的时间，提高工作效率。只需输入一个主题，CoI-Agent 就能生成一系列相关的关键词、研究问题和研究方法。

10/25/2024 11:00:56 AM

汪淼

微软连发 10 个 AI 智能体，纳德拉硬刚 Salesforce CEO

就在刚刚，纳德拉亲自宣布：微软一口气发布 10 个 AI Agent！这 10 个 AI Agent 将在 Dynamics 365 中开放，帮助销售、服务、财务和供应链团队提升业务价值，让企业的整体运营更上一层楼。在今年晚些时候，它们就将提供公共预览版。

10/22/2024 6:36:25 PM

汪淼

把 AI 放进《我的世界》服务器：GPT-4o 杀牛宰羊，Claude3.5 把家拆了

把《我的世界》交给大模型，会怎么样？GPT-4o 鲨牛宰羊，Claude3.5 不停在人类身旁放炸药包和敌人，还把家拆了。GPT-4o mini 玩《我的世界》belike：来到游戏里面，GPT-4o mini（玩家 karolina）一开始还蛮礼貌的：你好世界！

10/21/2024 1:11:17 PM

清源

端到端优化所有能力，字节跳动提出强化学习LLM Agent框架AGILE

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]

9/30/2024 2:14:00 PM

机器之心

新「AI科学家」？MIT整合多智能体，实现材料科学研究自动化

编辑 | 萝卜皮人工智能（AI）的一个关键挑战是：如何创建能够通过「探索新领域」、「识别复杂模式」和「揭示海量科学数据中隐藏的联系」来自主推进科学理解的系统。在最近的工作中，麻省理工学院（Massachusetts Institute of Technology）原子与分子力学实验室（LAMM）的研究人员提出了 SciAgents，一种可以整合利用三个核心概念的方法：（1）使用大规模本体知识图谱来组织和互连不同的科学概念；（2）一套大型语言模型（LLM）和数据检索工具；（3）具有现场学习能力的多智能体（agent）

9/27/2024 5:41:00 PM

ScienceAI

OpenAI 朝 AI 第 3 阶段迈进，正招募人才组建“多智能体”团队

OpenAI 在发布 o1 AI 模型之后，下一步会怎么走？该公司研究员诺姆・布朗（Noam Brown）在 X 平台给出了答案，组建“多智能体”multi-agent 研究团队。根据 OpenAI 公布五级量表，最新推出的 o1 模型处于第二阶段，即所谓的“推理者”（reasoners），而开发 multi-agent 符合第三阶段的目标要求。OpenAI 的五级量表如下：第一级：聊天机器人，具有会话语言的人工智能第二级：推理者，解决人类水平问题的人工智能第三级：智能体，能够代表用户采取行动的人工智能第四级：创新

9/21/2024 12:10:50 PM

故渊

微软发布 Windows Agent Arena 基准框架，评估 AI Agents 运行主流 Windows 应用性能

科技媒体 NeoWin 昨日（9 月 14 日）发布博文，报道称微软官方推出了 Windows Agent Arena 基准框架，用于评估生成式 AI Agents 在 Windows PC 上的性能。Windows Agent Arena 基准框架微软表示该基准框架 AI Agents 使用主流 Windows 应用方面的能力和速度，其中包括 Microsoft Edge 和谷歌 Chrome 浏览器，Visual Studio Code 等编程应用，记事本、时钟和画图等预装 Windows 应用，VLC 等主流

9/15/2024 10:04:37 AM

故渊

荣耀赵明：苹果的 AI 方案会让整个行业更清醒一点，只集成第三方功能不能称为 AI 手机

荣耀 CEO 赵明在 IFA 2024 上宣布，推出行业首个跨应用开放生态智能体（AI Agent）。据AI在线此前报道，荣耀 Magic 7 手机将首发搭载荣耀 AI Agent。“与苹果的封闭系统相比，在中国的互联网和 AI 服务生态下，开放的生态更容易与海量的互联网 AI 服务相结合。”赵明表示：“未来我们跟微软、谷歌和其他的互联网合作伙伴以及 AI 合作伙伴都会持续合作。”谈及苹果的 AI 路径，赵明认为，“苹果的 AI 解决方案会让整个行业更清醒一点，如果手机厂商只是集成了诸如第三方 AI 翻译之类的功能

9/8/2024 8:29:11 PM

沛霖（实习）

英伟达推出 NIM Agent Blueprints 服务，加速企业创建 AI 应用

感谢英伟达昨日（8 月 27 日）发布新闻稿，宣布联合全球合作伙伴，推出全新的 NIM Agent Blueprints 服务，帮助企业打造自己的 AI 体验。AI在线援引英伟达新闻稿内容，NIM Agent Blueprints 服务是预训练、定制 AI 工作流程（workflows）的目录，可为数百万企业开发人员提供一整套软件，用于构建和部署典型用例的生成式人工智能应用，例如客户服务化身、检索增强生成和药物发现虚拟筛选等等。NIM Agent Blueprints 助推开发人员使用 1 个或者多个 AI Age

8/28/2024 10:23:43 AM

故渊

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 OPPO 小布助手网页版上线，接入满血版 DeepSeek 本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果人形机器人深度学习 AI视频模态 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型