AI在线 AI在线

Agent

NeurIPS 2024 | LLM智能体真能模拟人类行为吗?答案有了

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
12/11/2024 8:49:00 PM
机器之心

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践

在本篇文章中,我们将深入探讨腾讯大语言模型在多个业务场景中的应用,特别是如何通过前沿技术提升模型的智能化与用户体验。 首先介绍腾讯大模型的广泛应用场景,如内容生成、智能客服和角色扮演等,并详细解析 RAG(Retrieval-Augmented Generation)技术及其在实际业务中的创新应用,特别是在文档生成和问答系统中的优势。 此外,文章还将探讨 GraphRAG 在角色扮演场景中的应用,如何结合知识图谱优化复杂的知识推理。
12/11/2024 8:28:15 AM
赵喜生

AI Agent重塑微服务治理

1.项目背景传统场景下,软件的研发主要依靠人,需求沟通、开发、测试、部署等阶段都需要大量人力投入。 大模型优秀的代码生成和一定的思维链推理能力,能够激发微服务研发、运维等环节“智能涌现”,重塑软件研发全生命周期。 商业产品包含效果广告(搜索广告,信息流广告)和展示广告(品牌广告,开屏广告)两大类广告产品,以及基木鱼和观星盘、电商等营销工具。
12/10/2024 9:15:39 AM
百度Geek说

浅析面向场景的大模型应用框架选择

从demo到产品之间存在着鸿沟,大模型应用也是如此。 在工程实践的时候,产品/服务提供的功能与性能及成本之间存在着大量的权衡,面向场景来选择大模型的应用框架,则是一种具体的权衡方法。 例如,什么时候使用Agent?
12/9/2024 10:18:37 AM
曹洪伟

AI在《我的世界》PK盖楼,新旧Claude差距过于明显,网友:审美也是智力的一种

测评大模型Agent能力,从未如此直观。 新旧两版Claude 3.5 Sonnet在《我的世界》里PK盖楼,差距不要太明显,引来大量围观。 图片如果让AI不断迭代,甚至能盖出一片建筑群。
11/15/2024 1:22:07 PM

Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”

继Anthropic之后,OpenAI也要接管人类电脑了? ! 就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator(操作员)”,为用户自动执行任务。
11/14/2024 6:40:57 PM

LLM-R:基于RAG和层次化Agent落地案例解析

在这个由智能设备主导的时代,维护工作的重要性愈发凸显,几乎成了生产活动的守护神。 想象一下,当一台精密的机器在深夜突发故障,而维护手册却像天书一样难以理解,这时,交互式电子技术手册(IETMs)就像一束温暖的灯塔,指引着维护人员安全渡过难关。 面对从图形用户界面(GUIs)到自然语言用户界面(LUIs)的转变,以及复杂逻辑关系的梳理,传统的IETMs显得有些力不从心。
11/14/2024 6:39:23 PM
哎呀AIYA

Agent不是被卡住了,其实在思考

在与用户进行自然对话时,智能体承担着两大核心任务:一是流畅的对话交流,二是精准的推理与规划。 智能体必须整合所有可用信息以作出回应,同时确保其行为始终围绕既定目标展开。 基于人类“快速思考”和“慢速思考”的认知系统灵感,丹尼尔·卡尼曼提出了一个全新的架构Talker-Reasoner,旨在模拟人类的这两种思维模式。
11/7/2024 8:28:53 AM
哎呀AIYA

谷歌 Agent 首次发现真实世界代码漏洞:抢救全球数亿设备,有望挽回数十亿美元损失

AI 首次发现真实世界中的重大安全漏洞? SQLite 中的一个漏洞,幸运地被谷歌研究者的 AI Agent 发现了,修复后并未造成任何损失。 莫非 AI 再进化一番,微软的全球蓝屏事故就可以永久避免了?
11/2/2024 1:32:26 PM
清源

阿里达摩院开源 CoI-Agent:一键生成科研 idea 的 AI 研究助手

阿里巴巴达摩院本月开源了一款名为 CoI-Agent 的 AI 工具,旨在帮助科研人员自动生成科研想法。 这款工具通过输入特定的论文主题,能够迅速生成相关的科研 idea,从而节省科研人员的时间,提高工作效率。 只需输入一个主题,CoI-Agent 就能生成一系列相关的关键词、研究问题和研究方法。
10/25/2024 11:00:56 AM
汪淼

微软连发 10 个 AI 智能体,纳德拉硬刚 Salesforce CEO

就在刚刚,纳德拉亲自宣布:微软一口气发布 10 个 AI Agent!这 10 个 AI Agent 将在 Dynamics 365 中开放,帮助销售、服务、财务和供应链团队提升业务价值,让企业的整体运营更上一层楼。在今年晚些时候,它们就将提供公共预览版。
10/22/2024 6:36:25 PM
汪淼

把 AI 放进《我的世界》服务器:GPT-4o 杀牛宰羊,Claude3.5 把家拆了

把《我的世界》交给大模型,会怎么样?GPT-4o 鲨牛宰羊,Claude3.5 不停在人类身旁放炸药包和敌人,还把家拆了。GPT-4o mini 玩《我的世界》belike: 来到游戏里面,GPT-4o mini(玩家 karolina)一开始还蛮礼貌的:你好世界!
10/21/2024 1:11:17 PM
清源

端到端优化所有能力,字节跳动提出强化学习LLM Agent框架AGILE

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]
9/30/2024 2:14:00 PM
机器之心

新「AI科学家」?MIT整合多智能体,实现材料科学研究自动化

编辑 | 萝卜皮人工智能(AI)的一个关键挑战是:如何创建能够通过「探索新领域」、「识别复杂模式」和「揭示海量科学数据中隐藏的联系」来自主推进科学理解的系统。在最近的工作中,麻省理工学院(Massachusetts Institute of Technology)原子与分子力学实验室(LAMM)的研究人员提出了 SciAgents,一种可以整合利用三个核心概念的方法:(1)使用大规模本体知识图谱来组织和互连不同的科学概念;(2)一套大型语言模型(LLM)和数据检索工具;(3)具有现场学习能力的多智能体(agent)
9/27/2024 5:41:00 PM
ScienceAI

OpenAI 朝 AI 第 3 阶段迈进,正招募人才组建“多智能体”团队

OpenAI 在发布 o1 AI 模型之后,下一步会怎么走?该公司研究员诺姆・布朗(Noam Brown)在 X 平台给出了答案,组建“多智能体”multi-agent 研究团队。根据 OpenAI 公布五级量表,最新推出的 o1 模型处于第二阶段,即所谓的“推理者”(reasoners),而开发 multi-agent 符合第三阶段的目标要求。OpenAI 的五级量表如下:第一级:聊天机器人,具有会话语言的人工智能第二级:推理者,解决人类水平问题的人工智能第三级:智能体,能够代表用户采取行动的人工智能第四级:创新
9/21/2024 12:10:50 PM
故渊

微软发布 Windows Agent Arena 基准框架,评估 AI Agents 运行主流 Windows 应用性能

科技媒体 NeoWin 昨日(9 月 14 日)发布博文,报道称微软官方推出了 Windows Agent Arena 基准框架,用于评估生成式 AI Agents 在 Windows PC 上的性能。Windows Agent Arena 基准框架微软表示该基准框架 AI Agents 使用主流 Windows 应用方面的能力和速度,其中包括 Microsoft Edge 和谷歌 Chrome 浏览器,Visual Studio Code 等编程应用,记事本、时钟和画图等预装 Windows 应用,VLC 等主流
9/15/2024 10:04:37 AM
故渊

荣耀赵明:苹果的 AI 方案会让整个行业更清醒一点,只集成第三方功能不能称为 AI 手机

荣耀 CEO 赵明在 IFA 2024 上宣布,推出行业首个跨应用开放生态智能体(AI Agent)。据AI在线此前报道,荣耀 Magic 7 手机将首发搭载荣耀 AI Agent。“与苹果的封闭系统相比,在中国的互联网和 AI 服务生态下,开放的生态更容易与海量的互联网 AI 服务相结合。”赵明表示:“未来我们跟微软、谷歌和其他的互联网合作伙伴以及 AI 合作伙伴都会持续合作。”谈及苹果的 AI 路径,赵明认为,“苹果的 AI 解决方案会让整个行业更清醒一点,如果手机厂商只是集成了诸如第三方 AI 翻译之类的功能
9/8/2024 8:29:11 PM
沛霖(实习)

英伟达推出 NIM Agent Blueprints 服务,加速企业创建 AI 应用

感谢英伟达昨日(8 月 27 日)发布新闻稿,宣布联合全球合作伙伴,推出全新的 NIM Agent Blueprints 服务,帮助企业打造自己的 AI 体验。AI在线援引英伟达新闻稿内容,NIM Agent Blueprints 服务是预训练、定制 AI 工作流程(workflows)的目录,可为数百万企业开发人员提供一整套软件,用于构建和部署典型用例的生成式人工智能应用,例如客户服务化身、检索增强生成和药物发现虚拟筛选等等。NIM Agent Blueprints 助推开发人员使用 1 个或者多个 AI Age
8/28/2024 10:23:43 AM
故渊