Agent
啥是AI Agent!2025年值得推荐入坑AI Agent的五大工具框架!
在AI技术飞速发展的今天,AI Agent已经成为了一个热门的研究和应用领域。 无论是企业还是个人开发者,都希望能够借助AI Agent来提升工作效率、优化业务流程或创造全新的用户体验。 然而,从零开始构建一个AI Agent并非易事,幸运的是,市面上有许多优秀的框架可以帮助我们快速入坑。
OpenAI亮剑自主Agent?网友犀利点评:鸡肋,这不Siri干的活吗?反驳:不要低估这项新功能,接管人类的智能体AI已在路上
编辑 | 星璇圣诞节12场直播过后,OpenAI终于在2025开年亮剑了一款新功能! 美东时间1月14日周二,OpenAI宣布推出名为Tasks的测试版新功能,从周二开始,三个不同版本ChatGPT——ChatGPT Plus、Team和Pro的订阅用户将可以试用这个新功能。 Tasks这个功能有什么本领?
MiniMax震撼开源,突破传统Transformer架构,4560亿参数,支持400万长上下文
2025 年,我们可能会看到第一批 AI Agent 加入劳动力大军,并对公司的生产力产生实质性的影响。 ——OpenAI CEO Sam Altman2025 年,每个公司都将拥有 AI 软件工程师 Agent,它们会编写大量代码。 ——Meta CEO Mark Zuckerberg未来,每家公司的 IT 部门都将成为 AI Agent 的 HR 部门。
抢先OpenAI“虚拟员工”!清华复旦斯坦福联手,让Agent接管电脑帮你工作
抢先OpenAI的“Operator”,清华、复旦、斯坦福等研究者联合起来整了个大活~他们提出了一个名为“Eko”的Agent开发框架,开发者只需用简洁的代码和自然语言,就能快速构建可用于生产的“虚拟员工”:Agent可以接管用户的电脑和浏览器,代替人类完成各种任务。 而这个操作,正是之前OpenAI被爆出的“Operator”所能实现的。 爆料称OpenAI将会这个月发布“Operator”,现在直接被截胡了。
【LLM&Agent】PPTAgent:PPT自动生成Agent框架
来看一个PPT生成思路:PPTAgent。 传统的PPT生成方法通常使用端到端的文本生成范式,这种方法仅关注文本内容,忽略了布局设计和PPT结构。 PPTAgent 采用了一种基于编辑的生成范式,解决处理空间关系和设计风格方面的挑战。
揭示LLaMA 3对话能力的奥秘
过去的一年中,大模型技术得到了广泛认可,全行业对大模型的投入也在不断增加。 开源社区涌现了许多优秀的模型和框架,推动了大模型技术的普及和应用。 在这一年的时间里,LLaMA 系列模型也经历了快速的发展,从 LLaMA 2 到 LLaMA 3,我们看到了性能和应用上的显著提升。
OpenAI发布新年目标,Agent智能体或将迎来百模大战
2025年1月1日,OpenAI CEO 奥特曼公布了公司的新年目标,涵盖AGI、智能体、4o升级、模型更好记忆、更长上下文等等。 图片关于智能体,有网友爆料,OpenAI 可能在 1 月份发布一个名为 “operator” 的 Agent,这个 Agent 将具备直接控制电脑的能力。 图片其实24年10月份的时候,Claude 就已经发布了基于 Claude 3.5 Sonnet 多模态大模型,可操作电脑的智能体。
Agent 的基本架构
根据《A survey on large language model based autonomous agents》智能体综述文章,Agent核心是需要具备以下几个核心特性与模块:Profile模块: Profile 模块的目的主要是做Agent角色认定,回答的核心问题有: 我是谁? 我在哪? 我该干什么?
解码通用 AI Agent:七步构建你的智能系统
LLM Agent 高层次概述(图片由原文作者提供)为什么要构建通用 Agent? 因为这是一个很好的工具,可以为我们的目标使用场景提供原型,并为设计我们自己的定制 Agent 架构奠定基础。 在我们继续深入之前,先快速介绍一下 LLM Agent。
2025年,AI Agent还会是风口吗?11个问题揭秘智能体技术发展全貌
2024年,AI智能体技术无疑是科技界的焦点。 通过对来自100多个国家的3400名开发者进行深入调查,Langbase公司近日发布的一项报告揭示了智能体开发中的关键问题。 这项调查的受访者中,有46%是企业领导层,26%是工程师。
NeurIPS 2024 | LLM智能体真能模拟人类行为吗?答案有了
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践
在本篇文章中,我们将深入探讨腾讯大语言模型在多个业务场景中的应用,特别是如何通过前沿技术提升模型的智能化与用户体验。 首先介绍腾讯大模型的广泛应用场景,如内容生成、智能客服和角色扮演等,并详细解析 RAG(Retrieval-Augmented Generation)技术及其在实际业务中的创新应用,特别是在文档生成和问答系统中的优势。 此外,文章还将探讨 GraphRAG 在角色扮演场景中的应用,如何结合知识图谱优化复杂的知识推理。
AI Agent重塑微服务治理
1.项目背景传统场景下,软件的研发主要依靠人,需求沟通、开发、测试、部署等阶段都需要大量人力投入。 大模型优秀的代码生成和一定的思维链推理能力,能够激发微服务研发、运维等环节“智能涌现”,重塑软件研发全生命周期。 商业产品包含效果广告(搜索广告,信息流广告)和展示广告(品牌广告,开屏广告)两大类广告产品,以及基木鱼和观星盘、电商等营销工具。
浅析面向场景的大模型应用框架选择
从demo到产品之间存在着鸿沟,大模型应用也是如此。 在工程实践的时候,产品/服务提供的功能与性能及成本之间存在着大量的权衡,面向场景来选择大模型的应用框架,则是一种具体的权衡方法。 例如,什么时候使用Agent?
AI在《我的世界》PK盖楼,新旧Claude差距过于明显,网友:审美也是智力的一种
测评大模型Agent能力,从未如此直观。 新旧两版Claude 3.5 Sonnet在《我的世界》里PK盖楼,差距不要太明显,引来大量围观。 图片如果让AI不断迭代,甚至能盖出一片建筑群。
Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”
继Anthropic之后,OpenAI也要接管人类电脑了? ! 就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator(操作员)”,为用户自动执行任务。
LLM-R:基于RAG和层次化Agent落地案例解析
在这个由智能设备主导的时代,维护工作的重要性愈发凸显,几乎成了生产活动的守护神。 想象一下,当一台精密的机器在深夜突发故障,而维护手册却像天书一样难以理解,这时,交互式电子技术手册(IETMs)就像一束温暖的灯塔,指引着维护人员安全渡过难关。 面对从图形用户界面(GUIs)到自然语言用户界面(LUIs)的转变,以及复杂逻辑关系的梳理,传统的IETMs显得有些力不从心。
Agent不是被卡住了,其实在思考
在与用户进行自然对话时,智能体承担着两大核心任务:一是流畅的对话交流,二是精准的推理与规划。 智能体必须整合所有可用信息以作出回应,同时确保其行为始终围绕既定目标展开。 基于人类“快速思考”和“慢速思考”的认知系统灵感,丹尼尔·卡尼曼提出了一个全新的架构Talker-Reasoner,旨在模拟人类的这两种思维模式。