AI在线 AI在线

从键盘到语音,从辅助到决策:实在 Agent 如何重新定义人机协作?

作者:新闻助手
2025-03-21 03:06
2025年3月20日,人工智能领军企业实在智能在第八次新品发布会上正式推出行业通用智能体——实在 Agent,标志着AI技术从实验室迈向产业落地的关键突破。 在这场以“自主感知环境、规划路径、操作万物”为主题的科技盛典中,实在Agent通过真实场景演绎,首次验证了数字员工全流程接管复杂办公任务的可行性——从多模态指令解析、跨系统数据调用到端到端任务闭环,全程无需人工干预。 重构人机协作 通用智能体的破局之战自2025年3月初Manus引发市场关注后,通用Agent正式进入技术转型深水区。

2025年3月20日,人工智能领军企业实在智能在第八次新品发布会上正式推出行业通用智能体——实在 Agent,标志着AI技术从实验室迈向产业落地的关键突破。

在这场以“自主感知环境、规划路径、操作万物”为主题的科技盛典中,实在Agent通过真实场景演绎,首次验证了数字员工全流程接管复杂办公任务的可行性——从多模态指令解析、跨系统数据调用到端到端任务闭环,全程无需人工干预。

重构人机协作 通用智能体的破局之战

自2025年3月初Manus引发市场关注后,通用Agent正式进入技术转型深水区。支持者将其视为"智能体经济"的基石,认为将重塑生产协作范式;质疑派则认为工程化实践尚未成熟,现阶段仍属"有限场景解决方案"。

当前学界将通用Agent重新界定为"具备跨模态环境感知、动态目标拆解与多工具协同执行能力的智能系统"。相较于专用Agent,通用Agent不依赖预设规则,而是通过自主感知、决策和执行,动态适应环境变化并解决多样化问题。

从当前技术实现层面分析,市面智能体产品主要采用两种架构模式:端到端的集成方案或大模型外挂API接口的混合架构。这类解决方案在处理复杂任务时存在明显的效率瓶颈——多模态模型协同需要经历数据格式转换、接口协议适配、跨平台调用等中间环节,导致任务响应时间普遍超过30分钟。

并且,在传统封闭的C/S架构(如OA系统)下,跨系统操作链路存在天然断点,容易出现服务调用超时、数据解析错误等异常情况,难以实现跨平台系统的无缝协同。

不过,在实在智能发布会现场,工作人员演示了一段智能体操作金蝶云系统的视频引发热议:只需输入“下载金蝶云‘云朵便利店’的销售订单列表”,实在Agent便自动完成登录、查询、下载等5个步骤,全程无需人工干预。

技术底座揭秘 三大创新架构构建护城河

发布会上实在智能合伙人兼核心算法部负责人欧阳小刚,他所阐述了实在 Agent 的三大核心技术体系:

一、类人级推理能力:依托自研 TARS 大模型,实在 Agent 在步骤拆解准确率上超越 GPT-4 和 DeepSeek,中文理解能力达 SOTA 水平,并实现全栈国产化适配,支持英伟达、昇腾及国产自主架构的训练与部署。

二、无限链接能力:通过自研流程自动化引擎和多模态模型 TARS-VL,实在 Agent 支持操作网页、软件、接口、文档等任意数字化工具。在 GUI 元素理解测试中,TARS-VL 准确率较 GPT-4o 高出 4%,领先开源模型 10%,并在 mind2web 和 screenspot 等数据集上保持绝对优势。

三、场景适应能力:运用自动仿真技术,实在 Agent 将特定软件的构建周期缩短至 3-5 天,同时推出多参数模型(67B 高配版与 7B 轻量版)适配端侧与云侧部署,并提供软硬件一体化解决方案,涵盖华为昇腾、惠普 Z 系列等一体机产品。

从键盘到语音,从辅助到决策:实在 Agent 如何重新定义人机协作?

实在智能创始人兼CEO孙林君表示:“实在智能通过三大核心技术突破,可为企业智能化转型提供可落地、可进化、可扩展的全栈式解决方案。”

在技术攻坚与创新层面,实在智能还引入“可变形矩形卷积和卷积核分配”等创新性技术理念,并以此为基础成功训练出多个辅助检测模型。

在针对各类屏幕GUI元素理解和定位能力的测试集中,TARS-VL表现不俗。例如,在两个开源的benchmark数据集——mind2web和screenspot上进行测试:

●    在 mind2web 数据集上,TARS-VL 在 Task、Domain 和 Web 三个场景上的元素匹配准确率,比 GPT-4o、Ominiparser、Claude 等模型高出 10%;

●    在 screenspot 数据集上,TARS-VL 的元素匹配准确率也保持遥遥领先。

从键盘到语音,从辅助到决策:实在 Agent 如何重新定义人机协作?

Benchmark数据集是人工智能领域用于客观评估模型或系统性能的标准化数据集,其核心作用类似于教育领域的“标准化考试题库”。

产品化突破 企业级智能体的落地范式

顶尖的技术,只有搭载于出色的产品之上,才能充分释放其价值。

那么,究竟何种智能体产品,能让用户毫无门槛地轻松上手,实现开箱即用,使用户能够直接向智能体清晰表述诉求,进而由智能体代替用户操作那些复杂晦涩、难以驾驭的系统呢?

在发布会上,实在智能对实在Agent智能体的创新特质与产品优势展开了细致入微的解读。数据猿将其内容梳理如下:

低门槛交互:零配置启动客户端,通过快捷键一键唤起,支持语音、文本、文件拖拽三种交互方式,模糊指令可自动拆解为任务步骤;

透明化执行:实时显示操作日志与进度条,支持动态干预与并行任务处理,保障用户对任务的全程掌控;

开放创作平台:通过 “智能体画布” 和预训练技能库,用户可快速开发专属 AI 智能体,存量 RPA 流程可一键迁移升级,实现 RPA 与 AI 的深度融合。

对于科技公司而言,GTM是新产品的商业化验证。实在Agent智能体,不仅是个人助理,更是企业级智能体解决方案——企业大脑。

企业只需将文档、数据、系统沉淀到实在智能体平台,即可实现资产数据化。如此一来,企业内部的每一位成员,都能借助实在Agent,便捷调用企业知识库以及已构建完成的业务自动化流程,从而形成企业独有的 “中央处理器”。

在实在智能发布会的演示环节中可以看到,实在 Agent 不仅接入了自家的 TARS 大模型,还整合了 DeepSeek、智谱 AI、GPT、千问等一众主流大模型。企业能够依据不同模型在各自擅长领域的优势,灵活进行切换使用。

发布会临近尾声时,实在智能展示了实在Agent在手机、车机等移动设备端的实用全新功能,其表现同样令人拍案叫绝。

战略布局的双轮驱动

除了电脑端软件,发布会还聚焦了实在 Agent 在移动场景的创新。

基于原子技能架构和模型驱动决策技术,手机端智能体实现了流程市场、任务调度、云端控制等功能,用户通过语音指令即可操作手机软件,真正做到 “你说,手机做”。

未来,实在智能计划将智能体拓展至智能家居、VR 眼镜等设备,打造全方位覆盖生活场景的智能助理。

CEO孙林君向数据猿透露:“实在智能的愿景,是让每一个人、每一家企业都能拥有专属的数字员工,并且无需依赖 API,就能实现跨系统协作。”

其一,持续大力投入Agent的研发工作。他坦言,当下实在Agent尽管已经能够在复杂场景中实现自主规划与执行任务,但仍存在大量尚未商业验证的领域,还需要投入相当的时间进行深度打磨与持续迭代。

其二,全力推进出海战略。实在智能在过去两年间,已陆续在日本、马来西亚设立子公司,成功积累了数十家海外客户,成绩颇为亮眼。下一步,实在智能将积极与更多国际企业展开合作,促进产品的深度融合,借此实现“借船出海”。

放眼更为长远的未来,CEO孙林君期望实在Agent能够成为数字员工的标志性代表,如同人们提及手机,便会自然而然地联想到华为、苹果、小米那般。

在小编看来,实在智能的这次突破在于解决了通用智能体的“操作性智能”难题——传统AI多在感知与认知层面突破,真正打通了从意图理解到物理操作的"最后一公里"。这标志着AI Agent从辅助工具进化为生产力主体,对企业数字化转型具有里程碑意义。

正如CEO孙林君所言:“AI 不是人类的替代者,而是放大人类智慧的‘放大镜’,它将赋能企业实现高质量增长,推动社会向更智能的未来迈进。”

相关标签:

相关资讯

实在智能完成近2亿元C轮融资,领跑中国Agent商业化落地

近日,实在智能宣布完成近2亿元C轮融资。本轮由金泰富资本和安吉智慧谷共同领投、安吉两山国创跟投。作为行业领先的人工智能科技公司和AI准独角兽,实在智能致力于通过自研AGI大模型,结合超自动化技术,领跑人机协同时代。近年来,公司不断加大研发投入,加快产品迭代和技术创新。现已拥有60余项发明专利和数百项软件著作权,全面支持国产化“信创”生态,助力2000余家央企、国企、500强、上市公司及政府机构数字化转型升级,全面应用部署各类“数字员工”(智能软件机器人)。同时,实在智能已分别在日本和马来西亚设立子公司,全面布局东南
12/19/2023 2:22:00 PM
新闻助手

调查:超72% 的企业选择 AI 工具时最看重易用性

根据最近的一项 CIO 报告,企业在人工智能(AI)领域的投资高达2.5亿美元,尽管在证明投资回报率(ROI)方面面临挑战。 商业领袖们正努力提高生产力,但新技术的集成往往需要重构现有应用、更新流程并激励员工学习,以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查,以揭示 AI 采用的现实情况,探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。
3/18/2025 10:02:00 AM
AI在线

降低门槛,全平台应用,昇腾还会手把手地教你如何用AI

机器之心报道作者:泽南如何才能做到 AI 应用一次开发,全场景部署?昇腾给出了答案。如今的大多数 AI 应用程序都需要跑在多种类型的处理器上,覆盖数十个版本的操作系统,运行在从端侧到云计算集群的各种设备上。这样复杂的环境,对软件的适应性和模型的可裁剪、可伸缩性提出了极高要求。AI 开源框架也在顺应这股潮流,昇腾发布的 CANN、MindSpore、MindX 等工具,可以让开发者实现「统一端边云,全端自动部署」,开启了机器学习开发的新时代,一直被人们寄予厚望。昇腾的 AI 全栈软件平台。其中,基础架构作为连接硬件与
3/19/2021 11:23:00 AM
机器之心