9 月 5 日,外滩大会上,蚂蚁集团大模型应用负责人顾进杰完成了演讲,最后一页 PPT 上的唯一一句话是:让我们一起,推开智能体商业时代的大门。
他在这段演讲中,透露了支付宝的一个重要动作:启动智能体生态共建计划,推出智能体开发平台「百宝箱」。
智能体(AI Agent),在过去两年的大模型之战中,尚被 AI2.0 时代的初创公司视为偏前沿的应用方向,更多考虑的是在技术方面如何提高 Agent 在多轮对话中的鲁棒性。
然而今年在国内,智能体成为了当红炸子鸡,腾讯、字节相继推出了自己的智能体产品。而在支付宝,智能体已经朝前一步,和商业绑在了一起。
重新审视当下大模型的研发、应用环境,也不难发现一件初显端倪的事情:火热的「百模大战」正在逐渐推向智能体创新应用之战。
纵观多家大厂的智能体之路,「开箱即用」的 Agent 开发平台无疑是最大的卖点,但在此之上鲜少有人能够将智能体实现较好的商业模式闭环,一是由于智能体的性能还难达预期,在垂类领域的专业度不够;另一方面也因为没有足够丰富的落地场景,难以在生态中发育。
支付宝也看到了这一点。不过,他们也看到了机会。
作为国内最大的服务型超级 App,支付宝一路从国民电子钱包到数字生活开放平台,承载着无数普通人的生活,也打造了完善的数字服务生态。依托于此,支付宝瞄准了不同于市面上其他家的专业智能体的路线,希望带来互联网式的 AI 服务跃升。
外滩大会上,支付宝推出智能体开发平台「百宝箱」,并启动智能体生态开放计划。依托专业的智能体构建能力,商家机构可0代码、最快 1 分钟创建专属的服务智能体,并一键发布到支付宝小程序、支付宝 App、支小宝 App 等。
一、支付宝智能体的「逆行道」
当下,主流的智能体市场更多地将注意力放在有开发能力的人和组织上,于是不少智能体创作大赛蜂拥而至,意在积累更多的创作者,扩大自己的智能体生态。
可以说,这是一种「自上而下」的生态建设方法,以开发者为主导,通过大量堆起智能体的数量,来对接实际用户的需求。
而支付宝做智能体,却更像一个「自下而上」的模式。
多年以来,支付宝建构起了一套丰富的服务生态,积累了行业引领性的 Knowhow。也正是在这个过程中,支付宝距离市场真正的需求更近,以此为基础从需求方、使用方出发搭建更专业的智能体,再汇聚到上层的支付宝生态中。
开放的生态也成为了支付宝智能体的底色。外滩大会现场,关于支付宝智能体的优势,顾进杰如是阐述道:
一是高效连接服务,智能体可与支付宝支付、搜索、小程序等20多项经营工具和阵地打通,让 AI 连接真实商业服务;
二是多场景分发,可一键发布到支付宝小程序,并通过首页推荐、搜索等渠道触达用户;可通过AI生活管家「支小宝」,以对话交互、AOI (Area of Interest)、智能体广场等方式实现智能唤起;此外,线上支持发布到web应用、浏览器插件,线下也能打通IoT、智能车机等场景,实现多端分发、互联互通;
三是聚焦专业智能体,在出行、政务、餐饮、医疗等重点行业坚持开放,与行业伙伴及专业机构携手共创,向行业提供一系列的智能体行业解决方案。
伴随智能体落地千行百业,服务信息的总量将会指数级增加,服务信息的匹配和分发效率也将极大提升。通过专业智能体的深度连接,蚂蚁正在践行「让 AI 像扫码支付一样便利每个人的生活。」
二、「百宝箱」“宝藏”在哪?
支付宝「百宝箱」作为一个智能体开发平台,有哪些差异化特点?体验感究竟如何?
首先,进入到「百宝箱」基础版的应用广场,不仅能看到其他平台中普遍有的的写诗、规划出行路线的常规应用,更令人眼前一亮的是,也可以看到很多时下流行的、甚至是意想不到的智能体,比如根据前段时间火起来的粘土风图片生成的「粘土风图片转换器」、以及专门负责生成可爱表情包的「萌了吧唧」等。
甚至,如果用户不知道如何输入 prompt 才能做出好用的智能体,还可以通过独特的应用克隆功能,快速复制理想、好用的智能体,真正降低了打造智能体的门槛。
之所以能涌现如此多样、有趣的智能体,是因为「百宝箱」的便捷易用性, 0 代码、不到 1 分钟即可根据需求创建个性化的专属智能体。
目前,「百宝箱」可支持 5 大类智能体应用构建,分别为:对话型、文本型、文生图、图生图、工作流,同时每种类型提供了右侧丰富的模块供参考。
在构建应用时,系统会自动保存,并支持即时调试和问题追踪,让开发过程更简单、反馈更及时。
目前支付宝开放使用的是「百宝箱」基础版,在 C 端能轻松构建有趣应用只是「百宝箱」的冰山一角,其「宝藏」之处远不止于此,更大的优势在于蚂蚁背后多年技术、知识、经验积累,水到渠成地走向专业智能体路线。
以医疗领域为例,支付宝和上海市第一医院联合打造 了Al 就医助理「公济小壹」。为应对医疗领域的业知识的短板,支付宝依托知识图谱、密态计算等技术,打造了大规模专业知识引擎,最终形成「服务与病例知识库」,让大模型具备专家知识水平。此外,蚂蚁「百灵医疗领域大模型」,背后也是支付宝和人民卫生出版社、浙江大学联合构建的全国权威医学专业教材医疗知识图谱。
面对海量数据,智能信息检索能力尤为重要。为了让大模型在推理中可随时「翻阅专业教材」,蚂蚁开发出的能力支持图文混合搜索、多头检索增强生成(Multi-Head RAG)、知识图谱问答(KGQA)等RAG技术,同时支持知识库自动更新,确保信息处于最新状态。
不仅是医疗领域,在文旅行业,蚂蚁集团基于 100+ 文旅集团专有数据、专业场景,训练出行业专家级的文旅大模型;在传媒领域,也与新华传媒深度打造出基于行业专有数据的传媒大模型。
除专业行业数据外,在百宝箱中,用户可以构建属于自己的个性化知识库。新增的文件支持 PDF、TXT、Markdown、Word、Excel 等多种数据格式导入,同时支持语雀链接在线导入。并且,百宝箱的数据智能拆分能力较强,支持Query改写、向量检索、数据召回、结果重排(Rerank)等。
为了提升大模型复杂推理能力,蚂蚁与行业技术专家共创,提出了 FoE 专家级决策框架(Framework of Experts),应用在投资研究智能体「支小助」。它可以会动态学习专家的思考方式,模仿专家的思路进行分析和生成,实现媲美人类专家的金融分析能力。
蚂蚁自身的行业知识积累和信息处理能力固然重要,但百宝箱还能在这一基础上提供第三方 API ,内置百灵、智谱、Kimi、通义千问等多种商业化大模型,用户可以综合考量,选择最佳组合方案。
此外,丰富的插件工具也是「百宝箱」的一大亮点。「百宝箱」智能体官方能提供40+ 插件,70+工具,拓展了智能体能力边界,实现跨平台智能体交互。
更重要的是,支付宝也在推进智能体行业解决方案,比如,在民生行业深度定制集政策咨询、服务咨询、服务推荐办理的智能体。
三、支付宝开放生态的 AI 时代
从 2003 年诞生到今天,支付宝经历了三件大事。
第一件是2005年,支付宝把担保交易与支付接口向全行业开放,正式从淘宝网的一个支付「功能」变成了一个独立的第三方支付平台,而后「走出淘系」,作为一个开放的平台,通过快捷支付、二维码、刷脸等一系列创新支付技术,在近 20 年里服务了超 10 亿用户、8000 万商家。
第二件是 2017 年,支付宝将公测中的小程序面向商家机构进行开放,短短 2 年后,又将主搜热搜榜、首页腰封等六大中心化入口主动向 B 端商户开放,吸引了零售、餐饮等主要行业近九成的商家。400万个小程序,帮支付宝建成了国内第二大商业开放生态。
第三件是2024年,支付宝发布了「百宝箱」和相关的开放计划,标志着支付宝走过了传统互联网、移动互联网两个大时代,正以一个开放的心态向着 AI 时代进发。
创新和开放,始终是支付宝的主旋律。创新之下,支付宝积极求变求新,给增长拉出正向的空间;开放之后,平台距离 B 端商家越近,从而更好地服务 C 端用户,给形成良性的商业循环
同样在今年的外滩大会上,和「百宝箱」一起亮相的,是支付宝的 AI 原生App「支小宝」。相比它的理解、推理能力和它的语音交互能力,「支小宝」最令人激动的,就是它可以与支付宝下面的多种生态完成无缝对接,一句话买咖啡、交话费、查快递……交互简化、体验升级的背后,是「支小宝」与支付宝服务体系的逐步打通。
回头看上一代互联网诸多产品的成功,生态和规模效应是不少巨头登顶的不二法门。新业务和原有业务若是能相互承接、让流量和资源在其上完成流转闭环,就能产生1+1>2的效果。
无论是「支小宝」还是「百宝箱」,背后都有支付宝的支持——从支付、订单到用户鉴权等20多项经营工具。商家想要让 AI 实际为商业产生价值,有支付宝的背书和连通,链路更加直接,投入应用也能更加便捷快速。
而整体大体系打通,「百宝箱」中的智能体可以一键发布到支付宝小程序,商家触达用户天然更加容易;而有「支小宝」作为 AI 时代的又一个超级入口,智能体也可以通过多种渠道被 C 端用户使用起来;在线上,智能体还支持发布到 web 应用、浏览器插件上,而到了线下,IoT、车机等等场景也同样可以成为智能体的舞台,不仅拓宽了智能体的使用场景,更搭建起了一个多端互联的生态,给蚂蚁的智能体发展之路带来了更大的想象空间。