由于通用大模型的泛化特性,它很难在落地行业场景中精准满足用户需求。让通用大模型进修行业知识和行业语料成为行业大模型,再进一步进修业务知识和专业畛域工具演进为场景大模型,是当前大模型落地使用的关键路径。未来,AI Agent 的产物形式被越来越多地认为是大模型的进化方向,是赋能各行各业的高效生产力工具。
通用大模型性能如何保障?如何架构行业垂直大模型?AI Agent 落地前景?数智上海 2023 峰会上,最具代表性的产学一线嘉宾围绕大模型演进过程,带来了前沿分享。
以「智能革新赋能产业数字化转型」为主题,数智上海 2023 峰会已圆满落幕。其中,聚焦引领新一轮科技浪潮的关键 AI 手艺,峰会特别举办了「数智说」生成式人工智能革新使用赋能千行百业论坛。
复旦大学计算机科学手艺学院教授、博士生导师,中国中文信息学会理事张奇,商汤科技副总裁张少霆,科大讯飞 AI 研究院副院长盛志超,革新奇智手艺副总裁郭江亮等进行了主题演讲。圆桌环节,达观数据首席战略官刘江贤主持,张奇、中科曙光智能计算产物部总经理杜夏威、实在智能创始人、CEO 孙林君,澜码科技创始人、CEO 周健、上海人工智能产业基金投研合伙人刘经国交流了观点。
嘉宾们分享了生成式 AI 最新手艺进展,以及其在调理、教育、产业等重要畛域落地的关键经验,探讨了 AI Agent 的落地前景。
复旦 NLP 实验室核心成员张奇
摒弃神化与拟人化大模型
ChatGPT 能够高效生成更符合人类价值观的内容,背后的关键手艺正是鉴于人类反馈的强化进修(RLHF)。然而受限于实验设计困难、试错成本巨大等多重因素,RLHF 的稳定训练仍然是一个难题。
复旦 NLP 团队今年发布多项 RLHF 相关工作成果。复旦大学计算机科学手艺学院教授、博士生导师,中国中文信息学会理事张奇结合最新研究成果带来「AI 赋能百业,大模型助力行业数智化升级」主题分享。
此次,张奇教授总结了 RLHF 大模型训练各阶段关键问题。预训练阶段,基础大言语模型训练中的「工程秘密」大部分已经公开,但仍需做好「预训练数据构成和数量、预训练数据对模型各类任务效果影响、言语与知识的关系」等基础问题研究,否则大模型训练仍是「炼丹」。指令微调阶段,千亿模型的 SFT 模型训练数据需求不到百万量级,难点在于建立高质量训练语料。
OpenAI 此前公布的 InstructGPT 手艺报告中将近端策略优化(PPO)算法作为 RLHF 阶段的强化进修算法,但未开源训练手艺细节。FudanNLP 团队持续投入 RLHF 完整工作流程及 PPO 算法研究,确定了使得 PPO 算法在大模型人类对齐方面行之有效的关键因素,并进一步总结出在大模型上训练更稳定的 PPO-max 算法。张奇教授展示了 PPO-max 算法效果并表示近期会发布安全伦理相关报告。
「摒弃神化与拟人化大模型,它们只是统计进修的精彩舞者。」张奇教授认为目前大模型表现还是可以在统计机器进修范畴下进行解释,仍是「匹配」而非「理解」。此外,现阶段通用大言语模型直接落地产业存在一定困难,未来落地方向需要结合场景,「do something people want」,不只是写诗、做论文,还应助力行业提升生产力。
商汤科技副总裁张少霆
打造「商汤调理大模型工厂」
随着大模型开始进入产业导入期,大模型的垂直畛域使用成为主线。从医学科研、药物研发、智慧诊断到医院管理等,产学研正联手推动高质量调理畛域基础模型建立及产物落地。AI 成为每个医生的诊断帮忙、每个人的健康帮忙的调理场景新范式正在显现。
商汤科技副总裁张少霆带来了「鉴于 AI 大模型打造未来调理场景新范式」主题演讲。
人的疾病有几万种,存在大量长尾问题,大模型、基础模型的能力会有助于快速开发调理长尾问题解决方案。鉴于此,商汤在调理畛域进行了丰富的大模型落地使用探索。
商汤与行业伙伴合作,推出了调理大言语模型、调理影像大模型、生信大模型等多模态基础模型群,覆盖CT、MRI、超声、内镜、病理、医学文本、生信数据等广泛调理数据模态。借助商汤大装置的超大算力和调理基础模型群的坚实基础,商汤能够化身「调理大模型工厂」,帮助调理机构针对下游临床任务高效训练模型。该模式突破了调理长尾问题数据样本少、标注难度高的瓶颈,实现了针对不同任务的小样本、弱标注、高效率的训练,满足不同调理机构个性化、多样化的临床诊断需求。
在调理多模态基础模型群赋能下,商汤自主研发的SenseCare®智慧诊断平台搭载 20 余个 AI 辅助诊断模块,可提供覆盖全身多部位、多病种、多模态数据的 AI 辅助分析,赋能诊-疗-愈全流程。其中,SenseCare®肝脏智能手术规划系统可以快速完成肝内及腹部多器官的精准三维重建,并支持多种切除术式智能规划,将原先 1~2 小时的手术规划时间缩短至 3~5 分钟,大幅提升了术前规划效率。该产物已落地瑞金、新华等医院,为很多高难度手术提供了保障。
针对调理大言语模型的使用场景探索,商汤研发了调理健康大言语模型「大医」,内嵌智能自诊、诊后随访管理、智慧病历、影像报告结构化等 13 个预设场景,可高效辅助医生诊断与患者服务。「大医」支持提示工程自定义、长程记忆存取和医学知识库查询总结等个性化功能,可帮助调理健康产业链上下游机构打造专属调理健康大模型,推动行业全方位数智化转型。目前「大医」已落地郑州大学第一附属医院、瑞金医院、新华医院等医院,赋能用药咨询、患者服务、辅助决策等多元场景。
科大讯飞 AI 研究院副院长盛志超
共迎「认知大模型+教育」大时代
认知大模型的「智能涌现」将带来解决人类刚需的全新机遇。改变信息分发获取模式、革新内容生产模式、全自然交互完成任务、实现专家级的虚拟帮忙、颠覆传统手工编程方式、成为科研工作的加速器,这些大模型能力催生的变革正带来多种教育场景的颠覆式革新。
科大讯飞 AI 研究院副院长盛志超分享了星火认知大模型赋能教育的实践探索。
ChatGPT 发布后,科大讯飞正式启动「1+N」认知大模型专项攻关,其中「1」是通用认知智能大模型,「N」是大模型在教育、办公、汽车、人机交互等各个畛域落地,目前一系列产物已经实际使用。
鉴于星火认知大模型能力开发的多种使用,已经支撑了不同场景教学工作:
• 教学帮忙,星火教师帮忙使用能够辅助教案设计、习题情境改造、作文批改等;
• 进修帮忙,「讯飞语伴」面向各学段学生提供个性化口语陪伴老师,另外鉴于科普中国优质内容资源建立科普大模型;
• 编程帮忙,面向信息科技教学场景,辅助教师高效编程教学,辅导学生自主编程与进修(Python);
• 心理辅导帮忙,建立心理健康专有模型,具备多模态情感识别能力、共情表达能力、寻因式提问能力、个性化心理指导能力四大核心能力。
从实现效能提升、加速模式革新到支撑育人变革,大模型带来了教育畛域机遇,同时在专业性、教学秩序、协同素养提升等方面带来挑战。盛志超院长认为,应该以乐观的态度看待大模型与教育结合带来多种场景的颠覆式革新。
革新奇智手艺副总裁郭江亮
为产业大模型落地提供全链路 AI 能力
大模型的出现给智能制造带来广阔想象空间,但是产业畛域涉及全生产流程、供应链各个环节以及 ERP、MES、PLC 等,提供端到端解决方案并非易事。
革新奇智手艺副总裁郭江亮进行了「大模型助力新型产业化:重构产业生产力与生产关系」主题演讲,分享了企业在产业大模型落地方面的前沿工作。
全面拥抱大模型手艺是企业提升竞争力必由之路,而对于产业畛域的企业来说,垂直大模型不需要唯参数论,大模型落地性价比是关键因素。通过更好地使用大模型手艺,以更低成本、更好产物,满足产业畛域里面中长尾、细小场景需求是当务之急。
革新奇智推出的以 AInno-15B 为核心的「奇智孔明 AInnoGC 产业大模型」,建立在开源通用大模型基础上,专注产业知识的生成、问答以及产业自动化任务的编排。从效果看,150 亿模型参数是最优效果,同时部署时对算力要求较低。
革新奇智建立起由「MMOC 人工智能手艺平台」和「AInnoGC 产业大模型手艺平台」组成的手艺双塔布局。其中,MMOC 平台提供传统 AI 能力,端到端支持 AI 解决方案革新、研发和交付,产业大模型支持文本、视觉、多模态内容生成,驱动 AI 2.0 使用和解决方案的开发与落地。
郭江亮表示,革新奇智将AI手艺双塔平台化,组合研发打造解决方案,未来还将持续聚焦产业细分畛域,助力打造更多专精特新企业。
产学投共论大模型下一站
AI Agent 会是大模型未来发展方向吗?
受大言语模型浪潮推动,AI Agent 相关研究快速发展。两者的区别在于,大模型与人类之间的交互是鉴于 prompt 实现的,用户 prompt 是否清晰明确会影响大模型回答的效果;而仅需给定 AI Agent 一个目标,它就能够针对目标独立思考并做出行动。因此,AI Agent 的产物形式被认为将广泛使用于各行业组织数字化实体打造进程。
AI Agent 会是大模型的未来发展方向吗?以此为题,学术、产业、投资界多位嘉宾进行了深入交流。
达观数据首席战略官刘江贤主持了本次对话,指出 Agent 不是一个科研的具象,而是一个落地使用场景的具象,大模型发展不仅要从供给侧发力,更要听需求侧真实声音,「Agent 像是产、学、研之间交汇的基点」。
「我们坚定地看好 Agent,并且认为 Agent 会大爆发。2024 年会是 Agent 元年。」实在智能创始人、CEO 孙林君认为,首先,当前处在从人工过渡到人机协同、再到机器完全自主完成的过程中,要对 Agent 有合理的预期,不能把 Agent 和 AGI 画等号,认为它无所不能,这是不符合实际的预期;其次,有针对性的进行人机协同的产物设计才是现实思路,设计出来的产物才是高可用的,Agent 的实用性才会更强。
「Agent 未来落地,真正有话语权是那些业务场景的用户。」中科曙光智能计算产物部总经理杜夏威认为,要从业务侧出发看 Agent 的落地形式和方向,围绕着业务需要的 Agent,判断对模型规模、算力形式的需求。
当前大多数 RPA 厂商,都在以生成式 AI 补充 RPA 为中心的自动化流程,或者鉴于 AI Agent 重新建立超自动化产物。张奇教授认为这将是大模型 B 端落地的关键方式,传统 RPA 建立业务流程自动化存在脆弱性,大言语模型的引入这意味着这些机器人不会停在新数据导致的「死胡同」,而是可以从错误中「进修」并调整其一系列任务。
信息化是数字化的前提,数字化是数智化的前提。澜码科技创始人、CEO 周健认为,AI Agent 落地过程首先要将专家知识通过各类信息系统实现数字化;其次是鉴于对话式UI,建立机器适应人的新的人机交互模式;第三步则是通过这种新的交互模式,反复使用和打磨专家知识,最终实现畛域知识的循环沉淀。
Agent 产物将会越来越多,未来将有望成为 AI 使用层的基本架构,包括 to C、to B 产物等。上海人工智能产业基金投研合伙人刘经国认为,从投资角度看,国内 to B、垂类使用仍是 AI Agent 容易率先落地的方向。