观点 | 《AIGC实战派》特约嘉宾
2024,大模型开始走出“不落地”的樊笼,接受“市场老大哥”的捶打与教育。跟2023年不同的是,云厂商、大模型厂商、算力厂商、大模型六小龙、新一代的AI应用创客,独立开发者,一时间群雄并起,都在为新的增长机会放手一搏,蔚为壮观。
一个有意思的现象是,虽然2024年大模型的进化依旧是主旋律,但是尤其进入下半年以来,大家讨论“射程”的话题越来越多。谁能更早摘得低垂的果实?如何走出大模型厂商的射程,如何避开互联网大厂的射程,成为了当下业内一众大佬绕不开的问题。
要回答这个问题,不妨换一个角度去思考:一年过去,中国土壤之下的大模型究竟长出了那些新形态?
搞清楚大模型行业落地现状之后,测算不同行业的射程也就迎刃而解。为此我们特别策划了“2024,中国大模型落地者们”的深度报道以供参考,希望能帮到诸君。
1.大厂内部:舍弃与业务无关的部分,别想上来就颠覆
以百度、字节、华为、阿里、腾讯等为代表的大厂,一方面重金投入大模型,另一方面同样也不会错过用大模型改造自己内部的良机。
垂域模型、RAG、Agent、AIGC是2024大厂们发力最为明显的几个方向。但回归到互联网一代的企业,不同的业务土壤,往往会造就不同的重点与取舍。
“RAG 和 Agent是今年落地大模型的两个重要技术方向。我们舍弃了其他与自身业务场景无关的部分,比如说AIGC、垂直领域大模型等,保证聚焦于这两个技术方向上。” 快手高级技术专家欧迪佐在2024 WOT大会上分享道。
同样是出于业务需求的考虑,去哪儿旅行技术总监郑吉敏则果断确定了视频生成的方向,并强调了以赋能现有业务作为终点。“我们关注AI在实际业务中的应用。AIGC已具备生成视频的能力,且我们的业务对此有相应的需求。因此,我们首先确定了生成视频的场景。”
格外让人注意的是,58同城则快速作出了一项更为宏大的决定:构建本地生活垂类大模型灵犀。在58同城TEG-AI Lab大语言模型算法负责人孙启明看来,通用大模型+提示不会代替一切,应用方需要结合自身业务场景,微调出自己的大模型。
“为了支持58整个服务链条的在线化、数字化,58同城AI Lab构建了模型领先、敏捷易用的AI平台,以助力AI应用在其内部四大业务线的快速落地。”
当然,体量更大的头部企业如阿里、腾讯、百度、京东等,由于庞大繁多的业务线,往往会多点开花。但不难发现,其中一个重要的特点是,这些大厂都在推出AI生产力的工具类平台,比如阿里推出了AI辅助编程工具通义灵码,百度除了推出类似工具快码外、也推出一站式视频创作工具度加,京东推出了面向电商的商家智能助手等等。
找准了切入场景和技术方向之后,真正的挑战才浮现出来。
首先,降低成本几乎是所有技术负责人要考虑解决的问题。京东算法总监韩艾指出,大模型作为一种生产力,企业更关注的是能否真正为企业带来好的性价比,并且可控风险。
百度内容生态大模型架构技术负责人张宝玉分享了自己在大模型降本心得时提到:“成本优化的核心在于如何更好地利用单位算力,确保计算资源被用于最有效的地方。”
张宝玉指出有两个关键的优化方向:一方面,并非所有场景都需要大尺寸或最复杂的模型,许多场景可以通过较小的模型满足需求,从而避免过高的成本。另一方面,还需要从工程角度出发考虑如何更高效地利用计算资源。例如,通过优化算法和计算策略,提高单位算力的利用率。
在企业内部落地大模型,除了成本,更大的难度则在于AI-First理念的渗透。腾讯CSIG技术总监黄闻欣,提到“现在企业内部的AI渗入度并没有我们预期的那么深,一个很重要的原因是,互联网行业的分工往往不够明确,人员往往需要身兼多职,导致流程缺失。这种现状使得数据难以持续性地高质量输出,进而导致AI难以有效介入。
华为在AI实践方面做得比较早,并且内部确立了AI First的思维范式,部门和团队都要去思考“all in AI”这件事情,去思考在自己的业务领域上要怎么去做,如何用 AI Native 的技术和方法来重构业务、重塑流程;同时,华为内部形成了用于指导AI Native实践的“五阶八步十二检查点”方法论。
最后,大模型的不确定性也是令无数技术、产品人员为之头疼的难题。“原来的业务,第一次用14B的模型做实验之后发现效果比之前的更差,但用了72B的模型之后,发现效果得到了显著地提升。”阿里通义灵码产品技术负责人陈鑫感慨:“打造AI产品,大家或多或少有种炼丹的感觉,具备高度的不确定性。”
快手高级技术专家欧迪佐同样表示了这一点:“我们在做大模型驱动的应用研发时候,必然面临着不确定,效果永远不会达到100%。必须要匹配相应的评测中心,以保证你的系统是可控的、单调的达到效果的提升。”
综合考虑上面这些因素,整体上看,大厂对于大模型能力的上线是比较审慎推进的,往往会采取逐步替换某些环节而非一开始就全面AI化的方法,这样可以让用户更容易接受,并逐步建立对AI产品的信任。
正如京东集团算法总监韩艾所说:大模型是一种新技术,但并不意味着之前的“三板斧”可以丢掉。不管是workflow还是agent,AB测试、灰度发布、全流程埋点监控指标、用户体验优化等等都依旧是要做的功课。这些措施是确保模型上线后能够稳定运行的关键。
韩艾提出,在推进大模型上线和AI化的过程中,不要急于颠覆整个架构,而是先从一些关键点入手,逐步引入大模型的功能。结合传统方法和新模型的优势,通过全流程监控和用户反馈来持续改进产品,不断去优化用户体验。
2.当大模型转向行业:小步快跑,技术与产品的互相弥补
大模型落地不易,但经过2024年的钻研和摸索,新的技术已然在千行百业中生根发芽。
行业大模型的本质是富有针对性的解决方案。相关数据显示,当前60%的企业通过垂类大模型实现AI的落地,其中,金融、政务、影视游戏业的大模型渗透率较高,电信、电子商务领域的技术相对成熟。
一般来说,模型的渗透率与行业过往的信息化基础息息相关。而技术的相对成熟度,则取决于业务对模型能力的要求:越是教育、医疗这样需要高度个性化服务的领域,对AI能力的要求越接近AGI级别,才能真正带来生产力的革命性跃升。
在教育领域,受教学场景复杂性和高要求的影响,技术的成熟进程仍处于初级阶段。51Talk技术副总裁蔡林提到,AI尚难胜任“1对1真人外教”这一场景——几乎需要AGI水平,但新技术对教育行业的颠覆性影响毋庸置疑。因此,这条赛道的玩家在全力拥抱新技术:推出矩阵式AI应用,小步快跑;同时软硬结合,围绕业务场景开发单词笔等智能硬件。
在医疗领域,大模型的潜力不可小觑。然而,由于医疗数据的隐私保护要求极为严格,加之不同医院间的数据格式不统一,模型厂商如何获取高质量数据,成为突破发展的关键。今年9月,百川智能以儿科为切入点,与北京儿童医院达成合作,进行了“一大四小”的尝试:四个场景模型「居家、社区、医院、智控」。百川CEO王小川这样解读合作的长期意义,“我们认为有机会在3年内打造出具有三甲医院主治医师水平的AI儿科医生,相当于造出了100万个主治医师,足以覆盖全国乡一级的诊所。”
相较而言,在用AI做「锤子」的行业,往往更先一步摘取到大模型落地带来的果实。
在文旅领域,AI作为效率工具,成为获得竞争力的一个关键。中旅国际科技创新负责人龚梦溪提到,AI可以纵深的结合到景区搜索、咨询、预订等场景中,重塑整个行业的流量入口。无独有偶,去哪儿旅行技术总监郑吉敏也分享,他们将国际酒店的宣传视频制作AI化以后,酒店的定制视频覆盖率大幅提升,视频上线后效果相对提升6%。
在金融行业,数据信息化的扎实“地基”,让大模型的落地之路更加通畅。然而,金融业固有的风险厌恶,使得技术的演进更为谨慎。展望下一步,恒生电子首席科学家白硕提到,要从技术导向的「容易实现场景」转向业务导向的「刚需场景」。
从以上典型行业的实践来看,AI落地的核心动力来源于业务刚需,而模型能力的上限则决定了AI当前能够为哪些场景赋能。
除了模型能力的限制外,用户对新技术的接受度也是AI落地不可忽视的重要因素。以AI社交为例,Soul AI产品负责人程兆华提到,用户面对形象可爱的虚拟客服时,对AI幻觉的容忍度会显著提升。他指出,在技术能力难以完全满足需求的情况下,从产品层面优化体验,以弥补技术的短板,是一个可行的解题思路。
总结来说,AI在行业中的落地依赖模型能力,但更需要结合对业务需求的深刻理解以及对用户体验的细致打磨。AI的落地必须有明确的目的导向——这需要从对AI的精准认知和长期的实践积累中来。
3.不惧大厂的新一代创客:走出大模型和大厂的射程
2024年,AI领域的新创业者们达成了一个共识:不要做OpenAI会做的事情。
不可否认,通用大模型玩家正随着时间推移愈发强大,这意味着它们的触角将持续侵蚀更多的领域。以OpenAI为例,从4o到o1的模型迭代,到推出SearchGPT和写作工具Canvas,每一次更新的背后,都有无数创业项目被迫停下脚步。
软积木CEO刘海峰提到,值得AI创业者投入的项目大致可以分为两类:大模型做不到的事情,或者大模型能做到但成本极高的事情。
AI领域的创业者必须对技术趋势保持足够的敏锐度。MetaGPT联合创始人徐宗泽曾分享过,他们的团队如何从现有产品的不足中找到突破口。他表示:我们创建MetaGPT的理由很“简单粗暴”——因为LangChain远远不够好,而海外用户对多智能体框架有着较高的需求。在MetaGPT中,我们支持多种智能体角色的定义和配置,覆盖软件开发项目的各个阶段,例如产品经理、架构师、工程师等等。
这种精准的定位,果然为产品赢得了市场。据他分享,许多用户自发地在公司内部宣传了MetaGPT,为产品带来了可观的初始流量。
如果说,独到的眼光和果断的判断是AI创业者的敲门砖,那么坚韧的勇气则是他们闯关的关键。因为选择了AI创业,就意味着时刻与风险同行。
正如王小川所言:“创业公司需要在大厂的射程之外寻找发展空间。如果一个公司被看得特别明白,那就不是一个创业公司了。”
刘海峰也提到,即使有再正确的判断,AI创业依然充满不确定性,但正是不确定性孕育了新的机会。
4.AI编程产品,“我们实际在做两件事”
AI编程赛道是AI应用领域最早、也是独角兽最集中的方向之一。国内大模型厂商都试图从编程场景找到LLM落地的切入口。
不过与传统编程产品不同的是,这一轮AI编程工具天然就暗存着“民主化编程”的愿景,即不仅是提高开发人员的生产效率,更要让普通用户也能参与到软件创造中来。
百度Comate架构师徐晓强在考虑Comate产品的发展时,表达了“纵横”两个方向的期望。“首先,我们希望能够扩展它,以覆盖更多的研发场景,甚至于应用到非研发场景中,从而帮助各种不同的角色在开发和软件工程协同工作中提升效率。其次,我也希望Comate能在垂直在开发领域中,为开发中的需求分析提供更深入的支持。帮助大家在使用过程中能够更容易上手,快速地达到熟练水平,获得更好的成果。”
对于现在扎堆涌现的AI编程类产品,究竟进化到怎样的程度了?
商汤科技Copilot技术应用负责人张涛认为,如果不考虑现在模型能力的限制,可以说趋于成熟了。张涛看来,对于AI编程产品而言,实际上大家现在在做这两件事情:第一,克服现在大模型的若干个缺点,第二,激发大模型更多的思考能力。
但对于克服大模型的缺点方面,“业内还没有行业标准的成熟状态,大家还是在摸索。”比如在抑制大模型幻觉方面,虽然有不少方法如prompt engineering、SFT、RAG等,可能路径是清晰的,但在实际的技术栈上还没有形成真正的共识。针对不同的场景,大家会采用一些不同的方式。”
此外,徐晓强指出目前大模型在信息的深入理解、多模态信息处理及创新能力方面仍有着巨大的短板。
另外对于“AI会取代程序员”的质疑,这些身在其中的产品打造者都不约而同的表示,现在的AI辅助编程工具代替不了开发者,目的是为了增强人的能力,让机器与人更好地协作。
通义灵码产品技术负责人陈鑫解释道:“因为我们现在太多的企业需求,其实还没有得到满足。我们现在要做的就是先把这些需求一点点脚踏实地地去满足,最终去实现一个AI产品,帮助开发者去解放生产力,从而更多聚焦于创新。”
值得注意的是,AI编程工具更像是大模型落地初始场景,基于它,阿里、百度、商汤等大模型厂商纷纷已经将其复制扩展到更多非程序员的白领办公场景中,随着大模型能力的进化,相信2025将会迎来新品类的爆发。
5.为什么大家集体押注智能体
整个AI圈正疯狂加码智能体。有人断言,2025年将成为智能体元年。
这种集体押注并非偶然,背后的逻辑清晰可见。一方面,AI的未来不可能止步于聊天对话层面,一个具备行动能力的智能体才是迈向 AGI 的必经之路;另一方面,训练效能的瓶颈已成AI发展的公认困境,而智能体则是开启下一个增长曲线的希望。
Agently.cn创始人、前光年之外开发者生态产品经理莫欣指出,“单靠大模型远远不够”。无论是为现有业务赋能,还是开发垂直领域应用(如语言翻译工具),从模型能力走向实际服务用户的过程中,必须构建一套连接层,智能体正是这个中间环节的核心所在。
从年初至今,多位AI大佬频繁提及智能体对未来生活的深远影响。OpenAI CEO Sam Altman 在年终总结《Reflections》中预言,2025年将迎来首个AI智能体进入工作场景,产生实际经济效益。据报道,OpenAI已在开发代号为“Operator”的智能体产品,有望于1月发布。NVIDIA CEO 黄仁勋 在CES演讲中表示,智能体将成为数字世界的核心角色,能够自主学习、分析,并完成复杂任务,从而彻底改变我们的工作和生活方式。
然而,不是所有人都认为2025年会成为智能体的全面爆发之年。前OpenAI开发者关系负责人、现Gemini API负责人Logan Kilpatrick认为,智能体的规模化落地还需更多时间。他预计,2025年的主题将是AI视觉能力的突破,而大规模智能体应用则可能在12个月后才真正成熟,离触达十亿级用户仍有较大差距。
在具体实现层面,MetaGPT创始人徐宗泽认为,两类智能体更有可能“出圈”:一、融入当下生活方式的智能体,如抖音和快手平台中提升搜索体验的AI助手;二、提升生产力的智能体,尤其是能处理开放式任务和多模态信息的系统,能处理广义上的各种数据类任务。
智能体为何如此炙手可热?核心在于它让AI从“理解”走向“执行”,从“工具”变为“伙伴”。
6.国产芯片的崛起:最大赢家英伟达未必能笑到最后
提到芯片算力,不得不提到AI领域的最大赢家——英伟达。今年2月,英伟达首次突破了2万亿市值,并在4个月后突破了3万亿,曾一度登顶全球市值第一。
除了英伟达,其他厂商也在积极布局,争夺AI芯片的市场份额。AMD计划在2025年推出其最强AI芯片MI355X,与英伟达的Blackwell展开竞争。谷歌则凭借其专为AI大模型设计的TPU芯片取得了显著进展,性能是传统GPU的3到5倍。国内方面,华为推出了7nm工艺的AI芯片昇腾910C,直接对标英伟达的H200,进一步加大在AI领域的竞争力。同时,摩尔线程、燧原科技、壁仞科技等国产芯片厂商纷纷排队IPO,这也反映了资本对国产芯片未来前景的看好。
然而,如今的GPU竞争已不仅仅是硬件的较量。在今年的GTC大会上,黄仁勋更是直接表示:“英伟达是一家软件公司”。有了CUDA这条强大的护城河,即便AMD和国产芯片厂商在内存、计算能力等规格上推出了更强的产品,其实际性能仍难以与英伟达的GPU相媲美。
不过,中昊芯英创始人杨龚轶凡却认为英伟达未必能笑到最后。他指出,GPU并不是AI大模型的终极解决方案。杨龚轶凡认为,GPU并非专为AI而设计,它只是当前环境下的最佳选择。随着AI应用的不断深入与市场的扩展,作为服务工具的芯片将会迎来新的变革,新的现象级芯片将应运而生。他大胆预测,最终,GPU在市场上的份额可能只有两成,而剩下的八成市场将由TPU等新型AI芯片主导。
7.写在2025:大模型落地一番新景象
以上,我们从行业应用、云厂商、大模型创业者、AI产品开发者、国产算力创业者分别展开了各自的落地叙事,并重点对AI编程和Agent两个赛道玩家的进展和挑战做出了解读。令人欣喜的是,大模型通用的能力已经得到了各行业用户普遍接受,因为的确可以给社会带来真实的生产价值,但同时可以看出:成熟的产品却乏善可陈,依旧任重道远。
去年10月,51CTO对500多位企业内部的技术专家在做了一项的大模型行业落地的问卷调研,调研显示超三成的企业已经在企业内部着手部署应用,同时在这些企业当中有39%的企业已经将LLM用于核心业务。然而,综合看各个行业的实际应用体感,大家给出的大模型应用分数差强人意:6.35,只是刚刚及格。
“早期被高估,长期被低估”,大模型也不例外。如果我们把目光投向2025,就会发现一番新的景象——一方面,大模型在多模态、深度推理等方面正在稳步推进,另一方面以Agent为代表的AI原生应用正在被给予商业爆发的厚望;此外,新一代的智能化设备,包括具身机器人、AI眼镜等都已经开始步入到我们的生产生活之中。
首先,以o1为代表的深度推理模型的推出会带来新一轮的想象空间。英诺天使基金合伙人王晟指出,这意味着大模型的范式开始从“经验知识系统”推进到了“推理决策系统”,不止可以打造ChatBot,而是可以真正切入到各个产业,尤其在科学、医疗领域将会得到更有价值的实践落地。
其次,多模态方面更深一步的应用。未来6个月多模态技术的突破将会成为关键的亮点。未来更多产品形态中会引进多模态交互、生成的能力。51Talk技术副总裁蔡林预测,在教育医疗行业有望诞生出杀手级应用。Soul AI产品负责人程兆华认为,特别在传统的视频制消费领域,将会迎来新一轮的AI变革,C端体验上也会迎来多元化的提升。
然后,AI Agent是业界的一个共识。作为基础的大模型技术的应用框架,Agent是大模型基建和人类社会生活和生产结合的关键桥梁。
京东集团算法总监韩艾表示,现有的Agent应用实例已经给行业带来了很大的鼓舞,比如情感陪伴场景和各种平台应用等,不仅提高了用户体验,也带来了很大的企业商用的潜力。
完全有理由相信,2025年,Agent将会在B端和C端全面开花。像素绽放CEO赵充指出,未来Agent不仅会在数量上爆发,同时Agent产品也将会更加贴近用户画像和需求。
再把视角拉向生活,新一代的智能化设备将会大量涌现。随着大模型的小型化,电脑、手机、眼镜、耳机、车载设备等成为模型载体,真正有望实现小算力的智能普惠;另一方面具身智能机器人的兴起,势必也会带动新一轮的生产力变革。
最后值得一提的是,2025年随着国内千卡、万卡集群的逐步成熟,中美大模型之间的差距将会越来越小甚至反超;而在产品层面,中国AI产品也将会深度参与到全球化的竞争之中,继续发挥中国作为世界工厂的优势。
展望2025,大模型落地无疑将会度过一个关键的渡劫期。AI原生应用的打造范式能否成型,Killer App能否涌现,是留待大模型公司和AI应用创客们奋力一搏的关键之战。
鲜花与荆棘同在,荣耀属于“爱拼者”。共勉!提前祝各位新春快乐!
图片