从AIGC到AGI,为什么我们必要更多的“技能信奉派”?

整理 | 伊风采访 | 张晓楠嘉宾 | 巴川、朱雷、肖然作为AIGC运用落地元年,2024开年就抛给我们一些不太好回答的题目:在以探索AGI为长期目标时,我们该坚守技能信奉吗?除了复制外洋GPT-4、Sora这样的成功案例,我们该如何寻求更大发展和突破?即便算力题目得以解决,算法的难题如何跨越?海内企业为什么大都安排多个大模型?为什么并非所有企业都该拥抱AIGC?前不久51CTO全新直播栏目《AIGC实战派》有幸邀请到竞技世界首席数据科学家巴川,元语智能联合创始人兼COO、SuperCLUE社区发起人朱雷以及Tho

整理 | 伊风

采访 | 张晓楠

嘉宾 | 巴川、朱雷、肖然

作为AIGC运用落地元年,2024开年就抛给我们一些不太好回答的题目:

在以探索AGI为长期目标时,我们该坚守技能信奉吗?除了复制外洋GPT-4、Sora这样的成功案例,我们该如何寻求更大发展和突破?即便算力题目得以解决,算法的难题如何跨越?海内企业为什么大都安排多个大模型?为什么并非所有企业都该拥抱AIGC?

前不久51CTO全新直播栏目《AIGC实战派》有幸邀请到竞技世界首席数据科学家巴川,元语智能联合创始人兼COO、SuperCLUE社区发起人朱雷以及Thoughtworks中国区总经理、中关村智联立异联盟秘书长肖然在对谈中回答以上疑问。

一、“技能信奉派”还是“商场信奉派”,只是一时之争

51CTO: 在大模型“技能信奉派”与“商场信奉派”之争中,你们站哪一派?这背后又折射了怎样的一种现实?

巴川:我思考过这个题目,但是没能给出一个非黑即白的答案。就长期而言我倾向于技能信奉派,因为技能进步是推动生产力发展的关键因素,虽然现在AIGC被炒得非常热,但其长期影响力仍然是被低估的。

但在短期内,大模型技能所能产生的影响又被高估了,这种误判算是技能落地和广泛运用的一个必经阶段。短期内,AIGC将不断向各行各业泛化,从这点来看,商场信奉派的观点也很有价值。

朱雷:我是坚定的技能信奉派,就今朝看,我认为技能派的胜算更大,因为推动大规模数据训练和参数量的跃升已经是全球性的技能共识,大家都在“卷”技能、抢人才。

对于商场派的观点,我认为技能必要服务于用户和客户,解决具体的营业题目,这个站位和逻辑也没有题目。然而,在以探索AGI为长期目标时,海内必要一些坚持技能信奉的团队,他们以长期研究和技能突破为目标,将商业化运用作为支持研发和基础架构试错的一种手段。

海内有几家大模型公司我是很看好的,因为他们在技能层面有独到的见解,比如做RAG搜索增强、长文本等等。但他们也没有只做技能,也在各自的技能路线上测验考试了多种运用,如角色扮演、游戏、效率对象等。我觉得正因为他们有技能信奉,所以会在自己的运用上思考的更长远一点。

相反,如果仅从商业化的角度出发,忽视技能的成熟度,这种做法从长期看是特别危险的。我们可以看到,随着AI技能的不断进步,一些早期的AI运用已经失去了竞争力。OpenAI的Sora一旦对外开放,就将“杀死”很多小的AI视频剪辑、自动化生成对象。因此,在AGI的早期阶段,一定要保持技能前瞻性,去做长期的投入和研究。

肖然:在AI技能浪潮中,真正盈利的往往是提供对象的一方,而非单纯追求商场运用的一方。这些对象,如RAG、Raptor等,本质上是技能产品,它们的商场价值在于支持和促进技能立异。

所以,技能的快速发展已经使得所谓的商场化变得不那么重要,因为需求实现的过程已经被极大程度地压缩了。年轻一代,即使没有深厚的计算机背景,也能在短时间内学会构建智能运用。这表明,我们正在进入一个新时代,其中技能和商场之间的界限变得模糊。

从当前的角度来看,技能的重要性更为突出。如果你想创造出大概完成更多任务的智能化产品,这非常依赖于底层基础模型的发展。只有基础模型得到提升,我们才能完成更多、更复杂的任务。

二、如果都是“商场派”逻辑,追上外洋会变得更难

51CTO : 对比外洋,海内大模型会面临哪些不同?你们对海内大模型商场抱有哪些期待?

巴川:从算力角度来看,我们虽然在迎头追赶,但仍然存在差距。芯片核心技能在外洋手里,这间接影响了我们获取最先进硬件的才智;另外,显卡的采购困难和禁售带来的价格飞涨也对我们产生了间接影响。

在算法方面,虽然很多人认为海内外的算法水平没有太大差异,但我们使用的基础框架,如Transformer等,大多还是来自外洋。尽管海内的一些公司也在测验考试开发自己的框架,但离落地运用、甚至成为主流框架还差很多。

在数据方面,我认为海内是有独特优势的。互联网快速发展的一二十年里,我们积累了大量数据,特别是在垂直领域,一旦某个运用推广开来,就大概迅速覆盖数亿用户,这是欧美尤其是欧洲难以做到的。这样的用户基数使得我们大概快速积累用户数据,并在特定垂直领域快速实现运用的落地和迭代。

朱雷:在我看来,海内外在大模型商场上的主要差异体现在发展节奏和目标上。比如OpenAI和谷歌下面的DeepMind,他们的目标更多地集中在实现AGI上。虽然他们也在推进商业化,但视野更为长远,并在安全和基础架构上进行了深入研究和探索。

相比之下,今朝海内更多地在复制外洋的成功案例,如GPT-4和Sora等。不过尽管如此,海内公司融资充足,人才储备也具备一定水平,且具有全球化视野,这有助于我们在数据规模和质量上进行补充。

我认为,海内的期待在于未来五年内能否在基础架构上取得突破,而不是仅仅跟随外洋的技能发展。今朝,海内正在努力追赶GPT-4的水平,同时也有探索非Transformer架构的测验考试。因为Transformer架构本身存在局限性,预测下一个token,并不是真实世界的逻辑,因此这个架构并不能做出世界模型。

肖然:即便算力题目得到缓解,我们仍然面临着代际算法差异的挑战。今朝,海内的大模型技能多在复制和追赶外洋的成就,并测验考试做成功产品的理解和复现。但真的去做一些研究,比如Transform架构的根本突破在哪里,海内相关的讨论又太少,我们必要更多的声音和研究来探讨和实现下一代的算法革新。   

在运用层面,海内的大模型运用多集中在企业内部,而外洋的模型精度更高,To C产品更为丰富。这背后的核心原因在于底层模型的成熟度差异。海内企业被迫去做模型微调和基础算力设施,通过这些运用手段,提升模型在特定领域的精度。

我乐观估计,海内的算力题目正在得到国家层面的有效解决。但同时,我担心的是,当我们解决了算力和模型精度题目后,国际上大概出现新的算法突破,而科技巨头会效仿OpenAI选择闭源,届时我们就会被拉大算法的代际差距。

三、AI太重要了,企业多模型安排“留后路”

51CTO: 具体到海内企业安排和采用大模型,你们发现有哪些值得关注的特点,或者一些有趣的现象?这背后的深层原因是什么?          

朱雷:我观察到海内企业往往会同时安排多个大模型。在与各行各业的企业接触中,包括央企和上市公司,我发现他们会同时采购两三家公司提供的大模型,并结合一些开源模型进行微调。这些企业会利用向量数据库和增强对象,使得基于大模型构建的运用背后有多个模型支撑。

这种现象背后的原因大概有几个方面。首先,AI大模型今朝被认为非常重要,因此企业愿意投入较多预算。随着开源才智的提升,大模型的安排利润已经降低,尽管后续的数据清洗和模型推理大概利润较高,但采购模型本身已经变得相对便宜。

其次,当前大模型的才智还比较有限,特别是在特定行业的运用上。这就导致企业在运用大模型时会安排多个模型,以期望不同模型在不同方面的才智可以互补。   

最后,AI的重要性不言而喻,但企业对于海内大模型的发展前景还不太确定,因此他们倾向于测验考试多个模型,以观望哪个模型大概更好地发展,以免选错后对企业造成较大损失。

肖然:从利润来看,尽管模型本身的利润已经降低,但与之配套的运维利润却相对较高。企业在微调大模型时必要投入额外的资源来管理知识库和优化整个数据处理流程,这导致了必要额外雇佣专业人员来维护和优化这些模型。而安排的多模型,每个基础模型相对小一些,微调后能达到专事专用的效果。

此外,大型组织更有大概安排自有模型,而小型组织则不太大概考虑这一选项。在大型企业中,各个部门大概会根据自己的需求独立安排和使用不同的模型。这种分散的安排方式虽然短期内看似效率不高,但实际上有助于保护组织结构拥有一定的自由空间,允许各部门根据自己的营业需求灵活调整。

最后,企业特别希望大模型的才智大概与现有的对象链相结合,而不是完全替换现有的工作流程。例如,企业大概更愿意在现有的办公平台上集成模型来辅助工作,比如钉钉AI这样的设计,而不是迁移到一个全新的系统中去。

51CTO:企业的模型安排、AIGC运用等等由哪个部门负责?

肖然:数字化才智强的公司大概会成立专门的人工智能中心,来负责模型和算力的相关工作,而运用则由具体实践这些对象的相关部门负责。

在为企业安排AI才智时,负责牵头的角色往往是CIO或CTO。然而,随着人工智能战略的重要性日益增加,一些企业包括我们自己公司开始设立CAO(Chief AI Officer)来专门负责人工智能战略的制定和执行。从长远来看,或许越来越多的企业会设置类似CAO的岗位。   

巴川:我们公司算是一个典型的中型互联网游戏公司,我们有一个技能中台,其中包括大数据、机器学习和深度学习等方向。技能中台自然成为了大模型运用的主要推动者。同时,我们的营业部门,比如说美术部门、销售部门,也在自下而上的拥抱技能变革。

我们也在测验考试多个模型,因为今朝还不清楚哪个模型更合适。在这个过程中,我们会间接调用接口,也会对大模型进行微调。这其中涉及到利润和产出比的题目,营业部门会根据营业场景间接评估性价比,决定是否值得投入。

然而,技能部门在推动大模型运用时,大概会发现性价比并不高,这时我们的步伐就会受到限制。一些大模型,比如马斯克最近发布的Grok开源大模型,虽然下载不难,但能运行起来的机器必要200万利润,这就必要我们仔细考虑场景的适用性和利润效益,虽然我们自己也很好奇效果,但如何能说服管理者批预算是个难题。

对于中小公司来说,通用大模型的利润大概是难以承受的,大概必要大厂或国家意志整合资源才能实现。此外,我们也在思考,专注于特定营业场景的大模型是否会让我们离AGI越来越远。

四、“新质生产力”AI+,已经敲开了技能变革的门

51CTO:随着大模型采购利润下降以及垂类模型的成熟,所有企业都应该拥抱大模型吗?AIGC能在未来成为所有企业的刚需吗?   

巴川:随着利润不断下降,我认为中小企业完全有大概开始使用大模型。在形式上,他们大概会更多地选择间接调用现有的大模型接口,利用其才智来降本增效,并在特定的商场营业场景中创造价值。而大型企业,如百度、阿里,大概会开发自己的模型,以保持技能壁垒和商场竞争力。

从国家层面来看,整合资源开发具有自主知识产权的大模型也是非常重要的,这不仅是技能追求,也是社会责任的体现。必须有人去开发大模型这样的基础设施。

肖然:AIGC就属于国家提出的“新质生产力”这个概念,随着技能的进步,未来的情况将与现在大不相同,尽管大概不会有像iPhone那样的颠覆性时刻,但人工智能的运用仍会让人眼前一亮。

从这个角度来看,并不是所有企业都必要自己安排模型。随着题目逐渐被解决,特别是走向AGI时,企业大概不再必要自己拥有模型。正如黄仁勋所说,“打败你的不是AI,而是使用AI的人”。

朱雷:虽然大模型和AI技能的利润正在下降,但今朝大多数企业的核心营业流程还不能依赖于大模型。今朝,大模型的运用主要集中在相对边缘的营业上,利润的降低并不间接等同于可以落地实施。真正要影响企业核心营业的落地,除了利润,还必要模型在准确性和推理速度上达到可用的水平,而今朝这个阶段还有相当大的差距。

五、“卖铲子”是门好生意,引领运用新趋势是“天花板”

51CTO:如何判断一款AIGC运用是否优秀呢?有什么标准吗?   

巴川:我会首先考虑合规性,这对于公司的营业至关重要;其次,AIGC生成的内容是否有C端用户愿意买单,这是一个间接且重要的评判标准;此外,我希望大概看到运用中有些特色,大概把相关的数据积累用起来,形成一定的壁垒。

肖然:我认为这个时代值得做的生意就是“卖铲子”。使用AIGC技能提供工程化支持的对象和服务——是一个有前景的事情。间接做大模型的门槛太高了,不适合一般的玩家入场。无论AIGC运用是面向C端还是B端,都必要将这些技能工程化、规模化,让组织能在内部享受到AI技能带来的便利。

如果涉及到间接面向消费者的运用,我会在合规的基础上增加对高频场景替代的考量。我喜欢那些大概改变用户习惯、增加用户粘性的运用。

朱雷:从长远来看,我认为AIGC运用在交互方面还有很大的立异空间。尽管今朝市面上已有一些成熟的交互模式,如智能音箱和流程机器人,但未来大概会有新的交互模式出现,特别是适合AGI的新型交互模式,我期待在海内看到这样的立异。          

——活动推荐——

“AIGC立异中国行”评选由51CTO发起,联合业内生成式AI领域顶级专家、投资人权威发布,并经企业一线实践者、广大开发者公开投票,旨在发掘和表彰在生成式AI领域杰出实践企业、产品方案和个人,推动生成式AI技能的立异探索和AIGC更广泛的落地实践。

评选分为⾃主报名、公开评选、结果公布三个阶段,通过⽤户投票、专家评审团打分形式,产⽣2024年度AIGC立异先锋者案例、2024年度AIGC立异实践案例、2024年度⽣成式AI立异产品⽅案、2024年度⽣成式AI影响⼒⼈物等奖项。

从AIGC到AGI,为什么我们必要更多的“技能信奉派”?

给TA打赏
共{{data.count}}人
人已打赏
工程

曾爆火的 InstantID又有了新玩法:格调化图象生成,已开源

2024-4-15 9:12:00

工程

一阶优化算法启迪,北大林宙辰团队提出具备万有切近亲近本质的神经收集架构的设想步骤

2024-4-16 11:17:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索