腾讯科技讯 12月14日,以“智能涌现 数开万物”为中心的腾讯科技Hi Tech Day暨2023数字开物大会在北京国家会议中心召开,腾讯科技邀请知名院士、知名经济学家、知名大学教授、研究院院长、家产大咖、互联网大厂高管、知名科技领域头部企业高管、家产数字化转型企业高管等共话AI趋势。
大会开场,腾讯新闻运营总经理黄晨霞发表主办方致辞。她回顾了2023年新手艺的涌现开展,并提出如何让这些新手艺打开真正的家产改革之门,为人类社会创造更多的福祉的思考。黄晨霞透露表现,在使用落地的路上,我们要厘清大模型的基础还有哪些卡点、AI与家产结合的能够性以及AI产品的潜在形式。
在本次大会上,与会嘉宾们首先通过中心报告,从算力、数据、治理这几项AI基础设施议题出发,对中国大模型家产的地基现状和现在目标展开了深入剖析与分享。
报告中心覆盖算力瓶颈的解决路径、数据共享的基本框架、数据治理的核心卡点。在大会的第二篇章,业界人士、投资人及专家深入大模型落地的过程,拆解改革发生的形式和家产落地的具体方法,通过三场圆桌论坛,嘉宾们围绕AI对家产和用户带来的种种潜在影响和能够性各抒己见。
无限能够:今天涌现的信息会通往无数的现在
“如何让这些今年新涌现出的手艺打开真正的家产改革之门,进一步为人类社会创造更多的福祉?这个课题潜藏着太多能够性和模糊之处。” 这正是这次课题探讨的契机,即通过嘉宾的讨论去厘清2023年爆发的新手艺在现在的能够性。
腾讯新闻运营总经理黄晨霞觉得,2023年的手艺进步“不同寻常”,可以称为新一轮产业革命的起点。针对当下展现出无穷潜力的AI手艺,她提出了三个课题:“通往AGI的路上,我们还需要迈过哪些障碍?“、”大模型将如何嵌入行业?“以及“AI所带来的前所未有的能力将带来什么产品上的能够型”。
针对大家面对新手艺时的矛盾心态,黄晨霞觉得焦虑可以理解,但不应导向贸然行动,而是应该更深入地进行思考。对于复杂课题的解法,黄晨霞透露表现,虽然我们面对的着诸多的挑战,但在讨论这些课题的过程中,涌现的信息会通往无数的现在。
2023年对于科技家产和人类现在的特殊意义,科智集团董事长、数字开物创始人黄超在主办方中心报告中也透露表现,2023年是全球数字科技领域重要的改革之年,也是中国数字经济笃定前行的提速之年。在这样的科技革新背景之下,数字化正在成为中国经济社会一种改革性力量。
AI算力:中国已经有了能和A100对标的GPU生产能力
针对AI开展的硬件基石:算力的构建,国资委科技强国智库专家委员会主任、中国科学院教授廖奇为发表“中国芯赋能智能算力,助力数字经济高质量开展”的中心报告,分享了目前国内解决算力瓶颈的最新实践和进展。
进入AI时代,GPU和广义AI芯片逐渐取代CPU成为算力开展的核心。在中美大国博弈、芯片出口限制层层加码的环境下,中国如何在GPU的研发和制造方面破局? 廖奇为觉得,广义的算力才决定了一个国家现在真正的竞争实力。
除了硅基芯片以外,中科院目前还有几个方向正在推进,包括量子芯片、仿生神经网络芯片的设计。但廖奇为也强调称,中国已经有了自己的GPU设计生产能力,并进行了家产化的布局。经过其团队的努力,已经突破自主RPP架构手艺难关。其团队“通过14纳米常规的GPU工艺生产出的芯片,已经可以与NVIDIA的A100对标。作为一种低能耗、低成本、高集成的解决方案,该GPU跟NVIDIA同类芯片相比,边缘计算甚至可以达到1/27的能耗比。”廖奇为还透露表现,这一GPU芯片的第二代正在进一步研发,很快就会流片。
数据:只有安全流通的数据才有价值
数据是AI开展的另一个重要基石。近日微软发布的最新小模型Phi-2就通过优化数据供给,使其能力提升至比它大25倍的大模型同等的水平。而中文数据在大模型开展中的利用还远未达到充分。
对此,中国人民大学交叉科学研究院院长、教育部长江学者、特聘教授杨东教授发表了中心报告“从数据大国到数据强国:数据要素在经济开展中的角色”,试图厘清中国数据使用方面的诸多卡点,并竖起了向数据强国转换的道标。
针对大模型为何没有在中国最早出现的课题,杨东指出,过去移动互联网时代,中国存在严重的数据风险主义。为什么大模型不能及早地产生和开展?主要原因不在于算力,也不在于算法,在于数据没有互联互通。
为了解决数据垄断,开放共享度低的课题,杨东提出,要建立基于三权的数据收益分配机制。 针对目前来自用户的数据确权困难课题,杨东将其比喻为数字时代的“土改”,要让数据变成“能够获得价值的利益公平合理地分配给多元的流通主体”。这样无论是个人、企业还是政府,都可以在数据价值创造过程中做出贡献,获得收益分配。针对数据的重要性,杨东透露表现“十年后的今天,数据要素层能够会成为我们的主体和根本的现在经济开展的核心驱动力量”。
数据流通的基础是数据安全。只有在保障隐私和版权的基础上,产生于每个用户的数据才能被放心地使用和商业化。
对此,中国信息通信研究院云大所大数据与区块链部主任姜春宇在此次大会上发表了中心为“AI数据治理开展思考”的报告。
针对安全和隐私的风险、生成内容、合成内容如何管理、大模型的幻觉课题这些数据使用中的核心风险点,姜春宇透露表现需要构建全生命周期的数据安全与隐私的保护能力,覆盖整个训练过程。
针对幻觉课题,“不同的领域真实性、准确性可以有些规则约束,内容生成要求、监测机制和真实性评估,有害性课题可以通过内容识别和过滤自动检测+人工审核”,但目前国内这些领域都处于空白阶段,亟需被完善。
据姜春宇透露表现,信通院正在撰写一本人工智能数据治理的白皮书,目的就是建立这一领域的方法和规则体系。
除了安全方面的提升,姜春宇还强调了数据质量的价值:没有好的数据,模型的能力肯定会有所欠缺。目前的现状是国内IT开展路径是先污染后治理,所以质量普遍偏差,需要有数据质量相关的评价维度变化,提升数据质量的工艺和工程能力需要加强。
AI+家产:渐进式创新在B端落地,倾覆式创新在C端大放异彩
在解决大模型基础课题的同时,家产方面的使用和实践已经被提上日程。在这一新手艺所展现出的强大能够性之时,整个家产将如何被改变能够是当下一般企业最为关注的课题。对此,竹间智能总裁兼COO孙彬在“AI大语言模型爆发的家产改革”的发言中,分享了他作为AI改革一线企业家的见解。
孙彬透露表现,大语言模型把生产力的三要素解决了,因此它一定会在To B端带来被使用的生产力。这一生产力后续的承载模式就是以大语言模型为基础的数字员工,它是成本和效率完美的结合体。因为大模型能为企业提效,谁也无法阻挡这一趋势。孙彬觉得“作为甲方和行业从业者都应该记住,不能变成大模型的业务不是好业务。”
对于企业使用AI大模型,孙彬建议采用外部购买和联合建设的方式,如果不是行业头部企业,没有自己足够的IT开发实力的企业,不建议去做自研开发。对于大语言模型现在的开展,孙彬觉得,它会变成大家的工作依赖、能力依赖和生活依赖,就像现在手机成为大家的依赖一样。
由AI能够搅乱自己的工作和生活引发“AI焦虑症”在今年从企业家到职员间都开始流行,焦虑的根本就在于害怕被新手艺倾覆。对此,昆仑万维董事长、CEO方汉先生,英诺天使基金合伙人王晟以及腾讯科技《AI现在指北》栏目主理人郭晓静就“生成式AI的爆发会带来倾覆式的创新还是渐进性迭代?”这个课题展开了讨论。
对于AI带来的倾覆,王晟透露表现,一个新的手艺范式从产生到变得成熟有其时间点,明年能够是使用的元年。但今年绝对不是这个时间点,今年是Infra(基础设施)之年。他进一步说明,AI和家产的结合并非刚刚开始,大模型只是拓宽了融合能够,但在业务模式未改变的情况下,这种进步依然会是渐进的。
对此,方汉补充说:“渐进式创新会在B端落地比较快,倾覆式创新是在C端大放异彩。”他觉得AI这波浪潮一定会从小企业中诞生新的C端巨头。
对于最近广受讨论的AI Native(AI原生)这个概念,两位嘉宾也表达了非常明确的观点。方汉觉得“AI Native完全是一个伪命题。“王晟则觉得AI就是一个工具,也是过去使用的延伸,和Native关联有限。
AI+产业:并非所有企业都需要,落地要靠专家模型
对于很多走得更快的公司而言,AI早已是一个非常熟悉的概念,大模型的出现更多的,是带来了AI能力的跃迁和形式的变化。因此面对这次AI浪潮,他们能够已经有了比较明确的路线和思考。但对于制造业来讲,大模型这个概念更加陌生和遥远。上一波数字化改革还没有消化完全,就要面对新的手艺范式转变。是否要变,何时要变是制造业从业者面对的第一个难题。
虽然AI带来的数字化转型趋势已经非常明显,但作为企业应该如何落地,行业中目前主流的解决方案是什么?思谋科技SmartMore联合创始人刘枢作为AI在产业实践中实践者,通过“IndustryGPT:产业大模型的实践与思考”的中心报告,提供了他的解决方案。
刘枢透露表现,通用大模型虽然已经很好,但面对专业领域、专业知识还是相对匮乏的,能力也是需要提升的。因此在真正产业场景落地的时候,还需要对应的模型,也就是IndustyGPT。
解决专业知识的方式就是提供只有行业才有的专业数据。在训练IndustryGPT的时候,刘枢的团队收集了大概500亿Tokens的原始数据,相当于10万个博士的阅读量。除此之外,为了应对产业具体的场景,他们精简了上下文长度,让模型的输出更符合操作的要求。
为让业界更了解AI与制造业融合的前沿观点,中国产业互联网研究院智能所副所长顾维玺、北京信息化和产业化融合服务联盟理事长闫同柱、中工互联科技集团董事长智振与腾讯云智能制造首席专家邴金友带来一场精彩的中心对话:“大模型是制造业数字化转型方向的必选项吗?”
闫同柱透露表现,对不同的企业大模型的意义也有所不同。高端制造业积极拥抱是因为高端制造业本身对知识的要求比较密集,大模型起到的是优化作用,有比较大的价值。但传统制造业来说,它的数据量不大,而大模型的门槛相对比较高,投入产出比并不那么明确。
腾讯云智能制造首席专家邴金友觉得,产业企业在接纳大模型方面存在两个课题,一是成本课题,数据散,模型训练成本高;二是幻觉课题,产业里面要么是经济产出,需要100%正确,大模型难以达成。
针对邴金友提到大模型的幻觉课题,中工互联科技集团董事长智振透露表现,现在产业大模型已经能够做到的专家系统100%无害化,90%以上的准确度。具有落地的基础。
虽然现阶段大模型并不能适用所有产业场景,但其擅长的场景已经有了很多落地的实例。邴金友透露表现,在客服,流程管理、人力资源、营销、内容产出和设计方面大模型的使用已经有了广泛的实践。
对于大模型对产业的意义,闫同柱还提出了另一个角度,他透露表现中国工的产业知识和产业数据在很多地方都因为人才离职被遗失了,并没有转化为企业的知识资产,所以很多创新都是在重复造轮子,但大模型的出现可以更有效的将经验数据转化为可用的知识资产。
AI+产品:AI会解决关键节点课题,图像处理类使用能够出西安首个爆款
自从大模型诞生之始,GPT会替代搜索,文生图软件将重塑摄影绘画软件等预测就一直不绝于耳。但现在看到的更多的是融合而非倾覆,大模型和各个使用场景的关系更多变成了互相融合,融合也是一种改变,对于想寻找机会的创业者来讲,抓住被AI改变最大的场景,就能够寻到一片新的蓝海。
腾讯科技创作者胡俊、昆仲资本投资副总裁陈希、清华大学交叉信息学院助理教授袁洋、木牛机器人CEO郭林与腾讯科技创作者、互联网基金公司AI业务负责人张仁杰在对“哪些使用场景最先被AI改变”的讨论中开始了一场AI机遇的富矿勘察。
陈希先分析了AI的家产图景,他把AI分成了三层:基础大模型层、中间层和使用层,基础大模型层是壁垒最高的,使用层是最有开展机会的。
使用层有哪些机遇?袁洋觉得,大模型更擅长system1的思维方式,但现在通过对大模型思维流程的调整,更复杂的领域,如医疗、教育和法律也有被覆盖的能够。这些领域的价值是很高的。郭林觉得,在场景落地中AI解决不了所有课题,但会解决关键节点课题。
与过往的产品不同,大模型的场景覆盖更广。陈希透露表现,大模型时代产品的特点就是没有办法特别明确地说To C还是To B,它既能让C端用户玩起来,也能够在B端产生价值。同时,这也是张仁杰在试用过市面上比较火的AI产品后的感受。在Killer App的现状和现在方面,他觉得ChatGPT在海外已经算是Killerapp了,但国内还没有。这主要是因为国内普通用户的使用场景很难跟AI结合。对于现在,他觉得普通C端用户对图像处理类使用有更强需求,能够会出现第一个爆款。
深度学习之父辛顿曾说过:创造真正智能机器的旅程是漫长而富有挑战性的,但这是一段值得走的旅程。同样,使用智能机器的旅程也并非一朝一夕能够走完,但拥抱新手艺是我们超越现在和自己,迈向现在的值得走的旅程。路也许还模糊不清,但先行者走的多了,就有了路。腾讯科技Hi Tech Day,邀请你一起通往无数个能够的现在。