技术、生态和产业齐头并进,AI发展进入「深度学习+」阶段

自人类进入工业社会以来,每次工业革命的背后都离不开核心技术的驱动,正如机械技术、电气技术和信息技术之于前三次工业革命。如今在第四次工业革命进程中,AI 正成为核心驱动力,而深度学习是关键核心技术。

深度学习具有很强的通用性,它呈现出的标准化、自动化和模块化特征,逐渐推动 AI 进入工业大生产阶段。作为快速便捷构建、训练和部署 AI 应用的基石,深度学习平台的重要性更是日益凸显,通过降低 AI 应用门槛,将 AI 技术传递给千行百业,推动 AI 应用大规模落地。随着 AI 与产业结合的不断深入,规模化的 AI 大生产已然形成。

在深度学习蓬勃发展的过去十余载,业界持续发力。作为国内 AI 领域的领头雁,百度一直以来深耕深度学习技术,推出自研产业级深度学习开源开放平台飞桨,集核心框架、产业级模型库、开发套件与工具组件于一体。飞桨核心框架更与全球两大主流深度学习框架 TensorFlow、PyTorch 形成三足鼎立。依托飞桨平台,百度围绕技术、生态和产业做大做深,构建了全方位、多层次的深度学习发展格局。

随着规模化 AI 大生产的形成,百度敏锐观察到 AI 的技术创新和产业发展正进入一个新的阶段。1 月 10 日,在百度 Create AI 开发者大会上,百度 CTO 王海峰提出「深度学习 +」概念,在 AI 领域的探索迈出全新的一步。类似「互联网 +」,利用信息通信技术以及互联网平台,让互联网与传统行业进行深度融合。进入「深度学习 +」阶段,业界不仅要注重深度学习技术的丰富与增强,还要着眼于整合打通上下游生态以及加强对各行各业的深度赋能。

图片

具体来讲,「深度学习 +」要从三个角度来理解,分别是技术、生态和产业。技术角度为深度学习 + 知识,知识增强的深度学习是 AI 技术进一步发展的重要方向;生态角度为深度学习 + 上下游生态伙伴,芯片、框架、模型及应用构成深度学习的良性生态;产业角度为深度学习 + 千行百业,利用深度学习技术变革生产方式,加速产业智能化升级。

可以看到,「深度学习 +」覆盖了从技术融合、生态构建以及产业联动的方方面面,为实现更全面、更深入的深度学习驱动型 AI 技术创新和产业发展打好了基础。在会上,百度 CTO 王海峰表示,「深度学习 + 是创新发展新引擎,驱动技术发展和产业增长,让创新创造大有可为。

图片

进入「深度学习 +」阶段,AI 行业已经做好了准备

其实,「深度学习 +」阶段并不是一蹴而就的,它的到来有着深厚的历史积淀。

首先,在 AI 领域,自 2012 年以 AlexNet 为代表的开创性研究出现以来,深度学习方法逐渐成为主流,推动 AI 应用进入爆发期。并且,以卷积神经网络、循环神经网络和对抗生成网络为代表的一系列深度学习算法持续在自然语言处理、计算机视觉等关键领域取得巨大进展。

在这期间,AI 的融合创新越来越丰富,跨模态多技术融合、软硬一体融合以及技术与场景融合趋势愈加明显。深度学习技术的研发、调整和落地过程中充分考虑到了大规模丰富知识的加入,如知识图谱、领域知识、行业知识等,知识驱动成为深度学习的重要特征之一。如此一来,我们能够更好、更准确地将深度学习技术与应用场景融合,达到更好的应用效果。

因此,从整个行业的阶段发展来看,深度学习 + 知识是 AI 技术进一步发展的重要方向。知识凝炼了人类认识和改造世界的智慧,让机器从海量数据和大规模知识中融合学习,可以使得知识增强的深度学习效果更好、效率更高、可解释性更强。

其次,生态建设是在技术融合和落地过程中联动各方的关键步骤,对 AI 尤其深度学习技术而言亦是如此。过去多年,AI 行业不断围绕深度学习平台拓展开源生态,与硬件厂商合作搞好芯片的适配与优化,加强与各类企业、开发者的联系,覆盖更多行业领域。此外产学研各方携手培养 AI 人才,为深度学习技术的普及提供坚实的人才支撑。至此深度学习的生态雏形已经形成。

为了建设更持久的生态,深度学习技术要继续联动上下游生态伙伴,通过芯片、框架、模型和应用构成深度学习的良性生态

芯片层,支持深度学习训练、推理的丰富芯片与深度学习框架软硬联合优化,更好的性能和更高的效率提供了强大算力;在框架层,深度学习框架支持便捷开发、高效训练和多端多平台推理部署,提升模型研发效率及效果;在模型层,提供契合产业需求的深度学习模型,通过支持低或零代码的开发套件和工具组件降低应用门槛;在应用层,深度学习技术与场景融合创新,加速产业智能化升级,催生新业态新模式,实现生产力跃升。

最后,产业赋能是深度学习技术实现自身价值的最终手段,这点也在其发展进程中得到验证。凭借强大的能力,深度学习技术已经在自然语言处理、视觉识别、推荐引擎、翻译软件、虚拟助手、机器人、自动驾驶以及更多其他领域实现了应用落地,深层次地改变了人们的生产生活方式。

未来,深度学习技术要深入到千行百业,实现降本增效,创新产品和业务,加速产业智能化进程,努力实现高质量增长。

可以看到,过去整个 AI 行业一步步地向着「深度学习 +」这一阶段迈进,并通过深度学习平台和大模型技术加速了这一进程。随着技术、生态和产业方面的铺垫,AI 技术创新和产业发展进入新阶段变得水到渠成。

内部持续积累沉淀,百度为「深度学习 +」蓄势已久

对于百度而言,「深度学习 +」早已在内部生根发芽、茁壮成长。百度当前的深度学习布局催生了这一概念,尤其是飞桨以及依托飞桨打造的文心产业级知识增强大模型,它们为百度推动 AI 技术创新和产业发展的新阶段提供了信心和底气。

用知识学习增强大模型能力、拓展大模型落地

在百度,飞桨深度学习平台 + 文心大模型已经成为核心发展模式,并以此构筑了产业智能化基座。此次技术角度的 “深度学习 + 知识” 在文心大模型的一系列发展中得到实践验证,并收到了显著的成效。2019 年开始,百度深耕预训练模型研发,先后发布知识增强文心(ERNIE)系列模型。文心系列模型基于持续学习的语义理解框架,从大规模知识和海量数据中融合学习,效率更高,效果更好。2021 年 12 月,ERNIE 3.0 升级为全球首个知识增强千亿大模型鹏城 - 百度・文心,同时,产业级知识增强大模型文心全景图亮相。文心大模型在历次升级中持续加强知识增强,使之成为与产业级并列的两大核心特色之一。

图片

文心大模型全景图。

我们以文心 ERNIE 为例,其框架不断从不同数据和知识中学习并构建新任务。通过从不同任务中持续学习,大模型能力持续提升,拥有更多知识。ERNIE3.0 首次在百亿级预训练模型中引入大规模知识图谱,从大规模知识图谱和海量无结构数据中学习,使大模型具备更强的知识记忆和推理能力。相较于没有知识增强的大模型,文心大模型的学习效率更高,在实体问答、知识预测、可控文本生成等多个场景上具有更好的效果

图片

文心 ERNIE 能够准确地完成知识问答任务。

知识增强使得包括文心 ERNIE 在内的文心大模型具备跨模态、跨语言的深度语义理解与生成能力。此外,在百度文心大模型体系中,行业大模型是非常重要的特色,成为推动大模型产业化落地和促进行业智能化升级的重要手段。通过行业知识增强,文心行业大模型充分挖掘和建模特定行业场景中的大量行业数据和知识,同时引入行业实际业务积累的特有知识,增强对行业应用的适配性,取得很好的效果。

图片

百度文心行业大模型。

围绕飞桨平台凝聚各方智慧、构建良性生态

百度飞桨生态建设经过多年的发展,已经形成向下、向上两条路径,构筑了全面的生态发展格局,实现了芯片、框架、模型和应用层面的高效衔接与互通。

图片

飞桨全景图。

深度学习平台向下,飞桨与广大硬件生态伙伴合作,通过技术共研开拓更多软硬件协同产品和功能,形成合作共赢的生态。目前已有超过 30 家硬件厂商与飞桨深度融合优化,国内外主流芯片基本都已适配飞桨。飞桨在 2022 年携手硬件合作伙伴开启硬件生态共创计划,并联合 12 家硬件伙伴推出飞桨生态发行版。

向上,飞桨着力广泛的应用生态。一是企业生态,通过 AI 快车道等多种方式让前沿技术深入业务场景,有针对性地为中小和大型企业生态伙伴提供多样化技术能力和服务。二是教育生态,联合高校构建产教融合的 AI 人才培养体系。三是开源生态,与业界优秀的开源社区和开源项目合作,联合开发者和开源社区共建深度学习开源生态。

深度学习平台 + 大模型构筑产业智能化基座

一直以来,百度都高度重视产业赋能,并在飞桨深度学习平台和文心大模型的发展中践行着这一点。

一方面,飞桨始终坚定平台的产业级特性,贴近产业实践。通过飞桨平台,企业可以快速便捷地开发适合自身业务场景的优化算法,在实践中更早地部署 AI 能力。另一方面,文心大模型尤其行业大模型寻求与企业场景需求的契合,加速 AI 落地。不断壮大的文心行业大模型持续扩大覆盖行业的范围,在产业化落地过程中使大模型真正赋能千行百业。

我们以 “深度学习 + 交通” 融合创新的智能应用 —— 智能交通中的「智能调度系统」为例,通过图神经网络与强化学习技术,实现整个区域交通流量的全局调控,最大限度减少各方向绿灯的空放,减缓道路拥堵,节省出行时间。这套系统已在北京亦庄、长沙、保定等地上线。

图片

路口信号灯配时智能优化。图源:Apollo 智能驾驶

「深度学习 +」未来可期,各方要百尺竿头更进一步

毋庸置疑,在「深度学习 +」这个 AI 技术创新和产业发展的全新阶段,各方都迎来了一个良好的契机,能否把握住变得尤为重要。

对于百度而言,其持续深化的飞桨深度学习平台以及日益完善的文心大模型体系贯通了从硬件适配、模型训练、推理部署到场景应用的全产业链,成为「深度学习 +」驱动技术创新和赋能产业发展的引擎。未来要继续释放飞桨平台和文心大模型的引擎力,更快更好更广地开拓深度学习技术,并力求更大范围的应用落地。

对于产业合作伙伴而言,接入并利用深度学习平台和大模型技术,结合自身具体业务需求,能够不断提升业务智能化水平,实现业务效率提升和高效增长。

对于整个 AI 行业而言,应更加重视深度学习的技术红利,充分发挥潜力,实现新的 AI 技术突破,拓宽应用广度和深度,完成其变革社会生产生活方式的历史使命。

从更宏大的视角来讲,「深度学习 +」对于我国现代化产业体系也将产生助益。我国品类齐全、体量庞大的产业体系将为深度学习驱动的创新提供丰富的应用场景,有助于形成良性循环,促进底层技术突破,进一步升级我国现代化产业体系,全面推动经济社会进入智能时代。

总之,「深度学习 +」未来可期,各方要百尺竿头更进一步。百度显然已经为此做好了准备,继续发挥领头雁的表率作用,引领 AI 未来发展。

参考内容:

https://www.geekpark.net/news/302263

https://ai.baidu.com/support/news?action=detail&id=2897

相关资讯

《Pattern Recognition Letters》特刊通知

主题:深度学习模型安全简介:深度学习已广泛应用于自然语言处理、计算机视觉、数据安全等诸多领域。为学习到有效的深度模型,需花费大量时间和精力来收集数据与分配计算资源。这些模型可能会被非法使用,从而牺牲模型所有者的权益。另一方面,深度学习模型也容易受到对抗样本或毒化数据的攻击。这严重降低了深度学习技术的准确性和可靠性。为此需进行深度学习模型安全研究,保障模型的真实性和可靠性,以抵御各种攻击。该研究还处于起步阶段,虽然已取得了一定进展,但要为基于深度学习的应用开发稳健可靠的模型还远远不够。本期特刊旨在推动深度学习模型的攻

370多页免费书籍,三位学者带你专攻深度学习中的数学知识

期待即将到来的章节。

谷歌大脑深度学习调参(炼丹)指南出炉,Hinton点赞,一天收获1500星

「大量的实践经验已被提炼成这份强大的深度学习模型调参指南。」——Geoffrey Hinton。