科研产业即将迎来AI赋能拐点

「机器之心2021-2022年度AI趋势大咖说」聚焦「驱动未来的AI技术」与「重塑产业的AI科技」,推出线上分享,共邀请近40位AI领域知名学者、产业专家及企业高管通过主题分享及多人圆桌等形式,与行业精英、读者、观众共同回顾 2021年中的重要技术和学术热点,盘点AI产业的年度研究方向以及重大科技突破,展望2022年度AI技术发展方向、AI技术与产业科技融合趋势。

本文为创新工场执行董事,前沿科技基金总经理任博冰于「驱动未来的AI技术」系列主题,「AI for Science」专场的分享内容节选。点击进入「机器之心Pro」,查看更多优质内容。

From ScienceAI to Programable World

任博冰表示,其实在上世纪80年代通过机器学习对蛋白质结构预测就开始做了,所以,ScienceAI本身不是一个新主题,最近几年科研和产业没有较大变化。

任博冰谈道,吉姆·格雷是1998年图灵奖得主,著名的计算机科学家。2007年1月11日,他在加州山景城召开发表了他的著名演讲:科学方法的一次革命。在这篇演讲中,吉姆·格雷将科学研究的范式分为四类——除了之前的实验范式、理论范式、仿真范式之外,新的信息技术已经促使新的范式出现——数据密集型科学发现(Data-Intensive ScientificDiscovery)。而第一、二、三范式分别是以实验、理论研究和模拟仿真为基础。

任博冰表示,第一二三范式目前还没有结束,第四范式虽然是说数据密集型,但事实上还是以实验理论包括仿真模拟为一体,加上数据本身智能带来的一些机会,所以第四范式其实是第一二三加四的总和。目前看来,大部分还在第三到第四个中间的过渡,而且第四范式未来可能还会有第五范式本身的一些迭代。

围绕“AI对科学能带来什么?”的问题。任博冰表示,AI目前带来的东西主要是复杂性比较高,变量因子比较多、在找规律方面胜过人脑等领域。但是事实上,在找规律方面,AI可能只是规律的一部分,或者说AI找到了规则,但人们无法理解。

对于上述问题,任博冰总结为两点:一是从理解到发现,另一个是从理解到设计。从理解到发现,科学能否自动化,如何自动化,哪些东西至少现在可以自动化?目前科学的核心是观察和逻辑,也就是第四范式。通过观察生成数据,然后我们可以从中使用逻辑来识别规律性,并用数学语言来表述它们,并对其公式化,但是数学公式不仅仅是对数据的描述,它也使我们预测并发现以前未知的关系。

任博冰谈道,目前算法成就暂未达到人类理想预期,但从理解到设计上已经有很好的突破。

图片

 任博冰表示,我们在逐步接近一个可编程的原子世界(Programable World)。因为目前快速演进的各类深度科技,其实已经从基于比特的数字创新,转向了基于比特和原子的数字物理创新,并且不断交叉成为一类新技术。我们把原子世界的理解写入比特世界,就能用比特去操控原子,甚至设计和制造一个新的原子世界。

长期来看,有两个趋势不可避免:

1.人类将有能力使生命体和非生命体将有目标地自编程和自制造。

2.会有一部分包括人类的生命体和一部分非生命体生活在比特世界里。

图片

可以看到ScienceAI 打开了一个新的空间。人工智能在过去还停留在物理世界数字化层。加上 Science之后,这个物理世界数字化变得更基于物理世界本身的一些原理,超脱了我们之前对物理世界的理解,包括所有学科的交叉,加上 AI 的能力之后,在科学上和商业上有可能打开了一个新的增量市场所。而创新工场也在ScienceAI领域有突破,孵化出一系列公司,如电芯的电子电流场、转座子家族、合金晶体结构、酶结构等。

科研产业即将迎来AI赋能拐点

相关资讯

第四范式发布先知AIOS 5.1,升级支持GPU资源池化功能

今天,第四范式先知AIOS 5.1版本正式发布。该版本新增GPU资源池化(vGPU)能力,实现对硬件集群平台化管理、算力资源的按需分配和快速调度,最多节省80%的硬件成本,提高GPU综合利用率多达5-10倍。第四范式先知AIOS 5是行业大模型开发及管理平台。平台以提升企业核心竞争力为目标,在支持接入企业各类模态数据的基础上,提供大模型训练、精调等低门槛建模工具、科学家创新服务体系、北极星策略管理平台、大模型纳管平台、主流算力适配优化等能力,实现端到端的行业大模型的构建、部署、管理服务。在行业大模型的构建过程中,为

免费报名,第五届「解放军总医院-麻省理工学院医疗大数据学术交流及Datathon活动」

编辑 | ScienceAI为引进国外先进理念和模式,推动医疗大数据和人工智能领域的「理-工-医-信」跨学科合作,增强国际间学术交流。由解放军总医院、中国生物医学工程学会临床医学工程分会和麻省理工学院联合举办的第五届「解放军总医院-麻省理工学院医疗大数据学术交流及 Datathon 活动」将于 2024 年 9 月 12 日至 15 日在北京召开。活动详情及报名通道如下:

逼近量化训练?块重建技术打造离线量化新极限

模型量化技术可以有效加速推理,已经成为人工智能芯片的标配,并在工业落地中广泛应用。离线量化(Post-Training Quantization)不需要耦合训练流程,使用成本和时间成本低,往往作为生产量化模型的首选方式,但其可调整空间有限,因此面临更大的准确度挑战,尤其是在一些特殊场景和极端要求下,不得不进一步引入更为复杂的在线量化(Quantization Aware Training)流程挽救,而这极大增加了量化模型生产的复杂度。如何在享受离线量化便捷高效的同时,在有限的调整“夹缝”中提升其效果上限,成为进一步打破技术红线的关键。在ICLR2021上,商汤科技研究院Spring工具链团队、高性能计算团队和成都电子科技大学顾实老师团队合作提出了块重建技术BRECQ,重新审视量化模型的优化粒度,首次将离线量化在4bit上的效果提升到在线量化的水平,相比在线量化可以节省大于200倍的生产时间,BRECQ在多种网络和任务上普遍取得了业界最佳效果,打造了离线量化的新极限。