深势科技张林峰:平台化科研入口雏形初现,玻尔赋能未来教育科研

近日,AI在线旗下ScienceAI以了解深势科技旗下AI加持的先进工具玻尔空间站(Bohrium)为契机,对深势科技创始人兼首席科学家、北京科学智能研究院院长张林峰进行了专访。 作为AI for Science领域的先行探索者,张林峰在采访中与我们深入探讨了AI for Science的内涵与发展趋势,玻尔空间站在教育、科研与产业融合中的角色,以及如何通过技术创新解决传统科研中的痛点。 他还分享了玻尔空间站在未来科研生态中的愿景,以及如何通过平台化的方式推动科研范式的变革。

图片

近日,AI在线旗下ScienceAI以了解深势科技旗下AI加持的先进工具玻尔空间站(Bohrium)为契机,对深势科技创始人兼首席科学家、北京科学智能研究院院长张林峰进行了专访。

作为AI for Science领域的先行探索者,张林峰在采访中与我们深入探讨了AI for Science的内涵与发展趋势,玻尔空间站在教育、科研与产业融合中的角色,以及如何通过技术创新解决传统科研中的痛点。他还分享了玻尔空间站在未来科研生态中的愿景,以及如何通过平台化的方式推动科研范式的变革。

张林峰表示,AI for Science不仅仅是将AI作为工具应用于一个个具体科研问题,更是通过AI技术推动科研范式的根本性变革。玻尔空间站作为这一变革的载体,正在逐步成为科研人员平台化研发的入口,帮助科学家们更高效地进行跨学科研究,缩短从创新算法到应用落地的周期。

Q:如何定义和看待「AI for Science」?玻尔平台在教育科研和产业融合中的角色是什么?

张林峰:

AI for Science中文直接翻译过来是人工智能赋能或人工智能驱动的科学研究,因为英文表述更简便,所以AI for Science这个词在中文世界也已被广泛采用。

关于AI for Science这个领域,我认为它的内涵和外延都还在不断拓展,人们对它的理解也不断加深。首先,最直观的是把AI作为一个工具,运用AI技术去解决科学研究或者更广义的研发类问题。

早在2018年的时候,AI for Science这一概念就由中科院院士鄂维南首次提出,当时ChatGPT还没有诞生,距离谷歌提出Transformer也才仅仅一年。到现在,AI for Science已经应用到越来越多的科研和工业场景,而人们对AI的理解也已经和之前非常不一样了;某种程度上,现阶段AI的发展正在迎来新一轮爆发期,而AI for Science则处在一个深水区、蓄势待发。

玻尔(指Bohrium®)是怎么来的?这跟我们自己的发展历史有关。2017、2018年我们的团队完成了一系列算法上的突破,接着2020年我们获得戈登贝尔奖等荣誉。在这样的背景下,我们决心创办一家源自中国引领世界的科技公司。但是,从普林斯顿大学回国直接选择创业的我和早期团队遇到的第一个问题便是,AI for Science的人才和算力等基础设施都非常不ready------人需要「原生交叉」、问题导向,遇山开山、遇水劈水;算力等基础设施需要「原生融合」,但实际情况不容乐观。

玻尔是在解决这个问题的过程中诞生的。从早年带着一大帮实习生干、到逐渐系统化,整个过程里培养人学中干干中学、定义问题解决问题,以及从算法研发到工程化产品化,从而解决更多问题的同时,结合场景新需求与技术新进展定义新问题。这个循环过程中遇到的瓶颈点我们都应对了一轮又一轮,进而沉淀了颇为扎实的支撑平台。同时我们发现,这也正是整个教育科研体系的需求。这样逐渐地就形成我们现在的玻尔Bohrium平台产品。

当下,玻尔平台在教育方面形成了「学-练-考-赛」的人才培养模式,即不仅需要传统的学习(学),还需要大量的动手实战(练),基于实践的考试(考)和基于学界和业界真问题的比赛(赛),在中学AI教育、大学数智人才培养方面都快速地取得了一系列成果;在科研方面,玻尔平台以学术搜索推荐为入口,打通了文献-计算-实验三者,以及从研发到APP应用落地的链条。玻尔在推动科研要素走向云平台化,我们也希望它能逐渐成为未来「云研发的入口」。

我们期待玻尔平台上产生出一系列交叉碰撞的研发成果,培养出一系列「AI原生」的交叉人才。某种程度上,我已经很难定义自己的背景是数学、物理、计算机,还是化学、材料了,也很难说一个算法是「有创新点的」还是只是数学上的偷换概念或者工程上的奇技淫巧,这在一些「人才认定」或者文章投稿的时候容易被拒绝。但我很清楚,接下来整个科研和工业版图上有着巨大的机会空间和巨多的问题等着我们这代人解决。解决这些问题的过程中,学科的边界会被打破,过去的产学研体系也将被重构。

Q:「云研发入口」的构想具体是什么样的?如何服务于科学研究和工业应用的全流程?

张林峰:

鄂院士提出「AI for Science」的时候便指出,其最大的机遇在于推动科研范式的变革。这种变革可以理解为从「小作坊模式」向「安卓模式」转变。在「安卓模式」下,许多基础设施问题可以被操作系统更好地统筹,从而更好地服务于各类应用。

面向未来的科研基础设施要素是什么?盘算下来主要包含:创新的模型算法软件,自动化智能化的实验仪器设备,替代文献的知识库和数据库,以及高度整合的算力。2023年鄂院士提出了「四梁N柱」的架构,把这四者的融合作为平台化的基础,而面向各个垂直应用场景定义了「N柱」。

整个系统串起来的时候,你可以直观想象这样的画面:我们有一个AI基础大模型,在模型的驱动下,科学家用它读文献产生想法,做一系列设计(仿真设计、生成式设计等),然后辅助进行相关的实验合成、验证、测试,并且基于实验结果进行反馈,进一步迭代式、闭环式地进行科学研究。未来科学家们很大的比例会采用这样的模式做科研,因为只有这样才能真正打通理论、计算、与实验;打通产学研;也打破学科领域之间的壁垒。

当有越来越多科研这样进行的时候,「四梁」涉及到的公共科研生产力要素便自然需要走向「平台化」。计算机、互联网和AI的技术发展验证了这点,而这样的范式正在辐射到绝大多数的学科领域。从文献和更广义的学术内容,到每个基础设施模块的接入、调度、适配、优化以及研发形成的各类工作流、解决方案、数据资产和实体IP,再到沉淀成新的paper、APP工具等等,一个平台化的体系会提升从创新到落地各个环节的效能。

现在的玻尔平台上,有像单斌这样的老师上架他的《计算材料学》课程,上面有对相关理论算法和应用案例的细致讲解,更有丰富的notebook实训案例,数千学生学习、广受欢迎;有多个系列的比赛,包括我们主打的AI4S Cup,将各领域真实场景的问题转化为可以即时给出评估反馈的赛题、直接发榜,这不光逐渐吸引了很多企业参与直接命题,更是成为了中学生AI奥林匹克竞赛的承办平台;有将算法快速转化为最小可用产品的APP开发平台,吸引很多课题组入驻开发,也吸引像深度原理这样的AI for Science初创企业快速打磨迭代自己的产品,而我们自己面向工业场景的产品解决方案,例如针对电池设计自动化(Battery Design Automation,BDA)需求打造的产品Piloteye,就是这样的APP经持续优化组合而来的。

最近,由玻尔空间站托管的北京科学智能研究院和深势科技共同打造的全新AI搜索、管理、阅读一站式产品Science Navigator也将迎来重大升级,欢迎大家关注。此外,我们的自动化智能化实验室产品Uni-Lab也开始上线迭代。很快,玻尔空间站上便会实现一系列的AI agents,从学术内容搜索推荐管理的paper agents,到实验干湿闭环迭代的research agents,「云上研发入口」的雏形到此也将基本完备。

回到最开始的问题,「如何服务于科学研究和工业应用的全流程」?以前我们常说科研体系的一大痛点在于「(问题)从paper中来、(解决方案)到paper中去」。而在玻尔空间站,我们将以平台化的方式实现「问题(以AI4S Cup等形式)从真实场景需求中来,解决方案(以APP等形式)到实际应用中去」。当越来越多玻尔用户不因他们的文章引用次数,而因他们解决问题的个数、APP被别人使用的次数、课程培养的学生人数得到更多认可时,新范式便实现了。

Q:玻尔如何解决传统科研中的痛点,体现在哪些方面?

张林峰:

我认为主要存在三个主要方面。

第一,是解决「小作坊模式」的痛点

「小作坊模式」是什么呢?本质是科研团队在缺乏基础设施支持时,被迫全流程自主完成所有环节的「啥都自己干」模式。以很多化学、材料场景的科研人员为例,在实验室建设初期,往往需要亲自参与计算集群采购、实验设备选型乃至机房环境搭建等基础工作。这个过程不仅涉及诸多技术和非技术的细节,更伴随着漫长的筹备周期和显著的资源利用率波动。此外,各「小作坊」之间越来越难以进行有效的通信,在科研成果大爆炸的当下,科研人员很难真正了解所有的前沿进展、「站在巨人的肩膀上」。很多时候,「没引用」不是因为不小心,而是因为不知道。

随着研究深入,快速变化的领域进展等进一步放大了这种模式的弊端。例如对于AI、生物信息学等很多领域,研究人员需要持续跟进快速迭代的开源方法。例如某个基于R语言开发的新型算法工具、某个只能跑在特定版本机器学习框架上的AI模型等,其部署往往需要特定版本的编程环境、依赖库支持,甚至涉及与计算中心进行资源协调。这种技术适配过程既耗时又存在兼容性风险。

更深层次的挑战在于科研动态发展中的资源管理困境。例如,当课题推进到关键阶段时,常会发现现有平台缺失必要的分析工具或算力储备,迫使团队重新进入采购论证或系统重建流程。这种反复不仅导致科研人员要将大量精力投入技术运维,更使得研究生不得不转型为「全栈型」人才------他们既要掌握领域专业知识,又要具备服务器维护、代码调试等跨领域技能。少数同学因此成为了「科研多面手」,但更多情况是陷在不专业带来的泥潭的同时,严重分散了科研专注力。

第二,是科研效能的问题。

这个问题最显著的体现是在学科交叉需求大的时候。有很多技术的组合碰撞完全是「四两拨千斤」的。真正制约科研效能提升的是学科间的语言体系的不通畅和基础设施的不健全,而非是问题本身有多难。

举个例子,图像处理领域中的SAM (Segment Anything Model)的图像分割模型,其实很适合材料领域颗粒物识别与表征分析。看到它的时候我立马转给了北大的一位材料学院的合作老师,兴奋地说:「我们想做的事情门槛变得低很多了!」但是,模型的很多技术细节并非一下就能对另一个领域的专家讲清楚的,好在有玻尔平台。

我让一位正好学习AI技术的同学在玻尔平台上部署了SAM,写了一个简要介绍原理的Bohrium Notebook。但与SAM原来案例不同的是,我们换上了这位老师的图片、介观颗粒物的图片、和原子级表征的电镜图片,做了三个例子。我们明显可以看到,模型效果在这三个例子中分别是「非常好」、「还凑合」、「不太行」,我把这个notebook发给材料方向的老师,他一下就get到了这个模型能做什么,在介观图像上该如何改进,在原子级表征上我们如何从头设计算法。

我想强调的是,人们对新技术往往会有两种极端反应,「啥都能干」和「啥都干不了」------不同领域之间对互相的进展也容易有这样的态度。我们真正需要一个平台做的,可能并不是把所有技术细节都呈现出来,而是让人先获得「手感」,从而对新技术解决自己关心的问题的深浅和程度有一个粗略的判断。基于这个判断,才能针对自己的问题逐层深入。在此基础上,一个好的平台还可以在这个逐层深入的过程中提供相应的工具和教材。

第三,到最后,「生产力」的发展会推动「生产关系」的变革。

AI for Science不止是关于AI怎么应用到一个个具体科研问题中,更是关于科研本身该怎么做,即科研共同体的协作接口是怎样的;以及科研怎么评价,即激励反馈体系的设计。不夸张地说,可能90%以上的学术发表都已经不再起到过去科学共同体希望起到的作用了。强绑定于「文章发表」以及国内强绑定于「帽子」的科研评价体系,已经逐渐成为传统科研最大的痛点。正如前面说到的,我们希望玻尔平台能为此提供新的思路,让科研不再只是「从paper中来到paper中去」。

我们还可以从另外一个角度看这个问题。回顾历史,从创新到应用的周期可能需要二三十年,而在当下,这一周期可能缩短至三五年,甚至在不远的未来会进一步缩短。

在二三十年的周期中,我们无法立即判断所有创新成果的实际效用,直接追问其是否有用并不公平,这也是同行评审驱动的学术发表体系很大程度发挥作用的地方;然而,三五年的周期则截然不同。这意味着对于一个博士生而言其入学时的研究选题在毕业时很可能已经过时;这意味着一个画饼的方向可能更快地就会被打脸;这意味着一个文章从投稿完到被接收如果过个一年半载可能就彻底过时了;这可能还意味着我们需要提出一个更本质的问题:如何评价和评估创新成果?随着时间尺度的显著缩短,评价机制也需要相应调整。

我认为在接下来的三到五年内,科学共同体将面临深刻的反思与挑战。这是评价体系的核心问题。其次,创新的想法如何从概念到应用落地,甚至集成到一系列解决方案中,即整个落地的流程,将成为关键。这些变化将深刻影响科学研究的未来发展方向。我期待到时候的玻尔能符合新时代的需求。

Q:平台是怎样盈利的?

张林峰:

未来的平台将分为两大类:一类是云上开放平台,另一类则是私有化平台。

云上开放平台具有「To C」的属性,内容和工具的订阅将成为主流模式。这种模式可以类比于当前的SaaS模式,但更侧重于科研领域——不止算力在云上,实验仪器设备也在云上。目前,已有数百个课题组入驻我们的平台,并在上面开展科研工作。就私有化平台而言,越来越多的院系从教学到科研的各个环节也都在采用我们的整体解决方案。例如,最近与武汉大学的合作中,我们的平台支撑了其数智教育的全流程,包括教学、考核等各个环节。这种平台化的支撑正在成为未来教育与科研的重要趋势。从去年到今年,我们云上很快就会超过百万科研用户,同时这样的模式正在迅速推广至各个高校院系和研究机构。

我们可以看到,一个连接科研生产要素与人的网络正在逐步形成。这种网络的发展是自下而上(bottom-up)和自上而下(top-down)共同推动的结果。自下而上,各个课题组以及喜爱我们产品的学生不断反馈和优化使用体验;自上而下,整个大环境对这一方向的重视以及各个领域、学科对AI技术实践的需求,为我们的产品提供了强大的发展动力。

我相信,今年会是AI推动高校院系平台化教育科研变革的关键时期,希望玻尔能够充分助力。与此同时,我们针对物质科学和生命科学的工业研发平台,也脱胎于玻尔的框架,相应的业务也正逐渐实现正向循环。打造新一代工业研发平台、系统全面地助力实体经济的发展,是我们希望做到的事情。

Q:玻尔这个项目接下来具体会往哪些领域发展?

张林峰:

未来一年,我们希望从学生、老师、个人到课题组,再到高校院系,实现玻尔空间站的广泛覆盖,并有效连接图书馆、计算中心和实验中心等资源。通过这些努力,我们期待能够获得更广泛的认可,使玻尔空间站成为受欢迎的平台化研发入口。

与此同时,教育部办公厅印发《教育部办公厅关于加强中小学人工智能教育的通知》,明确提出探索中小学人工智能教育实施途径,加强中小学人工智能教育。玻尔空间站已经为此实现了良好的基础。近期,我们就与北京第十一中学展开了围绕中学AI教育的合作。未来,深势科技将和众多中学围绕人工智能课程开发、人工智能师资建设、人工智能实训平台等三大板块展开深度探索与合作。深势科技也会积极响应国家政策,为中学人工智能教育提供全方位、系统化的解决方案,助力中学高质量开展人工智能相关课程教育教学工作。

Q. 玻尔这个名字有什么更深的渊源吗?

张林峰:

「玻尔」指的是尼尔斯·玻尔(Niels Bohr),他是一位伟大的科学家,1921年获得诺贝尔物理学奖,是原子物理和量子力学领域的开拓者。此外,玻尔还有两个特别值得关注的身份:第一,他的名字被用于命名第107号元素「𬭛(Bohrium)」,这是元素周期表上的一种人工合成元素;第二,他在丹麦建立了哥本哈根理论物理研究所,这一机构对量子力学的发展起到了至关重要的推动作用。

哥本哈根理论物理研究所的蓬勃发展,以及它所创造的组织形式和环境,推动了量子力学的诞生与发展。当时,许多推动科学历史的年轻人,如维尔纳·海森堡、沃尔夫冈·泡利、保罗·狄拉克等,都在这一环境中崭露头角。他们不仅是一代科学巨匠,更是科学精神的象征。这种组织形式和学术氛围,不仅定义了科学家这一角色,也重新引领了对科学家的理解。

玻尔本人不仅是一位杰出的科学家,更是一位能够定义和引领科学家精神的领袖。这种回归初心、追求真理的精神,正是我们在从事科学研究或技术研发时最为珍贵和值得铭记的核心价值。

通过介绍玻尔这个名字及其背后的思考,我想强调的是,无论是科研的生产方式、科研范式的转变,还是科学共同体的协作,最终都需要回归到一个更本质的精神层面追求。这种追求将指引我们走向何方,是我们需要不断探讨的问题。正如玻尔所代表的科学家精神,到2026年,我们有望推动并见证整个科研范式逐步演变,并成为这一变革中的重要参与者和推动者。

Q:如何吸引志同道合的伙伴加入?

张林峰:

对于一家希望在国内实现从原始创新到落地应用的企业来说,这是一个充满挑战的问题。

我们有幸吸引了很多志同道合的伙伴一路走到现在,但一路上也体会到了诸多不易。我们的事业需要吸引非常多不同领域的同学,但每个领域方向的每个阶段都有它原来设定下的路径。我深刻地感受到,我们周围有着蓬勃的生产力,束缚生产力释放的不是生产力不足,而是组织形式和协同机制。在此背景下,一路选择坚持初心是不容易的。最近DeepSeek的进展给了我们很大的鼓舞。

玻尔平台是我创业前从未预期我们会做的一个产品。某种程度上,因为缺乏真正的国外对标,我们也很难解释清楚它最后成长为的样子。但转念想想,这就是我们在国内推动原创到落地的过程中思考和实践的沉淀。以AI原生、平台化的方式打通文献、计算、实验,加速科学发现、定义产业未来,这岂不是件很酷的事情?

有时候我在想,我们刚才提到的教育与科研,尤其是高等教育和科研,每年的投入通常占国家GDP的接近4%。因此,投入的效能问题显得尤为重要:我们培养什么样的人才?解决什么样的问题?以及如何服务于重要的需求和产业发展?玻尔可能会为这些问题提供一个方案。我们希望打造好这个平台,服务教育科研体系,同时自己也在这个平台的赋能下不断做出持续创新、落地行业的事情。

于是,如何吸引志同道合的伙伴?一个有趣的判断标准不是单纯的吸引,而是识别------通过双向的奔赴形成共振。这种共振的标准在于我们内部常用一个口号来界定------「如果你的反应不是退缩,而是激动。」

有这种反应的伙伴,便是我们希望吸引的伙伴。

关于玻尔科研空间站(Bohrium)

玻尔科研空间站(Bohrium)是深势科技专为科研人员量身打造的「AI for Science」科学研究平台,致力于为科研人提供一体化、即开即用的在线工作站。

在这里,科研人员可以使用AI辅助论文搜索与阅读,学习AI与材料、化学、生命科学等学科结合的交叉课程,并通过云端工具进行高效的科学计算与实验设计。

玻尔空间站不仅是一个技术平台,更是推动科研范式变革的重要载体,旨在通过AI技术赋能科学研究,加速从基础研究到产业应用的转化。

相关资讯