科研动态

Dynamics

首页 >  科研动态 > 新闻  >  详情

鄂维南:AI For Science | 浦江AI评论第②期

在科学研究中,我们面临的一个基本困难是对高维数据的处理能力相当有限,而机器学习为解决该问题提供了新工具。

在“2021世界人工智能大会-科学前沿全体会议“上,普林斯顿大学数学系和应用数学研究所教授、北京大数据研究院院长、中国科学院院士鄂维南作了题为《AI For Science》的演讲。他认为,将机器学习引入科学建模将推动科学研究从“小农经济“进入”安卓“模式;传统科学领域才是人工智能更大的主战场,AI给我们带来的不仅仅是科学研究范式的改变,也将推动传统行业的转型和升级。

aaaa.png

鄂维南教授在2021世界人工智能大会上作主题演讲:AI For Science

我的题目是AI For Science,我们从科学讲起。

研究科学有两大基本目的:第一个目的是寻求基本规律,比如说行星运动的三大规律,比如说量子力学的基本方程、基本原理;第二个目的是解决实际问题,比如航空航天、生物制药等领域的实际问题。


深度学习解救维数灾难

从寻求基本规律,尤其是基本原理的角度来看,90年前,当量子力学建立以后,这个任务基本上就完成了。而这并不是彻底完成了,例如高能物理、原子核物理等领域,还有很多人在继续探讨,但是对于我们日常生活中碰到的化学、材料、生物等领域而言,量子力学就已经够了。

下图总结了科学,或者说理科和工科里面需要的最基本的规律:从底层的薛定谔方程,即量子力学开始,这是在凝聚态物理中用得比较多的,到材料和化学里面用得比较多的密度泛函理论以及分子动力学,再到生物、化工用得比较多的粗粒化的分子动力学,再到宏观层面的空气动力学等,这些基本规律都是以微分方程呈现的,而且都是非常困难的微分方程。

bbbb.png

科学和工程领域的基本原理

薛定谔方程就是一个典型的例子。它是量子力学的基本方程,其困难在于它是一个多体问题:波函数依赖的变量的个数,即维数,是粒子个数的三倍。假设有一个量子体系有100个电子,那么这就是一个300维的微分方程问题。100个电子的体系是非常简单的物理体系,但是300维的方程却是非常复杂的微分方程。这就是困难的根源。


人类真正的进步,是从上世纪50年代开始的。有了电子计算机,并且在此基础上发展了一系列的算法,人们才第一次大规模地实现了从基本原理出发来解决实际问题的目标——之前虽然有基本原理,但用它解决实际问题是非常困难、几乎做不到的。这些算法有一个共同的出发点:我们可以用多项式来逼近一般的函数,这本质上是牛顿告诉我们的。

这一点带来的影响非常巨大,可以说它是我们现代工业和技术赖以生存的基础。在工科领域,用计算方法来解决问题已经成了一个主要工具,但是仍然有很多的问题没有得到解决。例如材料的性质与设计,分子、药物的性质及设计等问题,还远远没有得到解决。基于基本原理的控制论方法也没有得到解决。造成的后果就是,从事理论、实验以及实际应用的三个团体之间差距非常大,例如,理论化学、实验化学和实际工业应用的化学,他们之间的场景差距很大。

困难在哪里?这些问题都有一个共同的根源,即所谓的“维数灾难”:他们依赖的变量太多了。随着变量个数(也就是维数)的增加,计算的复杂度呈指数级增加,这就是维数灾难。

从数学来讲,根本的困难来自于在高维情形,多项式不是一个有效的工具。这一点正好是深度学习可以帮助我们的地方。举个例子,图像识别——这是深度学习里面最简单的例子,就是一个函数。比方说,我们来看看下面这个图像分类所代表的函数有多少个维度(自由度)。

首先,每个像素都是1个自由度,这里一共有32x32=1024个维度;此外,颜色空间有三维,所以再乘以3,我们发现每一个图像都可以看成是3072维空间的一个点,所以Cifar10的分类问题可以看成是寻找一个3072维空间上的函数。这样的高维函数以前我们是根本没办法处理的。

cccc.png

深度学习帮助解决“维数灾难“:以图像识别为例

第二个例子是大家都非常熟悉的AlphaGo。围棋的最佳策略实际上是一个Bellman方程的解,AlphaGo做的事情实际上是在试图解这样的Bellman方程。

这两个例子中,图像识别是一个高维的函数,而AlphaGo是解高维超大空间的Bellman方程。还可以举很多例子,它们的共同特点都是在处理高维空间的数学问题。我们能做到这一点,就是因为神经网络可以帮助我们有效地表示或者逼近高维空间的函数。刚才说到多项式不行,神经网络是一个有效的替代品,而函数是数学里最基本的工具,高等数学最基本的数学概念就是函数。所以说在最基本的层面,我们有了一个全新的、十分有效的工具,它带来的影响是巨大的。

从科学研究的角度来说,深度学习可以带来新的计算方法、新的科学模型和新的实验方法。以分子动力学为例,对既定的材料或大分子,通过其每一个原子的动态轨迹来研究这个体系,这是分子动力学方法的基本思想,它是计算化学、计算材料、计算生物学的基本工具,它的基本方程就是非常简单的牛顿方程,但是困难在于描述原子和原子之间相互作用的势函数。

怎么解决这个问题?传统的方法就是:猜!猜对了很有效,但是这个方法非常不可靠。

第二个方法是1985年提出的基于第一性原理的方法,它通过量子力学模型在线计算原子之间的相互作用力。这个方法非常可靠,但是只能处理很小的体系,一般的情况下,1000个原子就到顶了。

现在我们有一个新的方法:量子力学基本原理只提供数据,在数据的基础上用机器学习方法提供模型,再用这个模型做分子动力学的计算。如果我们能够解决其中的技术问题的话,这就会成为一个既可靠又有效的方案。下面这个例子就是我们做的“深度势能模型”。

dddd.png

深度势能模型

左上角是小分子,左下角是生物大分子,右上角是高熵合金体系,右下角是简单的金属体系。大家可以看到,这个模型对非常广泛的生物体系、化学分子和材料体系,包括复杂的高熵合金都达到了量子力学模型的精度。

去年,在此基础上,我们把该模型和高性能计算结合在一起,把基本原理精度的分子动力学计算,从原来的可以处理1000个原子提升到可以处理1亿个原子。这一突破让我们获得了2020年的Gordon-Bell Prize(戈登贝尔奖)。更重要的是,这让我们第一次看到,把机器学习和科学计算、高性能计算这三大最主要的工具结合在一起,可以实现多么大的突破空间!不仅是分子动力学,从量子力学到密度泛函等其他领域,同样存在这样的空间,所以机器学习带来的影响是巨大的。


科学研究从“小农经济”进入“安卓”模式

我个人认为,目前我们做科研,无论是做理论还是实验,基本上都还处在 “小农经济”的模式,或作坊的模式。例如,要做一个三组分合金的模拟,必须自己先做量子力学计算,在此基础上积累数据,再去猜势能函数,然后做分子动力学计算,整个过程基本上是自给自足,但是从头到尾做下来要很多年。这是个效率低下的模式。

今后,科学研究将从“小农经济”转入“安卓”模式。也就是说,我们会有一个统一的大平台,这个大平台是大家一起贡献的,它提供了最基础的模型,例如分子动力学模型,科学家们对什么体系感兴趣,只要在平台上做简单的应用开发就可以了。

最后我想强调,传统科学领域,即化学、材料、电子工程、化学工程、机械工程等领域才是人工智能更大的主战场。AI给我们带来的不仅仅是科学研究范式的改变——我们谈科学研究范式谈了很多——也将推动传统行业的转型和升级,希望大家一起参与到这个伟大的事业中来。


谢谢大家!


comm@pjlab.org.cn

上海市徐汇区云锦路701号西岸国际人工智能中心37-38层

沪ICP备2021009351号-1