机器学习及其在化学中的应用

《机器学习及其在化学中的应用》研究生/本科生课程

 

学分:2; 学时:32。 主讲人:刘志荣 教授。

 

课程背景:

    机器学习是一门多领域交叉学科,它研究如何利用计算机从数据中进行学习,以获取新的知识与技能,并提高自身的性能表现。机器学习在化学领域的应用具有悠久的历史,例如,在上世纪60年代开发出的DENDRAL专家系统就是一个成功的例子,它能从质谱数据推断出样品中化学分子的组成。在另一方面,深度学习近10年来取得了巨大的发展,从而使机器学习与人工智能等学科获得了革命性的突破,以AlphaGo等典型个例给人类社会带来了巨大的震撼。现在,这种突破已经渗透到各个领域,包括化学:深度学习已经成功应用于有机合成分析(M. H. S. Segler et al., Planning chemical syntheses with deep neural networks and symbolic AI, Nature 555, 604 (2018))、蛋白质结构预测(2018年,AlphaFold在蛋白质结构预测比赛CASP中夺冠)。本课程将介绍机器学习的相关基础知识,并分析机器学习在化学前沿领域的典型应用例子,以便更好地面对机器学习给化学学科所带来的挑战与机会。

 

基本目的:

    由深度学习的发展所推动的机器学习与人工智能领域在近几年取得了迅猛的发展,对包括化学在内的诸多学科也开始产生影响。针对机器学习可能给化学学科所带来的挑战与机会,本课程将介绍机器学习的相关基础知识,并分析机器学习在化学前沿领域的典型应用例子。通过课程的学习,希望能够使学生达到如下目标:(1)掌握机器学习的基本知识;(2)能够阅读、分析与评估化学领域的机器学习文章;(3)能利用机器学习来解决简单的问题。

 

参考书目:

1、Christopher M. Bishop, Pattern Recognition and Machine Learning. (Springer, 2006).

2、Richard S. Sutton and Andrew G. Barto, Reinforcement Learning: An Introduction. 2nd edition. (MIT Press, 2018).

3、Ian Goodfellow, Yoshua Bengio, and Aaron Courville, Deep Learning. (MIT Press, 2016). 中文译本:伊恩.古德费洛(Ian Goodfellow)、约书亚.本吉奥(Yoshua Bengio)、亚伦.库维尔(Aaron Courville) 著,赵申剑、黎彧君、符天凡、李凯 译。深度学习。(人民邮电出版社,2017)。

4、Peter Harrington 著,李锐,李鹏,曲亚东 等 译。机器学习实战 [Machine learning in action]。(人民邮电出版社,2013)。

 

内容提要:

* 机器学习引言

* 线性回归:最简单的学习模型

* 分类的线性方法(简单的线性法;逻辑回归)

* 人工神经网络

* 模型评估

* 核方法(高斯过程;支持向量机)

* 图模型(朴素贝叶斯分类器;贝叶斯网络;马尔科夫随机场;玻尔兹曼机)

* 混合模型(K-均值法;混合高斯模型)

* 连续潜在变量(低维流形,PCA)

* 集成学习(Boosting;决策树;随机森林?)

* 强化学习简介,多臂老虎机

* 强化学习:有限马尔科夫决策过程

* 强化学习的三种方法:动态规划、蒙特卡罗、时序差分算法。

* 深度学习

* 化学例子:有机合成路线,AlphaFold,药物设计,力场.