6月19日,中国科学院院士、第三世界科学院院士马志明莅临厦大经济学科,为师生带来一场题为“漫谈数学的应用”的南强学术讲座。讲座开始前,厦门大学科技处处长谭忠为马志明院士颁授南强学术讲座纪念牌。
马志明院士首先介绍了生成对抗网络。它启发自博弈论中的二人零和博弈。生成对抗网络模型中的两位博弈方分别由生成式模型和判别式模型充当。生成模型G捕捉样本数据的分布,是一个二分类器,估计一个样本来自训练数据(而非生成数据)的概率。G和D一般都是非线性映射函数。向判别模型D输入生成样本,对于D来说期望输出低概率(判断为生成样本),对于生成模型G来说要尽量欺骗D,使判别模型输出高概率(误判为真实样本),从而形成竞争与对抗。生成对抗网络模型在当今十分引人关注,但它也面临着一些挑战。只有判别器训练得不好不坏才行,但这个火候又很难把握,甚至在同一轮训练的前后不同阶段这个火候都可能不一样,所以生成对抗网络模型才那么难训练。马志明院士又通过追溯历史给我们讲解了生成对抗网络模型的原理——蒙日最优传输问题和最优传输的量化:Wassestein距离,并详细介绍了Wassestein距离的优势。随后马志明院士列举了数学在现代经济金融中的应用,如舒必克指数、沙普利-舒必克指数等。
随后马志明院士讲解了搜索引擎的数学——网页是如何排序的,详细介绍了重要性排序——用马氏链刻画上网行为。PageRank是马氏链的唯一平稳分布,并且平稳分布在每一页面的取值等于对该页面平均点击比率。PageRank算法的发明者佩奇和布林编写了一个PageRank搜索工具,并用PageRank为结果的相关性排序。他们发现,网络越大,链接越多,这个引擎提供的结果就越准确,于是,他们将新引擎命名为现在我们常用的搜索引擎Google。马志明院士也分析了PageRank的优点和不足,其中不足是与关键词无关,与内容无关,只与网络图的结构有关。
最后,马志明院士通过“长颈鹿是四个不同物种”这一发现的引入,简要分享了概率统计与生物学科的交叉,介绍如何运用数学工具分析基因数据。
马志明院士演讲结束后,与现场的老师们和同学们进行了互动交流。他鼓励不同学科之间相互欣赏,不同学科的老师们以开放包容的心态联合培养拥有跨学科知识的优秀学生。整场讲座在掌声中圆满结束。
(WISE 2016MA 顾婷)