公众号/
编译/凯霞
得益于空军科学研究办公室的195 万美元赠款,马萨诸塞大学阿默斯特分校数学和统计系教授 Markos Katsoulakis 和 Luc Rey-Bellet,以及布朗大学的 Paul Dupuis 将在接下来的四年开发一种新的机器学习方法,超越对大数据的传统依赖。
Markos Katsoulakis
Luc Rey-Bellet
传统的机器学习依赖于庞大的数据缓存,算法可以筛选这些数据以「训练」自己完成任务,从而产生基于数据的数学模型。但是,如果数据很少,或者生成足够多的数据成本太高,该怎么办呢?
一种可能的、紧急的补救措施——通常被称为科学机器学习——是将多年的科学研究中获得的专家知识融入算法中,以开发物理原理和规则。
人们对包括医学、工程、制造和科学在内的各种应用领域和行业的科学机器学习非常感兴趣,但关键挑战之一是如何确保算法预测的可靠性。
这就是 Katsoulakis 和 Rey-Bellet 的用武之地,他们共同为科学机器学习带来了新的视角,一个专注于「分歧」的视角。「『发散』的数学概念,」Rey-Bellet 说,「是一种量化机器学习算法预测与实际实验数据之间差距的方法。」他补充说,「分歧使研究人员能够测试不同的机器学习算法并找到产生最佳结果的算法。」
该团队提出了一类新的「分歧」,其中涉及两个虚构的、相互竞争的代理——「玩家」——他们互相玩「游戏」。第一个玩家提出了一种新的机器学习模型,它模拟了一个现实生活场景;如果模型的预测与可用的现实生活中的实验数据不够匹配,另一个参与者可以拒绝该提议。游戏继续进行,直到玩家找到同时满足他们的算法。但是这些玩家有一个技巧:「我们分歧中的一个关键的新数学特征允许玩家『了解他们的物理』,」Katsoulakis说。「更聪明的玩家竞争更有效,相互学习得更快,训练需要的数据更少,但仍然对学习新物理持开放态度。」
Katsoulakis 说:「这是成为一名数学家的激动人心的时刻」,并补充说「应用数学、统计学、计算机科学和学科研究可以相互补充,并在未来几年解决科学机器学习中的这些基本问题。」Rey-Bellet 补充了最后一个想法:「几个世纪以来,物理学一直是所有数学科学的主要灵感来源。在过去的几年里,机器学习开始扮演类似的角色,并为数学世界带来了大量新思想。」
参考内容:https://www.eurekalert.org/news-releases/932655
https://www.umass.edu/news/article/competition-and-consensus-scientific-machine-learning-how-game-theory-approach-leads