公众号/
编辑 | 白菜叶
机器学习 (ML) 方法已证明能够以传统理论化学方法的计算成本的一小部分来预测分子光谱,同时保持高精度。图神经网络(GNN)在这方面特别有前景,但尚未对不同类型的 GNN 进行系统比较。
德国亥姆霍兹柏林材料与能源研究中心(HZB)的研究人员对五种不同的 GNN 进行基准测试和分析,以预测来自有机分子 QM9 数据集的激发光谱。他们比较了 GNN 在明显的运行时测量、预测准确性和测试集中异常值分析方面的性能。
此外,通过TMAP聚类和统计分析,研究人员能够突出高预测误差的明确热点以及具有某些官能团的分子的最佳光谱预测。这种深入的基准测试和后续分析协议为比较不同的机器学习方法和评估数据集质量奠定了基础。
该研究以「Graph Neural Networks for Learning Molecular Excitation Spectra」为题,于 2022 年 6 月 7 日发布在《Journal of Chemical Theory and Computation》。
使用传统方法,计算较大分子的光谱「指纹」非常耗时。但这是正确解释实验获得的数据的先决条件。
「大分子以及通常由数千个原子组成的量子点,很难使用 DFT 等传统方法提前计算出来。」来自 HZB 的 Annika Bande 博士说。现在,她的团队正在研究如何通过使用人工智能方法来缩短计算时间。
这个想法:计算机「图形神经网络」或 GNN 接收小分子作为输入,任务是确定它们的光谱响应。在下一步中,GNN 程序将计算的光谱与已知的目标光谱(DFT 或实验)进行比较,并相应地修正计算路径。
一轮又一轮,结果变得更好。因此,GNN 程序自行学习如何借助已知光谱可靠地计算光谱。
「我们已经训练了五个较新的 GNN,发现其中一个可以实现巨大的改进,即 SchNet 模型:准确度提高了 20%,而且这在计算时间的一小部分内完成。」第一作者 Kanishka Singh 说。
「最近开发的 GNN 框架可以做得更好。」她说,「而且需求非常高。因此,我们希望加强这一研究领域,并计划从夏季开始为其创建一个新的博士后职位,作为亥姆霍兹项目『用于 X 射线吸收光谱的可解释人工智能』的一部分。」
论文链接:https://pubs.acs.org/doi/10.1021/acs.jctc.2c00255
相关报道:https://phys.org/news/2022-06-fingerprints-molecules-artificial-intelligence.html