该研究以「Deploying synthetic coevolution and machine learning to engineer protein-protein interactions」为题,于 2023 年 7 月 28 日发布在《Science》。
为了使量子材料的发现成为可能,来自太平洋西北国家实验室 (PNNL) 研究人员将详细的数据库作为他们的虚拟实验室。研究人员创建了一个新的未被充分研究的量子材料数据库,为发现新材料提供了一条途径。
但这种情况正在开始改变。借助一种称为稀疏卷积神经网络 (Sparse Convolutional Neural Network,SCNN) 的机器学习工具,研究人员可以专注于数据的相关部分并筛选出其余部分。
现在,科学家们已经证明,生成式人工智能(AI)可以为这个费力的过程中的某些过程提供一条捷径,提出可以增强抗体抗 SARS-CoV-2 和埃博拉病毒等病毒效力的序列。
这就是劳伦斯伯克利国家实验室 (LBNL) 的「材料项目」(Materials Project)所面临的挑战。
最近,大型语言模型 (LLM),尤其是基于 Transformer 的模型在机器学习研究领域发展迅速。这些模型已成功应用于自然语言、代码生成、生物和化学研究等各个领域。
BM 欧洲研究院和苏黎世联邦理工学院的研究人员提出了 Regression Transformer(RT),这是一种将回归抽象为条件序列建模问题的方法。这为多任务语言模型引入了一个新方向——无缝桥接序列回归和条件序列生成。
法国国家科学研究中心和艾克斯-马赛大学以及荷兰马斯特里赫特大学的研究团队,利用模型比较框架并对比声学、语义(连续和分类)和声音到事件深度神经网络表示模型预测感知声音差异和 7 T 人类听觉皮层功能磁共振成像响应的能力。
作为 HBP 的一部分,法国艾克斯-马赛大学(Aix-Marseille Université,AMU)的研究人员开发了整合患者测量数据的计算大脑建模技术。
通过在阿贡的 Theta 超级计算机上进行的模拟,该团队创建了一个包含 20,000 个结构的数据库,用于氧与掺杂碳化钼的结合能。他们的模拟考虑了几十种掺杂元素和催化剂表面每种掺杂元素的一百多个可能位置。Theta 是阿贡领导计算设施、美国能源部科学用户设施办公室的一部分。
在这里,Meta AI 团队和纽约大学的研究人员展示了,使用大型语言模型从主序列直接推断结构,可以在高分辨率结构预测中实现一个数量级的加速。
有的蛋白质在基态结构中缺乏 Pocket,因此被认为是「不可成药的蛋白质」。
RNA 分子上的甲基化修饰,关系到某些蛋白的表达,进而会影响到细胞的状态,对于疾病治疗药物开发具有潜在应用价值。
自 2022 年 11 月公开发布以来,ChatGPT 引起了全世界的关注,在全球数百万用户面前展示了人工智能的非凡潜力。
在这里,艾伦图灵研究所、伦敦大学、罗氏制药以及 Genentech 的研究人员,概述了该领域的研究进展,并提出了从具有结构化缺失的数据中学习的一系列重大挑战。
全局机器学习力场(MLFF)能够捕捉分子系统中的集体相互作用,由于模型复杂性随系统规模显著增长,现在可以扩展到几十个原子。