感谢阅读腾讯 AI Lab 微信号第 159 篇文章。本文为腾讯 AI Lab 在 NeurIPS 2022 第二届 Open Catalyst Challenge (OCP)竞赛中夺冠的解决方案解析。

在刚刚落幕的由 Meta AI 研究院及卡耐基梅隆大学(CMU)联合机器学习顶级会议 NeurIPS 共同举办的第二届 Open Catalyst Challenge (OCP)竞赛中,由腾讯 AI Lab 领头,中国人民大学,清华大学以及香港中文大学组成的联合团队 TTRC 以 0.396eV 绝对误差的成绩获得第一,相对于去年的最好成绩,提升达到 27.6%。

比赛链接:https://opencatalystproject.org/challenge.html

项目主页:https://ai.tencent.com/ailab/ml/ocp/index.html

本文为具体技术方案解析。

背景

Open Catalyst Project(OCP)是由 Meta AI 和卡耐基梅隆大学联合发起的一个科研项目,旨在使用人工智能算法加速可用于再生能源存储的催化剂的发现。其核心目的是通过寻找高效且经济的催化剂来解决再生能源存储的问题。

在这一领域,传统方法是基于量子力学(密度泛函理论 DFT)的模拟计算催化剂表面和目标吸附物的结合能来测试和评估新的催化剂结构。然而,这类模拟的一大缺点是其巨大的计算成本,通常单个组合模拟就需要耗费 24 小时以上。这使得我们无法高效且大量地筛选潜在的催化剂结构。因此,如何利用机器学习算法去建模量子化学模型进而实现对于催化剂结构的有效筛选这是一个非常具有前景的方向。

传统基于量子力学的计算流程(引自官方资料)

给定一个催化剂-吸附物组成的反应系统,经典的量子力学模拟计算分为两个步骤,第一步是基于密度泛函理论计算系统中微观粒子的等效的受力。第二步则是基于这个受力迭代更新系统中原子核的位置。直到受力收敛。这样就可以得到这个系统低能态,即松弛状态,进而计算催化剂和吸附物的结合能。

本次比赛参赛主题则是构造机器学习模型预测一个由催化剂-吸附物组成的反应系统的松弛状态能量,即 IS2RE(Initial state to relaxed energy)。同上一届不同的是,除了提供催化剂-吸附物以及对应能量标签(46万)外,主办方还额外提供了200万的由密度泛函计算得到的静态反应系统的坐标及其对应的力和能量。基于这些数据,模型可以去预测静态结构下的等效受力,即 S2EF(Structure to energy and force),使得模型可以更好探索量子力学计算的部分的建模。

技术分析

自从 OCP 项目发起以来,由于其重要的科学意义和庞大的数据规模以及具有挑战的任务,吸引了 DeepMind,MSRA,达摩院,MILA,MIT,上海交大等机构的关注和参与。在今年的第二届比赛中,我们提出的 GeoEnsemble 框架以 0.396eV 绝对误差的成绩获得第一,相对于去年的比赛的最好成绩Graphormer,提升达到 27.6%。

非公开测试集排行榜,带下划线的为官方Baseline。(引自官方资料)

本届比赛的方案相对于上一届方案的提升。(引自官方资料)

限定比赛用训练集的方法,在Public Leaderboard性能表现。

数据来源: https://eval.ai/web/challenges/challenge-page/712/leaderboard/1950

在 GeoEnsemble 框架中,为了对原子之间复杂的动态交互关系进行建模,

我们在 ICLR 2022 发表的图动力学神经网络(GMN)[1] 的基础上进行了改进,提出了 GMN-OC 模型。

GMN-OC 模型的输入是一个由原子构成的几何图,几何图中包含了几何特征(原子的三维坐标)和非几何特征(原子的类型),模型可以预测输出几何向量(原子的受力)和非几何标量(系统能量)。

GMN-OC整体输入和输出流程

在 GMN-OC 模型中,我们构造了一个基于多通道的几何特征O(3)等变函数 与不变函数用来处理几何特征和非几何特征的交互。

基于这两个函数,我们构建了一个基于消息传递的图神经网络,在 GMN-OC 的每一个网络层中,会基于O(3)等变与不变函数进行消息传递与聚合,从而实现对每个原子的几何特征和非几何特征进行更新。

基于消息传播的几何特征更新过程

在这个基础模型上,我们进一步引入了一个全局共享表示模块(Global Representation Module)建模在 DFT 计算中可能涉及到的粒子之间的全局交互信息。同时也保持了模型的等变性。

全局共享表示模块示意图

整个 GMN-OC 模型结构如下图。同时,我们在计算时,使用了 Multi-head 的显存优化方法,使得模型可以更好地应对大数据的处理。

GMN-OC 模型整体架构

此外在训练技术上,为了充分利用赛事提供的两组训练数据,我们使用了 Pretrain-Finetune、Multi-task Learning 等优化技术,进一步提高模型预测精度。此外,我们结合 GMN-OC / SCN / GemNet 等多个模型,构建了多模型融合方案 GeoEnsemble。为了提高模型训练速度,我们还使用了混合精度训练等技术,并在大规模集群上完成了分布式训练。

GeoEnsemble 在训练上的改进

未来展望

利用人工智能技术助力自然科学领域中的探索和发现,已经成为近年来人工智能领域备受瞩目的应用方向之一。得益于高性能计算能力和前沿人工智能技术的不断发展,基础科学领域的研究者得以利用人工智能算法去加速相关领域中复杂、大规模的计算和模拟任务,如蛋白质折叠、小分子结合能计算、催化剂发现等。

腾讯 AI Lab 基于在人工智能算法研究中的积累,在生命科学,物理建模等多个应用方向上取得了重要的突破。例如首个大规模小分子预训练模型 GROVER [2]及骨架跃迁生成模型[3],自研蛋白质折叠模型 tFold [3]和基于序列预训练的抗体结构预测模型 tFold-Ab [4],基于等变性的蛋白质对接模型 EquiDock [5],基于图动力学网络的蛋白质动态结构预测模型 EGHN [6]等。同时,腾讯云深AI药物发现平台研发的基于等变图神经网络的分子能量框架 DeepQC,可以实现对类药分子的高精度的量化计算。

我们将在近期开源这次比赛使用的模型和训练推理源码,以助力人工智能在量子化学模拟和电子结构计算等基础研究领域的应用。在未来,腾讯 AI Lab 将持续研发和落地 AI 新技术,推动 AI 在交叉学科中的新应用,探索 AI 赋能科学发现的新范式。

参考链接:

1. Equivariant Graph Mechanics Networks with Constraints

2. Self-Supervised Graph Transformer on Large-Scale Molecular Data

3. A novel scalarized scaffold hopping algorithm with graph-based variational autoencoder for discovery of JAK1 inhibitors

4. When homologous sequences meet structural decoys: Accurate contact prediction by tFold in CASP14—(tFold for CASP14 contact prediction)

5. tFold-Ab: Fast and Accurate Antibody Structure Prediction without Sequence Homologs

6. Independent SE(3)-Equivariant Models for End-to-End Rigid Protein Docking

7. Equivariant Graph Hierarchy-Based Neural Networks

* 欢迎转载,请注明来自腾讯AI Lab微信(tencent_ailab)

NeurIPS 2022 | 当AI遇上量子化学:腾讯Al Lab冠军模型提升27%相关推荐

  1. php随机数字不重复使等式成立_当随机数遇上量子

    导读 小墨读大学的时候,坊间流传着一段顺口溜,用来描述大学几门特别难学的课,其中有一句:"-随机过程随机过,量子力学量力学...",可见这两门课消耗了多少学子的脑细胞.那么,当&q ...

  2. 区块链、AI遇上艺术,科技突破艺术的想象空间

    近期,在中国最高的美术馆--上海云间美术馆,来自人工智能和区块链领域的专家.高校学者和知名艺术家,共同展开了一场关于区块链.人工智能和数字艺术的深度交流,探讨区块链和人工智能赋能数字艺术的新方向. 与 ...

  3. AI遇上建筑设计,是出圈还是翻车?

    AIGC 落地,始于场景,终于价值. 去年以来出现了 AIGC 热潮,引发了 AIGC 及其应用话题的爆发性增长,不少人感慨强人工智能的时代已经离我们不那么遥远了.但是在热潮的另一面,我们看到真正能落 ...

  4. 戈登贝尔奖获得者张林峰:当AI遇上物理模型,会有怎样的质变? | 智源专访...

    智源社区「源创播客」栏目将持续邀请AI创业不同赛道上崭露头角的新星和资深创业者分享创业实践和创业故事.本期邀请到的对话嘉宾是北京深势科技公司创始人及首席科学家张林峰. 张林峰,北京深势科技公司创始人及 ...

  5. 当神经网络遇上量子计算:谷歌证明量子神经网络可训练图像分类

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 谷歌人工智能量子(Google AI Quantum)团队最近发表了两篇论文,介绍了他们在理解量子计算机学习任务方面取得的新进展. 量子计 ...

  6. 人工智能(AI)遇上仿制药

    仿制药比同类新药需要更少的研发.用于研发的AI应用似乎并不是仿制药公司最突出的解决方案.尽管缺乏优先级,但AI可能在很多领域可以帮助仿制药公司. 本文讨论了仿制药行业中人工智能的可能实现,如 查找生物 ...

  7. 【早知云世】当AI遇上云计算,其应用短板与长处

    随着前沿技术不断地发展以及云计算服务的普及,各种"即服务"如雨后春笋一般纷纷出现在了市场之中,这其中便有AI即服务(AIaaS),那么这个AI即服务又是什么样子的? 为了在不断的竞 ...

  8. 加密艺术,当AI遇上区块链 |Mixlab跨学科

    看到这副画 是不是觉得很熟悉? 这幅画就是名字叫<Protrait of Edmond Belamy>,是人类历史上第一幅被拍卖的人工智能艺术品,以43.2万美元(约300万人民币)出售. ...

  9. 图像识别AI遇上对抗性图像变“瞎子”,准确率猛降90%

    https://www.toutiao.com/a6715945584722706956/ 在视觉方面,AI和人类的差距有多大?来自UC Berkeley等高校的研究人员创建了一个包含7500个&qu ...

最新文章

  1. 【pyQuery】抓取startup news首页
  2. 只求规模不管服务?那平台就离死不远了
  3. Linux服务与chkconfig
  4. 二、源代码=程序集及程序集概念介绍
  5. oracle 归档日志激增,一次归档日志激增的分析.
  6. 机器学习----朴素贝叶斯详解
  7. 【分享】“飞鹅打印机“ 在集简云平台集成应用的常见问题与解决方案
  8. Python爬虫采集网易云音乐热评实战
  9. 【iOS沉思录】:iOS多媒体音频(下)-录音及其播放
  10. 关于SGD的一些小笔记
  11. 实用Chrome插件
  12. RAID的介绍与配置
  13. 美团外卖用户评价文本研究
  14. 第一次系统发版的过程(一)
  15. 彩票,双色球,模拟开奖小项目
  16. 骞云科技 DevOps 实践
  17. pygame教程实例(四)小球弹跳(事件)
  18. GUI程序中添加控制台调试
  19. 【labelme】标注工具报错ValueError: min() arg is an empty sequence
  20. 课程设计——基于javaweb的名片管理系统

热门文章

  1. 双角度斜光源——划痕、褶皱检测
  2. Java实训(181110~181111)
  3. Linux日志批量删除
  4. maven项目html文件打开乱码,maven项目文件乱码问题
  5. CATIA 软件许可证历史使用分析
  6. 634 寻找数组的错位排列
  7. 2017-2-1-moviesandbooks
  8. 《甩了,甩了,甩了他》----转
  9. 2.3 过去进行时+过去完成时
  10. CTF Web题部分PHP魔术方法总结(Magic Methods)