在首届全球AI药物研发大赛中,微软研究院王童研究员带领的ViSNet-Drug团队,凭借其团队自主开发的AI2BMD高精度动力学模拟系统、ViSNet三维分子结构建模图神经网络和蛋白质全构象数据集AIMD-Chig在三轮比赛中均排名第一并获得总冠军。王童研究员团队提出全新的新冠小分子药物解决方案:通过AI2BMD高精度的分子动力学模拟有效区分正负样本小分子与主蛋白酶靶点之间的结合自由能,利用AIMD-Chig蛋白全构象数据集对ViSNet模型进行预训练,最终通过对预训练的ViSNet网络进行fine tuning,得到高准确度的预测结果。为了了解这份成果背后的技术,我开始阅读了相关的论文,首先阅读的是ViSNet,论文标题为

ViSNet: a scalable and accurate geometric deep learning potential for molecular dynamics simulation

论文:https://arxiv.org/abs/2210.16518

源码:没找到直接的源码,找到了相关另一篇文章的源码。内容大致相同。GitHub - microsoft/ViSNet at OGB-LSC@NIPS2022

背景介绍

分子动力学模拟(MD)描述了分子系统的动力学和热力学性质。它广泛应用于物理、化学、生物和制药领域。过去主要采用以下两种模拟方法:

  1. 从头算分子动力学模拟,例如由密度泛函理论 (DFT) 驱动的模拟。其优点是可以精确计算能量和力,但计算成本高昂,限制了其在大型分子系统和长时间模拟中的应用。
  2. 采用经验力场的经典 MD 可以进行快速且合适的模拟,因为它们适用于大型系统,但电子运动引起的量子效应无法捕获,力场参数通常不可转移。

近年来随着机器学习(ML)和深度学习(DL)的发展,由于其强大的特征提取能力和表示能力,得到越来越多的关注。特别是对数据依赖度更低的几何深度学习方法(GDL),GDL通过纳入分子的几何信息使模型对数据保持旋转平移不变性。尽管神经网络模型的预测精度已经接近传统的模拟方法,但任然存在几何信息利用不足和高计算成本的问题,这阻碍了它们在分子动力学模拟中的应用。为了缓解上上面的问题,文章作者提出了一种名为 ViSNet 的可扩展且高精度的分子动力学图深度学习模型。在ViSNet中,作者提出了一种运行时几何计算(RGC)策略,以线性计算复杂度提取和编码角度和二面体信息,显着加速模型训练和推理并减少内存消耗。然后,设计了一种新颖有效的矢量-标量交互式等变消息传递机制,称为 ViS-MP,通过将矢量表示与标量表示交互来充分利用几何信息。通过合并这两个模块,结合了两种类型 EGNN 各自的优点,使计算效率更高且几何信息也得到了更充分利用。在一些基准上进行综合评估时,ViSNet 在 MD17 数据集上的所有分子上均优于所有最先进的算法,并且在 QM9 数据集上表现出优越的性能,表明分子几何表示的强大能力。

模型架构

概述

如图 1(a)所示,ViSNet模型由一个embedding块和多个堆叠的 ViSNet 块组成,后面加上一个输出块。首先,embedding块把分子中各原子信息和化学键信息嵌入成向量,然后混合分子中的几何信息一起输入ViSNet块中聚合和更新。更新后的分子表示就包含了几何信息,然后这样的分子表示就可以在不同的输出块下进行各种下游任务了。其中每个ViSNet块由Message Block和Message Block组成,连续的两个ViSNet块之间有残差链接。

嵌入快

它首先嵌入原子,并通过径向基函数(RBF)计算其距离在截止范围内的边缘表示。然后将原子 i 的初始嵌入、其 1 跳邻居 j 和边 eij 融合在一起,作为初始节点嵌入 和边嵌入 。嵌入块表示式:

表示节点i的1跳邻居节点集合,j是其邻居之一。初始向量嵌入 设置为 。向量嵌入 通过投影到嵌入空间中。

Message Block

分子表示聚合:如下面参考图左边表示,从上一模块得到的分子表示通过函数 φ s m 聚合更新,表示式如下:

其中是块的索引,是节点i在第l层的嵌入向量,表示在第l层节点i和节点j之间的边特征。

几何信息聚合:几何信息的聚合同分子表示聚合类似,如下面参考图右边所示,表示式如下:

其中表示聚合j特征的i节点的特征表示。表示节点 i 到其相邻节点 j 的方向向量。 是节点i的“方向单元”,保留了节点i的几何信息,是从节点 i 到其所有相邻节点 j 的所有单位向量的总和,表示式如下:

的单位向量。

参考图:

Message Block

更新节点的嵌入向量:完整的分子表示除了需要融合周围邻居点的特征 之外,还需融合原子周围的空间信息。融合的方法如下面展示图左侧,表示式如下式(7),通过聚合函数 融合原子的原始特征和聚合特征,还有原子的方向单位向量的内积。

另外,结合上面方程式(1)计算节点i的方向单位向量的内积,可以满足下式:

即,方向单位向量的内积等于节点i与其任意两个相邻节点所形成的所有角度的余弦值之和。其中表示节点i到其所有邻居节点的单位向量内积之和。

更新边的嵌入向量:和节点特征更新一样,边的特征更新也需要融合空间信息。融合的方法如上图右侧,表示式如下式(8)。

其中fij是边的原始特征,表示节点i的方向单元向量在节点 i 到其相邻节点 j 的方向向量的投影。按照几何的运算规则,可以满足下式(3,4)

在上面等式1中定义,是 的单位向量。表示m,I,j,n四个节点形成的二面角。可以参考图C进行理解。

更新节点的“方向单元”向量:节点方向单元向量的更新需要聚合原始方向单元向量,聚合周边节点特征后的节点特征和聚合几何信息后的方向单元向量。表示式如下式(9):

论文笔记|百度AI制药大赛冠军背后的技术(ViSNet)相关推荐

  1. 搜狗发布全球首位 3D AI 主播,背后分身技术有玄机

    作者 | 陈利鑫 头图 | CSDN 下载自东方 IC 又是一年两会时间,平时关注新闻的朋友们可能会发现,新华社关于两会的报道,进行消息播送的主持人队伍加入了一位漂亮小姐姐,而这位小姐姐竟然不是真人, ...

  2. 机器人社社长事迹_国际机器人大赛冠军背后的故事

    本报记者诸葛晨晨文/摄 一次比赛 "还是按以前,把传感器调高一个高度,机器人巡线灵敏度还是能保证的."带队老师朱火红向杨语桑.王康腾.陈江禹提出建议. 这一幕发生在美国新墨西哥州阿 ...

  3. ACL 2022 | 腾讯AI Lab入选20篇论文:写作助手和交互翻译背后的技术创新

    感谢阅读腾讯AI Lab微信号第146篇文章.本文介绍腾讯 AI Lab 被 ACL 2022 收录的研究成果. 国际最受关注的自然语言处理自然语言处理(NLP)顶级会议 ACL 2022 于今年 5 ...

  4. 百度AI“杀入”新领域,我举双手支持!

    伊瓢 发自 凹非寺 量子位 报道 | 公众号 QbitAI AI实力玩家开始搞公益,承担一系列反人类的工作,真是让人想双手双脚赞成. 比如AI能做垃圾分类--不新鲜,但如果是准确率100%.已落地的垃 ...

  5. 百度AI长语音识别技术免费开放,调用时长不再受限

    原标题:百度AI长语音识别技术免费开放,调用时长不再受限 前几天看到一条祝福:祝大家早日成为可以在公司群里随心所欲发语音的人 . 显然,微信群聊(特别是家族群.客户群.公司群)里的语音消息,并不是谁想 ...

  6. 首届昇腾AI创新大赛,“照见”好学不倦的“后浪”

    经过半年多的激烈角逐后,首届昇腾AI创新大赛正式收官. 作为面向AI开发者打造的顶级赛事,昇腾AI创新大赛分为两个赛道:一个是面向行业场景进行应用创新的应用赛道,意在推动人工智能的产业落地:另一个是基 ...

  7. 百度AI开发者实战营即将走进杭州,还带来了一大波福利!

    点击上方"CSDN",选择"置顶公众号" 关键时刻,第一时间送达! 如果要评AI界的"劳模",那一定非百度AI莫属了.5月17日-18日,继 ...

  8. 华为云函数调用百度ai sdk实现语音合成

    使用云函数调用百度ai开放平台的各种sdk 云函数环境为 nodejs12.13如果不会创建 参考之前的博客 本文介绍语音合成的使用 注册百度ai开放平台语音合成应用 进入百度ai开放平台控制台 找到 ...

  9. AI技术领跑、23个国际冠军,2019百度AI如何彰显核心竞争力

    2019-12-23 12:49:05 机器之心原创 机器之心编辑部 BERT 自然语言处理模型,TensorFlow.PyTorch 深度学习平台,Waymo 自动驾驶汽车--这些能让我们记住的.与 ...

  10. 斩获23项冠军,日均调用破万亿!百度交出年度AI成绩单:语音语言领衔技术突破,国产自研成大趋势...

    乾明 雷刚 发自 凹非寺  量子位 报道 | 公众号 QbitAI 刚刚,百度一年AI成绩单官宣. 作为中国AI头雁,百度的成绩单不止代表巨头公司业绩,也代表了技术前沿现状和产业基本情况. 而且诸多进 ...

最新文章

  1. 物联网可应用于十大行业嘛?
  2. 计算机教资笔试答题,教资笔试5大题型的解答技巧,你get到了嘛?
  3. sdut-1118 C语言实验——从大到小输出a、b、c(选择结构)
  4. 大数据集群中数据互相导通流程汇总(持续更新中)
  5. 搭建BP神经网络(完整代码快速上手)
  6. jQuery 学习-DOM篇(二):jQuery 在 DOM 内部插入元素
  7. git 分支管理策略(7)
  8. Yoga安装Ubuntu后,wifi和亮度调节问题
  9. Hacker News 2018 年度报告出炉
  10. 【目标跟踪】基于matlab背景差分多目标捕捉【含Matlab源码 810期】
  11. Excel笔记(1) Excel常用基础功能
  12. Android 4.0 人脸,Android 4.0.3!原道N90人脸识别试用
  13. 个人搭建ASP网站,从头开始完全教程(一)
  14. 微信公众平台的设计与开发之道
  15. 从Word中读取内容将word转换成txt
  16. ubuntu下cron不执行的常见问题
  17. Django REST framework+Vue 打造生鲜超市(十三)
  18. 为何我工作十年,内心仍无比恐慌(腾讯产品总监曹菲)
  19. 6-3 求一组数中的平均值及最大值 (10 分)
  20. 第155篇 英格兰拍卖

热门文章

  1. 【天光学术】教育心理学论文:当代教育心理学在高校教育中的发展
  2. 机器人走路动作_CSS3 很棒的机器人行走(步行)动画模拟
  3. AcWing 1148. 秘密的牛奶运输
  4. MySQLHA系列MHA(一)
  5. 《超详细》小白如何用pycharm进行RMB识别(含模型建立,损失函数,优化函数与具体组合实现功能的具体流程)
  6. python读取json文件_python 读写txt文件 json文件的实现方法
  7. 【Matlab图像融合】CBF算法图像融合【含源码 083期】
  8. gitlab runner使用教程
  9. 《Nature》空间转录组综述
  10. Source Insight 4.0 统一字体大小