编者按

RetroXpert--Decompose Retrosynthesis Prediction Like A Chemist是NeurIPS2020上的一篇关于逆合成的文章。其中,RetroXpert模型在目前基于模版的逆合成方向做端到端预测中Top-n accuracy 最高的模型。本文总结分析了文献的主要实验方法,预测结果以及预测可视化成果,以供读者更好的理解文献。

1.引言

This article was led by AI Lab in November 2020, and was published in NeurIPS 2020 with Texas University, Tsinghua University and Sun Yat-sen University. The design problem is mainly divided into two steps: firstly, a new graph neural network is used to identify the potential reaction center of the target molecule, and an intermediate synthon is generated, and then a robust reactant generation model is used to generate the synthon related The reactants. The difference between it and G2Gs is that G2Gs can only predict a special key disconnection at most. In addition, G2Gs independently produce multiple reactants, ignoring the relationship between multiple reactants. In order to overcome two difficulties, three methods of combining unsuccessful synths were proposed.

1)通过化学知识增强的边缘增强图注意网络(EGAT)来识别潜在的反应中心

2)进一步通过引入预测不成功的合成子来增强训练数据,这使RGN具有鲁棒性。

3)在标准的USPTO-50K数据集上,模型效果达到了70.4%(已知类型)和65.5%(类型未知)的top1。

1.1 实验方法

1.1.1 反应中心的识别

通过引入特征:N个节点X ∈  , 边的表示为E ∈ ,邻接矩阵 来识别在反向合成过程中将断开的潜在反应键,然后产物P可以被分成一组中间合子,每个合成子都可以看作是一个反应物的子结构。如图1所示

图1 反应中心识别

引入EGAT(图注意力网络):

Since products can be produced by different reactions, there can be multiple reaction centers for a given product, and each reaction center corresponds to a different reaction. MPNN only captures the local structure information of each node, and if there is no global information, it is difficult to distinguish multiple reaction centers. G2Gs can only predict one broken key information. Here, a graph-level auxiliary task is introduced to predict the total number of broken keys. Unlike GAT, GAT input nodes and graph-level embedding,如图2所示,EGAT将输入节点和边缘特征向量cat在一起,并且叠加多个EGAT层来得到最后一层的节点和边表示。

图2 EGAT模型

此外,通过  来判断键的断裂与否。并且用交叉熵损失函数的负对数尽可能最小化真实值和预测值,来获取二者的loss。公式如下所示。

K是训练反应的总数,键的标签可以通过比较靶点和反应物的分子图获得。此外,  用来作为对所有学习的节点表示的读出操作的输出。每一个目标的反应的最大断键数通过以下公式来表示(最大断键数表示隐藏在w矩阵当中)

1.1.2 通过合成子生成所需的反应物集

通过将生成的合成子和产物用link拼接反应类型的文本格式来作为RGN的输入生成不同的反应物,如图3所示。

图3 反应物的生成

1.2实验部分

1.2.1实验数据

The USPTO-50K data set was used, which used 1,808,937 original responses without response types. Use 8:1:1,Perform training, verification, and test splits.

1.2.2反应中心预测结果

· 通过消融实验去除了边的嵌入来观察计算节点和节点之间的相关性。

· 当反应类型未知时,改进更显著。表明反应类型在合成中起着重要的作用。同一类型的反应通常具有相似的反应模式(涉及原子、键和官能团),如果反应类型是先验知识,就更容易识别反应中心

1.2.3反应物生成预测结果

通过消融实验进行数据增强,如图4所示:

图4 反应类型已知和未知的Topn结果

通过将EGAT未成功预测的同步子作为RGN[2]训练数据增强来增强RGN。在评估测试数据时,还从EGAT收集预测合成子来形成RGN输入序列,而不考虑反应中心识别是否成功。一般来说,仅使用训练或测试增强对两种情况(有反应类型和没有反应类型)后合成性能的影响都很小。而如果采用训练和测试增强,合成性能将显著提高。证明了利用训练数据增强使RGN具有鲁棒性

1.2.4 预测可视化

辅助任务可以识别反应中心,原因是这两种颜色的键及其周围的结构非常相似。目前的浅网络只考虑局部信息,[3]无法区分真正的反应中心。在辅助任务的指导下,EGAT能够识别出真正的反应中心。

注:The pink color indicates the probability of disconnection predicted by the reaction center and the main task of EGAT. Blue indicates the position of the real disconnection.

1.3讨论与总结

1)目前逆向合成工作的一个主要共同局限性是缺乏合理的评价指标。而目前的评价度量只考虑给定的反应,之后会提出除了Topn以外的指标。为了解决smiles的立体化学和互变异构化差等问题,化学反应采用的数据库不仅限于USPTO数据库,可以考虑Reaxys数据库或内部数据。

2)反应类型在训练样本中非常重要。由于在反应物生成中所提出的增强策略由于引入的脏训练样本,如果没有给定的反应类型,RGN通常随着增强表现更差。然而,当给定的反应类型时,这种增强提高了其预测精度。

参考文献

[1] Wengong Jin, Connor Coley, Regina Barzilay, and Tommi Jaakkola. Predicting organic reaction outcomes with weisfeiler-lehman network. In Advances in Neural Information Processing Systems, 2017.

[2] Guillaume Klein, Yoon Kim, Yuntian Deng, Jean Senellart, and Alexander M. Rush. OpenNMT: Opensource toolkit for neural machine translation. In Proc. ACL, 2017.

[3] Justin Gilmer, Samuel S Schoenholz, Patrick F Riley, Oriol Vinyals, and George E Dahl. Neural message passing for quantum chemistry. In Proceedings of the 34th International Conference on Machine LearningVolume 70, pages 1263–1272. JMLR. org, 2017.

极链AI云平台现已经上传了RetroXpert模型,有复现需要的小伙伴可以点击链接,查看模型哦~

详情链接:模型详情页- retroexpert

最新NLP论文解析--附RetroXpert复现教程相关推荐

  1. 【单目3D目标检测】SMOKE论文解析与代码复现

    文章目录 yacs Introduction Usage SMOKE Preface Abstract Contributions Pipeline Backbone Head Branch Orie ...

  2. MotionBert论文解读及详细复现教程

    MotionBert:统一视角学习人体运动表示 通过学习人体运动表征,论文原作者提出了处理以人为中心的视频任务的统一方法.使用双流时空transformer(DSTformer)网络实现运动编码器,能 ...

  3. 【单目3D目标检测】FCOS3D + PGD论文解析与代码复现

    文章目录 前言 FCOS3D 概述 主要创新点 主要框架结构 回归目标 损失函数 推理过程 2D引导的多层3D预测 2D高斯分布的3D中心度 实验设置 源码复现 PGD 概述 主要创新点 深度估计 主 ...

  4. 谷歌新 AI 实验室主管 Hugo 深度学习教程:神经网络、CV、NLP 难点解析

     谷歌新 AI 实验室主管 Hugo 深度学习教程:神经网络.CV.NLP 难点解析 [日期:2016-12-16] 来源:新智元  作者: [字体:大 中 小]  11月22日,谷歌在蒙特利尔的 ...

  5. 特别策划|5G最新进展深度解析2022版—国内市场篇(65页附下载)

    关注公号回复"221130"下载65页PDF版报告原文 「5G行业应用」已陆续发布<5G最新进展深度解析2022版><技术篇>.<应用篇>.&l ...

  6. 计算机视觉系列最新论文(附简介)

    计算机视觉系列最新论文(附简介) 目标检测 1. 综述:深度域适应目标检测标题:Deep Domain Adaptive Object Detection: a Survey作者:Wanyi Li, ...

  7. CVPR2020| 最新CVPR2020论文抢先看,附全部下载链接!

    持续更新Github: https://github.com/Sophia-11/Awesome-CVPR-Paper 2021持续论文集锦百度云请在[计算机视觉联盟]后台回复  CVPR2021 往 ...

  8. 特别策划|5G最新进展深度解析2022版—技术篇(71页附下载)

    关注公号回复"220323"下载71页PDF版报告原文 2021年初,「5G行业应用」曾推出<5G最新进展深度解析>系列,包括技术应用篇.国内市场篇和全球市场篇,得到读 ...

  9. 特别策划|5G最新进展深度解析2022版—全球市场篇(32页附下载)

    关注公号回复"220525"下载32页PDF版报告原文 「5G行业应用」在2021年首次推出<5G最新进展深度解析>系列,包括技术应用篇.国内市场篇和全球市场篇.< ...

最新文章

  1. scheduled sampling_seq2seq
  2. 微信小程序地图上图片放到下面
  3. commit your changes or stash them before you can merge
  4. Vue入坑——vue-router如何传递参数
  5. php如何检测数组是否存在,php – 如何检查数组元素是否存在?
  6. js/jquery判断浏览器 停止加载
  7. mysql 替换非中文_mysql中的正则操作 匹配手机号,匹配中文,替换
  8. 基于android公交车线路查询论文文献,本科毕业论文---基于android的手机公交线路查询系统.doc...
  9. 编写函数main求3!+6!+9!python_Python day 6(3) Python 函数式编程1
  10. linux fork脚本,在Shell脚本中调用另一个脚本的三种方式讲解
  11. 用BP神经网络预测虫害
  12. 生成对抗网络的损失函数如何设计_如何检测极小人脸?试试超分辨率
  13. 随机游走问题的神奇应用(三)
  14. 模拟(堆):USACO Jan11 瓶颈
  15. msys2 pacman 安装 删除等常见命令汇总
  16. Android 网络下载文件 图片 httpurl
  17. MAC本地修改mysql数据库密码
  18. 流量用起来不要钱 | 立即打卡潮人好物,免流量再送2年网易云音乐黑胶VIP
  19. 计算机网络二进制计算题
  20. SpringBoot上传xlsx并批量导入

热门文章

  1. Bamboo Django Celery定时任务和时间设置
  2. 顶会顶刊的idea,从何而来?
  3. 你和云的距离只缺数据库服务器的一场大火
  4. 300+篇CVPR 2020代码开源的论文,全在这里了!
  5. 字节 抖音海外版客户端开发 一面
  6. 用布尔运算去做icon音乐图标
  7. html实现网格布局排版整齐的表格,CSS Grid 网格布局全攻略
  8. xx镇自建房屋安全专项整治工作方案
  9. 微信小程序使用vant时报警告
  10. 直流电机调速c语言程序,课程设计_直流电机调速(C语言版).doc