发表年份:2019

论文地址:下载论文

1、项目背景

预测多肽与主要组织相容性复合体(MHC)的结合在癌症治疗疫苗的开发中起着至关重要的作用。为了提高精度和减少假阳性预测的数量,改进预测和实际绑定相关性的算法。

本文提出一种泛特异性算法,可以准确预测多肽与MHC-I类分子之间的结合亲和性,同时还可以预测训练数据集中没有看到的新等位基因。PS:如何识别新的等位基因的?

通过组合卷积神经网络和注意力机制,ACME方法能够提取可解释的模式,并且能够提供详细的关于肽和MHC之间的结合偏好。PS:这个注意力机制设计的思路具体是什么情况?

注意力机制:为输入的各个位置分配不同的权重,使得模型可以更注重于最关键的特征,从而可以更好地进行预测。在序列分析中,由内嵌的注意力机制得出的单个位点(碱基对或氨基酸残基)的权重可以更加注重对最终预测有最大贡献的重要位点。

算法流程图

2、数据集详情(来源、组成等)

采用5折交叉对IEDB数据进行验证,评估model与其他方法的预测性能(这个不是训练集,是测试集),然后将这个数据集和(Pearson et al 2016)中的数据集结合训练model(前提是去除冗余数据)。

3、数据编码方式

对于输入数据多肽和MHC序列,采用标准的BLOSUM50评分矩阵进行编码;

        BLOSUM50评分矩阵:用于序列对比的氨基酸替换打分矩阵。从BLOCKS数据库中对那些在高度保守序列中的蛋白质家族进行观察测量进而整理出了氨基酸替换的概率,采用对数胜算来计算矩阵中的分值。和PAM打分矩阵相比,BLOSUM打分矩阵的内容皆由观察得出。在实际的应用中,BLOSUM矩阵能够取得更好的结果。

在本文的model中,将所有的BLOSUM矩阵的元素除以一个比例因子,可以促进model训练,经过超参数调优后将该比例因子设置为10。

对于每个多肽序列,将编码成24×20的矩阵,如下图所示:

多肽-MHC结合亲和力用IC50(nM)的值来表示;

其中IC50用于衡量药物诱导凋亡的能力,诱导能力越强,该数值越低,当然也可以反向说明某种细胞对药物的耐受程度。

然后用这个预测值作为训练和测试时model的标签。

4、模型架构的设计

该模型主要由五个部分组成:

1.初始特征提取

采用编码后的肽和MHC特征表示作为model的输入,首先采用具有ReLU激活函数(这个model中采用的均是ReLU激活函数)的一维卷积层分别进行处理,进行初始特征提取;

其中M表示输入矩阵:其中24×20表示肽序列,34×20表示MHC的伪序列, 表示ReLU激活函数,表示第k个过滤器的第d行和第i列中的元素,表示对应的偏置参数。d和j的范围可能因填充结果的不同而不同。

2.卷积模块

卷积模块主要用于提取不同层次的绑定特征,并将其整合进行预测。

对于MHC而言,首先经过一个卷积层,然后紧跟一个max-pooling层,其次又经过一个一维卷积和max-pooling。然后将第一个卷积层后特征输入到attention layer中,如下图所示。

但是在肽序列中,只经过了一次卷积操作。然后将经过两轮卷积和一轮池化的MHC特征分别与经过一次卷积操作的肽特征图结合,使得模型可以学到不同抽象等级的MHC特征如何与肽特征结合,进而确定肽-MHC结合。这里的三次连接的全连接层都连到一个彼此独立的全连接层。最后再将三个组合后的全连接层连接在一起,再经过两次全连接层。

3.注意力机制模块

在model中,注意力机制模块与卷积模块合作,对于每个残差位置对应的特征向量赋予不同的权重,然后计算未加权重和加权后的平均值。(这里的加权平均是计算MHC和肽之间的加权平均还是MHC与肽单独加权和未加权之间的平均呢?)通过这个会对预测肽-MHC相互作用更重要的残基分配更高的权重。

注意力机制层将特征矩阵F映射为注意权向量w,通过下列公式

其中a表示注意力机制层的权重,b表示偏置。然后再将特征图中的每一个w经过softmax归一化;

再计算所有行向量的加权平均,将这个平均再和卷积模块的输出进一步结合,产生最终的预测。

4.最终预测

卷积模块和注意力模块的输出被连接在一起,然后输入到一个具有sigmoid激活函数的全连接层中进行最终的预测(图1a),即:

5.模型训练

为了确定最终的超参数,将IEDB数据集分割成一个90%训练集和一个5%的验证集。在验证集上采用网格搜索方法确定其最优的超参数。(网格搜索算法使用每组超参数训练模型并挑选验证集误差最小的超参数组合,适用于超参数比较少的情况)。

5、模型的评估指标

采用预测和测量的绑定亲和力之间的Pearson相关参数(PCC)和接受者工作特征曲线下的面积(AUROC)作为附加的评估指标。

采用阈值为500nM的IC50值转换为0和1标签。损失函数采用均方误差(mean squared error)。在训练过程中采用adam优化器进行随机梯度下降计算。在超参数校准后,对上述训练集运行一个5折交叉验证以评估模型的预测性能,并且每一次的验证都采用不同的随机初始化,最后采用平均结果。

  1. 测试集

在最新的IDEB基准数据集上测试ACME,再将预测性能与之前的方法进行比较。

ACME在没有任何训练数据的情况下对新的MHC等位基因进行准确的结合预测,将特定等位基因的数据从训练数据中删除,用作测试集。再使用剩余的训练集训练一个模型,评估我们的模型在这个测试集上的性能。测试结果表明:虽然在训练集中没有看到被测试的基因,ACME仍然取得相对较高的性能。

额外的测试采用SRCC进行性能评估。

6、总结

ACME在将肽分类为结合物和非结合物方面具有较高的通用性。

ACME充分利用现有的已知知识,利用现有的训练数据,在训练数据很少或者没有的情况下,对新的等位基因进行准确的预测。

本文提出的注意力机制模块,在亲和力预测中的作用是有限的,需要找到一种更好的方法将注意力机制整合到模型中。

并且ACME利用有限的实验数据来分析不同模型预测结果不同的情况。并且文中采用了许多实验验证,进一步完善抗原肽的预测。未来将引入更多信息,如肽运输和TCR识别,进一步完善抗原肽的预测,将更多的信息纳入到预测模型中。

PS:对于自己的模型,也可以采用相同的注意力机制方式重点关注我们所需要的信息,进一步增强model的侧重点。

文献阅读:ACME: pan-specific peptide–MHC class I binding prediction through attention-based相关推荐

  1. 【文献阅读】Applications of deep learning in stock market prediction: Recent progress

    Applications of deep learning in stock market prediction: Recent progress 1 本文相关介绍 本文为 2021 年 CCF-C ...

  2. 文献阅读-Clinical and Biological subtypes of B-cell lymphoma revealed by microenvironment signature

    文献阅读 Clinical and Biological subtypes of B-cell lymphoma revealed by microenvironmental signature Ab ...

  3. 文献阅读疑问(202010)

    学习笔记,仅供参考 文章目录 文献阅读疑问 Unsupervised Deep Embedding for Clustering Analysis 文献阅读疑问 Unsupervised Deep E ...

  4. 细胞亚器文献阅读之酵母液泡与线粒体的动态互作A Dynamic Interface between Vacuoles and Mitochondria in Yeast

    细胞亚器文献阅读之酵母液泡与线粒体的动态互作A Dynamic Interface between Vacuoles and Mitochondria in Yeast 本文和前一篇阅读的文献之间的关 ...

  5. 2018-12 文献阅读:A Survey on Transfer Learning(2009)

    文献阅读:A Survey on Transfer Learning(2009) 2018-12 文章的作者是Sinno Jialin pan 与 Qiang Yang 关键词:迁移学习(transf ...

  6. 利用Python, PyQt5,Selenium,百度图像识别API制作文献阅读辅助工具

    开发背景 作为一名科研狗,经常需要读一些外文文献并且做笔记,有时还需要全文翻译以备后用.这时候会遇到一些问题: PDF和CAJ文件直接复制出来的东西含有大量无用的换行符,手动删除十分麻烦: 有的文献是 ...

  7. 2015年语音识别文献阅读报告

    2015年语音识别文献阅读报告 @sprt 摘要 本文回顾了语音识别技术从开创至今的发展历程,总结了2015年国际上在内容语音识别领域所取得的最新成果和面临的主要问题,并重点关注了深度学习在自动语音识 ...

  8. 四位科研牛人介绍的文献阅读经验

     每天保持读至少2-3 篇的文献的习惯.读文献有不同的读法,但最重要的自己总结概括这篇文献到底说了什么,否则就是白读,读的时候好像什么都明白,一合上就什么都不知道,这是读文献的大忌,既浪费时间,最 ...

  9. 最大熵模型(Maximum Entropy Model)文献阅读指南

    最大熵模型(Maximum Entropy Model)是一种机器学习方法,在自然语言处理的许多领域(如词性标注.中文分词.句子边界识别.浅层句法分析及文本分类等)都有比较好的应用效果.张乐博士的最大 ...

最新文章

  1. 游戏UI设计干货:怎么让游戏界面更具科技感?
  2. 如何将Wav文件做到EXE文件里
  3. 图tp delDataById问题
  4. Eclipse离线安装Java Decompiler插件
  5. 数据结构:B树和B+树的插入、删除图文详解
  6. 从技术到应用实践,揭秘京东区块链布局全景
  7. C#动态调用WCF接口,两种方式任你选。
  8. 51NOD-1005 大数加法【大数】
  9. 行测测评——矩阵、圆形、环形三角图形数列推理解题技巧
  10. 2019年12月7日pmp考试成都在哪考
  11. 【NPDP】大师级管理人物盘点:现代管理之父-彼得·德鲁克
  12. 搜索引擎模块设计与实现——相关度搜索算法模块
  13. oracle密码解锁
  14. Java集合之Collection集合、泛型 【集合综合案例:赌神、赌侠、赌神斗地主】
  15. Spring Boot 学习[四] web项目实战训练(增删改查,分页,排序)
  16. 【无标题】2022年施工员-设备方向-通用基础(施工员)考试模拟100题及模拟考试
  17. 豆瓣相册图片下载 教程
  18. 机器学习——评估方法
  19. 美团团队---客户端自动化测试研究
  20. NodeJS使用crypto进行MD5加密

热门文章

  1. oracle bug号,《一次Oracle bug的故障排查过程思考》的问题重现解决
  2. IDEA向前向后箭头,左右箭头如何设置
  3. LCD液晶显示屏通光原理——液晶夹层
  4. 解决CSS3瀑布流、多列布局时内容被截断、错乱
  5. 项目中的精华功能讲解:相信大家都用过CSDN 中结贴的功能吧(弹出的小黄窗体)
  6. Gartner 发布中国IaaS PaaS市场服务报告,天翼云强势入选
  7. Android Camera 开发常见专业术语名词解释
  8. L1-057 PTA使我精神焕发 (5 分)
  9. 图片纯前端JS压缩的实现
  10. 微信摇一摇动画效果加音效