文献链接:Deep-AVPpred: Artificial Intelligence Driven Discovery of Peptide Drugs for Viral Infections | IEEE Journals & Magazine | IEEE Xplore

doi:10.1109/JBHI.2021.3130825

摘要

人畜共患病病毒一直是人类面临的难以解决的问题,COVID-19流行病就是一个例子。而已知的抗病毒药有效力低、副作用强等很多缺点,所以人们开始关注于自然物质的抗病毒能力。动植物可以产生AVPs(antiviral peptides)来阻止病毒入侵本体,但获取这些AVP来合成肽药物又贵又花时间。因此,本文提出一种计算方法来识别新的AVP,方法名为Deep-AVPpred,其使用转移学习(transfer learning)理念结合深度学习算法来从蛋白质序列中发现AVPs。同时,基于这一方法,我们推出了网页工具Deep-AVPpred,其可以用于帮助抗病毒药物工作预测新AVPs。


数据集

在本文工作中,我们从AVPpred、DBAASP、DRAMP、SATPDB、StarPep中收集10203种AVPs,再从AVPpred、Swiss-Prot中收集8792种non-AVPs。经过一系列标准筛选后,最终所使用数据集为4090种non-AVPs和4090种AVPs.


模型框架

Deep-AVPpred模型结构如下图所示,

  • 数据预处理。基于transfer learning理念使用了前人的工作得到的pretrained embeddings,其使用长1280的向量来编码肽序列的每一个氨基酸。
  • 输入层,使用前一步处理后的数据,肽序列长度限定为∈ [5,50],同时用0向量补齐空缺。
  • 4层并联的1-D卷积层。卷积核大小依次为4、5、6、7,各filters大小都为200,以及激活函数为ReLU。
  • 相应的4层1-D Global Max池化层。进行下采样任务,然后将4层输出concatenate(堆叠)起来。
  • Independent Component Layer。用的前人的工作,可以更稳定学习、更快收敛速度、更好泛化能力。
  • 4层串联密集层(全连接层)。依次含有64、32、8、1个神经元,前三层使用ReLU为激活函数,最后一层使用Sigmoid做激活函数,输出值∈ [0,1]。
  • 权重更新,使用的Adam(Adaptive Moment Estimation)优化策略。


实验

分类评估指标方面,本文使用的是经典的Accuracy、Sensitivity、Precision、F1-Score、Specificity、area under ROC curve(AUROC)。同时,与目前的SOTA算法进行对比,算法有AVPcompo、iAMPpred、Meta-iAVP、AVPIden、ENNAVIA-B。

【大模型多肽发现、学习笔记】针对病毒感染的肽药物发现相关推荐

  1. hadoop大数据开发技术学习笔记第三天:(前序)MySQL数据库进阶

    hadoop大数据开发技术学习笔记第三天:(前序)MySQL数据库进阶 一.回顾知识 1.myschool数据库和数据表的创建 (1)创建数据库 (2)数据库模型图 (3)创建数据表grand (4) ...

  2. 大数据Hadoop教程-学习笔记01【大数据导论与Linux基础】

    视频教程:哔哩哔哩网站:黑马大数据Hadoop入门视频教程,总时长:14:22:04 教程资源:https://pan.baidu.com/s/1WYgyI3KgbzKzFD639lA-_g,提取码: ...

  3. 大模型:深度学习领域的“巨无霸”

    文章目录 前言 一.大模型的优势 二.大模型的应用场景 三.如何使用大模型 总结 前言 随着人工智能技术的不断发展,深度学习已经成为了目前最为热门的技术之一.而在深度学习领域中,大模型(Large S ...

  4. 会议交流|大模型与图学习等知识图谱相关技术实践探索

    2021年,在疫情隔离和复杂国际形势的背景下,我们越发认识到重视核心基础技术,对保持国家独立自主发展的关键价值,互联网和科技行业也面临着新的挑战和变革机遇,新的AI技术正发挥越来越大的作用,AI技术本 ...

  5. 雨痕大神的《学习笔记系列》

    雨痕大神的<学习笔记>可以在他的GitHub(https://github.com/qyuhen/book)下载,7000+的Star,足以证明认可度. 笔记系列陆陆续续在出版,已出版的有 ...

  6. 大数据Hadoop教程-学习笔记02【Apache Hadoop、HDFS】

    视频教程:哔哩哔哩网站:黑马大数据Hadoop入门视频教程 教程资源:https://pan.baidu.com/s/1WYgyI3KgbzKzFD639lA-_g 提取码: 6666 [P001-P ...

  7. nrf52832 学习笔记(九)蓝牙主机发现服务

    nrf52832 学习笔记(九)蓝牙主机发现服务 服务发现流程 数据如同下表一样存储在服务端,客户端首先要获取表中的Handle和Type列,从而知道服务端中存在哪些数据,以便后面读.写.通知等操作. ...

  8. transformer模型的奥秘-学习笔记

          本文主要介绍了transformer模型的大概原理及模型结构.这篇学习笔记的学习资料主要是<Attention is All you Need>这篇神作,还有两位大神的指点(见 ...

  9. .NET 大数据实时计算--学习笔记

    摘要 纯 .Net 自研大数据实时计算平台,在中通快递服务数百亿包裹,处理数据万亿计!将分享大数据如何落地以及设计思路,技术重难点. 目录 背景介绍 计算平台架构 项目实战 背景介绍 计算平台架构 分 ...

最新文章

  1. jboss部署出现jboss.naming.context.java.rmi找不到错误
  2. 数据库报错1046-No database selected
  3. 5G NGC — AUSF 鉴权服务功能
  4. 弱类型、强类型、动态类型、静态类型语言的区别
  5. Jquery操作基本筛选过滤器
  6. 金融项目app服务器配置,云在金融的应用
  7. 数据挖掘之数理统计与常见分布与假设检验
  8. QT 透明 半透明 效果
  9. 我看TechEd 2012之App时代降临
  10. MySQL said: Authentication plugin 'caching_sha2_password' cannot be loaded...
  11. ps钢笔路径打不出字怎么解决?
  12. Web Dynpro for ABAP ( 四 ) BPM系统的连接
  13. 西北工业大学计算机转专业,2021年西北工业大学大一新生转专业及入学考试相关规定...
  14. 水环保网关在湿地保护有什么作用?
  15. JS运动从入门到兴奋1
  16. Web3赋能创作者经济:NFT,DAO和永续收入
  17. Flutter下MVVM——Bloc的探索
  18. Java线上CPU内存冲高问题排查步骤
  19. 【SqlServer系列】子查询
  20. Jieba分词工具介绍及相关API使用方法

热门文章

  1. 【非常详细】思科与华为设备命令对照表
  2. C语言实现判断素数的功能
  3. 一体化伺服电机在全自动玻璃切割机上应用简介
  4. PCOnline CPU 产品天梯图
  5. ubuntu ssh配置
  6. arduino JSON数据信息解析
  7. 那些年…一个文科男对理工男的逆袭,震惊了!
  8. Odoo | Docker开发环境部署(基于Odoo10)
  9. ZipArchive压缩文件,文件夹以及解压文件和文件夹
  10. Python任意累积