Title:ctP2ISP: Protein–Protein Interaction Sites Prediction Using Convolution and Transformer with Data Augmentation

期刊:IEEE-ACM Transactions on Computational Biology and Bioinformatics

代码和数据集: GitHub - lennylv/ctP2ISP: The source code and datasets of paper 'ctP2ISP: Protein-protein interaction sites prediction using convolution and transformer with data augmentation'

一、摘要

蛋白质-蛋白质相互作用是许多细胞生物学过程的基础,如细胞组织、信号转导和免疫反应。识别蛋白质-蛋白质相互作用位点对于理解各种生物过程、疾病发展和药物设计的机制至关重要。然而,做出准确预测仍然是一项具有挑战性的任务,因为少量的训练数据和严重的不平衡分类降低了计算方法的性能。我们设计了一个名为ctP2ISP的深度学习方法,以提高蛋白质-蛋白质相互作用位点的预测。ctP2ISP采用卷积和变换来提取信息和增强信息感知,以便可以挖掘语义特征来识别蛋白质-蛋白质相互作用位点。设计了具有不同样本权重的加权损失函数,以抑制模型对多类别预测的偏好。为了有效地重用训练集中的信息,应用了具有改进的面向样本的采样策略的数据扩充的预处理。在六个公共数据集上,对照当前最先进的方法对训练的ctP2ISP进行评估。结果表明,ctP2ISP在平衡指标上优于所有其他竞争方法:F1、MCC和AUPRC。特别是,我们对与病毒相关的开放测试的预测也可能与生物学的见解一致。

二、方法与数据集

所描述的问题:从计算的角度来看,ctP2ISP可以描述为以下问题:给定蛋白质的氨基酸序列s,找出M(s)映射到L的最佳M,L是标记s的每个氨基酸的0/1标志序列,用1表示结合残基,否则用0表示。要将机器学习框架应用于ctP2ISP,应该编译训练集,从已知的蛋白质复合物结构中收集s及其对应的L。通过使用机器学习技术对M进行适当的设计,可以训练最终的M来预测训练集之外的蛋白质的Ls。

数据集:通用训练和测试集

6个公共数据集:Dset_186、Dset_72、Dset_164、Dset_448、Dset_355和Dset_70

测试集:Tset_9982。随机选择Tset_9982的九分之八(8872)和九分之一(1110)分别作为我们的训练集和验证集。

流程图

三、结果

ctP2ISP:使用卷积和数据增强的转换器预测蛋白质-蛋白质相互作用位点相关推荐

  1. 数据增强:具有自预测表示的数据高效强化学习

    题目:Data-Efficient Reinforcement Learning with Self-Predictive Representations 出处:International Confe ...

  2. 是你的数据还不够强!谷歌大脑「数据增强」开源,大神QuocLe出品

    你的数据还不够强. 玩深度学习的人都知道,AI算法大部分是数据驱动.数据的质量一定程度上决定了模型的好坏. 这就有了深度学习天生的一个短板:数据不够多.不够好. 而数据增强就是解决这一问题的有效办法. ...

  3. 谷歌大脑开源「数据增强」新招数:ImageNet准确率达85%,大神Quoc Le出品

    十三 发自 凹非寺  量子位 报道 | 公众号 QbitAI 你的数据还不够强. 玩深度学习的人都知道,AI算法大部分是数据驱动.数据的质量一定程度上决定了模型的好坏. 这就有了深度学习天生的一个短板 ...

  4. DL之AlexNet:利用卷积神经网络类AlexNet实现猫狗分类识别(图片数据增强→保存h5模型)

    DL之AlexNet:利用卷积神经网络类AlexNet实现猫狗分类识别(图片数据增强→保存h5模型) 目录 利用卷积神经网络类AlexNet实现猫狗分类识别(图片数据增强→保存h5模型) 设计思路 处 ...

  5. [DeeplearningAI笔记]卷积神经网络2.9-2.10迁移学习与数据增强

    4.2深度卷积网络 觉得有用的话,欢迎一起讨论相互学习~Follow Me 2.9迁移学习 迁移学习的基础知识已经介绍过,本篇博文将介绍提高的部分. 提高迁移学习的速度 可以将迁移学习模型冻结的部分看 ...

  6. 基于Keras的卷积神经网络用于猫狗分类(进行了数据增强)+卷积层可视化

    接着我上一篇博客,https://blog.csdn.net/fanzonghao/article/details/81149153. 在上一篇基础上对数据集进行数据增强.函数如下: "&q ...

  7. 使用卷积神经网络(普通CNN和改进型LeNet)以及数据增强和迁移学习技巧识别猫和狗,并制作成分类器软件(基于Keras)

    数据集:https://www.microsoft.com/en-us/download/confirmation.aspx?id=54765 猫和狗的图片各自有12500张. 第一步 整理数据集,查 ...

  8. 数据增强在卷积神经网络中的应用

    这一篇博客主要讨论在用卷积神经网络进行图像识别或者目标检测时的数据增强手段,并讨论其作用. 首先整理两篇比较有代表性的论文里的数据增强,再说说我自己工作中使用的数据增强,最后讨论这些数据增强的意义(我 ...

  9. 一维卷积神经网络直接读取mat文件并进行数据增强和归一化

    众多师弟师妹在使用一维卷积神经网络对凯斯西储,哥伦比亚等大学开源的轴承故障数据集进行故障诊断时,不知道该怎么把Matlab文件中的数据直接导进伸进网络进行训练.我之前也不会,我一直用matlab打开数 ...

最新文章

  1. POI处理Excel中的日期数据类型
  2. 汇总|精选CVPR开源项目学习资源
  3. php 按钮状态,RPi GPIO状态更新为php按钮和脚本
  4. JUnit单元测试--IntelliJ IDEA
  5. vue写进html,vue中html页面写入$t(‘’)怎么显示
  6. CORS 请求未能成功_当遇到跨域开发时, 我们如何处理好前后端配置和请求库封装(koa/axios版)...
  7. WinSock I/O 模型 -- WSAAsyncSelect 模型
  8. MVC3教程之实体模型和EF CodeFirst
  9. map函数作用c语言,C语言 · C++中map的用法详解
  10. java 去除jsonarray里面jsonarray的重复和合并数据
  11. 王学丹 确定测试原始需求
  12. 从鸽笼原理到拉姆塞数
  13. 通过定制控制在屏幕上显示图片
  14. python 反弹shell,加了UDP
  15. Shp上传至Oracle Spatial
  16. Python基础入门篇【26】--python基础入门练习卷B
  17. 数据库原理与应用第三版何玉洁第二章课后题答案
  18. 不是有效的win32应用程序
  19. gradient设置上下渐变_CSS3,线性渐变(linear-gradient)的使用总结
  20. jqwidgets技术分享

热门文章

  1. flex osgi实现-potomac 实现页面与页面间数据传递和页面间各部分的数据传递
  2. Promise.resolve几种情况
  3. 微信公众平台基础开发
  4. 谈谈Android里的Context的使用!!!
  5. 火狐Firefox最简洁界面设置
  6. 关于大数据技术的演讲_2020年大数据技术应用趋势与当前大数据技术实践反思...
  7. PLC通讯实现-C#实现汇川PLC-AM401以太网通讯ModBus TCP
  8. 英语名篇——关于《论学习》的读后感
  9. c语言企业自动化管理系统,基于C语言制作的人事管理系统-自动化毕业论文.doc...
  10. cad图片边框怎么去掉