一种准确预测核糖核酸假尿苷位点的新方法

期刊:Briefings in Bioinformatics
链接:https://doi.org/10.1093/bib/bbab245

背景:

假尿苷是一种普遍存在于真核生物与原核生物中的核糖核苷酸修饰类型,在各种生物过程中起着至关重要的作用。几乎所用种类的核糖核酸都受到这种修饰,因此研究该位点极为重要。

结果:

作者提出了一种新的计算方法,该方法能够准确识别假尿苷位点。该方法基于对18种常用特征编码方式进行综合评估,最后采用其中4种特征作为本次模型的数据特征提取。

数据集

a):数据分为3个物种,分别为H.sapiens、S.cerevisiae、M.musculus。
b):其中H.sapiens是长度为21的RNA序列,且训练集样本数为990,独立验证集样本数为200。
c):S.cerevisiae是长度为31的RNA序列,训练集样本数为628,独立验证集样本数为200。
d):M.musculus没有独立验证集,只有训练集,其样本数为944。

为了进一步评估模型的性能,并将其与其他最先进的方法进行比较,作者从m6A-Atlas数据库中收集了另一个独立测试集数据库。该数据库包含:3137 H.sapiens,2702 M.musculus以及 733 S.cerevisiae。

方法

1:
对数据进行18种特种编码方式进行特征提取,并结合9种常用的机器学习算法对每种特征进行评估。

2:
通过基础分类齐的不同组合构建一系列堆叠集成学习模型,并伟三个物种种的每个模型进行优化。

3:
对现有的几张最先进的方法进行交叉验证和独立测试来全面评估优化堆叠模型。

4:网络服务器。

特征提取

作者采用了18种特征编码方式,并测试了其组合方案,其中包括:二元特征、自相关、互协方差、基于三核苷酸的自协方差、累计核苷酸频率等。。。
当然这些特征的提取都可采用开源iLearn和iLearnPlus软件包来计算:链接。
1:Binary feature
即onehot特征编码

2:Pseudo k-tuple composition (PseKNC)

3:Nucleotide chemical property
根据核苷酸有不同的化学结构和化学性质。根据其化学性质,四个核苷酸可以聚集成三个不同的组。

因此可编码为:A(1,1,1), C(0,1,0) , G (1,0,0), U(0,0,1) 。

4:Position-specific trinucleotide propensity based on single strand。

其中

即先计算出该矩阵中的Z,Z为不同的k元组在序列各个位置的频率所构建得来。F+,F-代表着训练集中正负样本。
构建完成后,要编码的序列,则可为一下公式:

一种准确预测核糖核酸假尿苷位点的新方法相关推荐

  1. 求解多变量非线性全局最优解_一种求解非线性约束优化全局最优的新方法

    一种求解非线性约束优化全局最优的新方法 刘子军,吕柏权,曹媛, (上海大学 机电工程与自动化学院  上海 200072) [摘要] 本文提出了一种求解非线性约束优化的全局最优的新方法-它是基于利用非线 ...

  2. python画二维温度云图_一种画二维温度场彩色云图的新方法

    一种画二维温度场彩色云图的新方法 刘永军 ; 李宏男 [摘 要] 介绍一种画二维温度场彩色云图的新方法 , 其特点是算法简单 , 结果精确 , 易于编程 . [期刊名称] <图学学报> [ ...

  3. 数学模型天气预测方法_预测即将到来的天气的新方法

    数学模型天气预测方法 By: Teja Balasubramanian 创建人:Teja Balasubramanian A new wave arises. Computer programming ...

  4. 一种快速生成边界交通场景数据的新方法

    西安交通大学人工智能与机器人研究所刘跃虎教授研究组最新研究成果,通过操纵真实道路场景中采集的激光点云,与彩色图像生成边界驾驶场景的多传感数据,经实验验证,数据可以用于丰富无人驾驶现有感知智能算法可靠性 ...

  5. 论文解读:《利用深度学习方法识别RNA伪尿苷位点》

    论文解读:<Identification of RNA pseudouridine sites using deep learning approaches> 1.文章概括 2.背景 3. ...

  6. matlab转子位置检测,一种基于反电势的永磁同步电机转子位置检测新方法

    2017年第9期信息通信2017 (总第177 期)INFORMATION & COMMUNICATIONS (Sum. N o 177)一种基于反电势的永磁同步电机转子位置检测新方法 王少坤 ...

  7. 计算机提取干涉条纹原理,两种提取Fabry-Perot干涉条纹圆心的新方法

    摘要本文介绍两种提取Fabry-Perot干涉条纹圆心点坐标的新方法.首先对干涉图像依次进行二值化处理,对所得到的条纹强度曲线进行均平滤波和自适应滤波,根据条纹灰度值强度余弦函数分布的特点,对条纹灰度 ...

  8. Staem5:一种精确预测m5C位点的新计算方法

    目录 介绍 结果 讨论 M5c 位点的核苷酸偏好 参数优化的有效性 建筑物整体模型处理 特征选择分析 与最先进的方法的性能比较 材料和方法 基准数据集 序列编码方案 堆叠集成学习框架 模型评估 实验环 ...

  9. TACOS:一种用于准确预测细胞特异性长的非编码RNA亚细胞定位的新方法

    <TACOS:一种用于准确预测细胞特异性长的非编码RNA亚细胞定位的新方法> <TACOS: a novel approach for accurate prediction of ...

最新文章

  1. ssl1759-求连通分量【图论,深搜,广搜】
  2. 重载和重写以及重写的权限问题
  3. python面试设计模式问题_聊聊 Python 面试最常被问到的几种设计模式(下)
  4. 玉米转座子插入型突变体”五折优惠
  5. 有道智云 php,调用有道智云API,自动翻译WORDPRESS标题为英文
  6. 由于这台计算机没有远程桌面客户端访问许可证,远程会话被中断
  7. ERROR CoarseGrainedExecutorBackend: RECEIVED SIGNAL TERM
  8. 2020扁皮筋排名_2020年高性价比弹弓推荐,(12月)弹弓选购攻略
  9. 【Hexo】Hexo搭建Butterfly主题并快速美化
  10. Matlab 主曲率、平均曲率、高斯曲率
  11. 2016 年度消费信贷建模小结
  12. Linux基础命令及用户相关操作
  13. 守望账号与服务器失去连接,win10玩守望先锋与服务器一直断开连接的解决方法...
  14. Python+我的世界=Mcpipy
  15. Sql serverx写外键关系(references)
  16. android微博签名错误,Android 微博登录“sso package or sign error” 错误解决方案
  17. RSA加密、解密、签名、验签介绍
  18. ARChon 分析之三:Native Client
  19. zzuli OJ 1043: 最大值
  20. Cinema 4D 第一节(CG及软件介绍)

热门文章

  1. 青奥项目的渡江战役哦 哈哈哈
  2. 家用计算机的辐射,家用电脑辐射多大
  3. Linux进程管理概述
  4. java 联系电话/证件号码脱敏处理
  5. 求100以内的奇数和偶数的和
  6. STM32单片机蓝牙APP手势语音温控电风扇落地扇人体感应
  7. html清空复选框的值,html,删除复选框选中的内容
  8. html时间转为时间截,字符串时间戳转换成时间
  9. 一看就会的Redist数据持久化之RDB
  10. 网格交易法策略优化-怎么选择合适的投资品种