• 折叠转录本

    • 分析目的:基于基因组比对结果,将相似的多转录本折叠成单个转录本(去冗余)
    • PacBio分析软件:

      • TAMA:https://github.com/GenomeRIK/tama

        • TAMA简介

          • TAMA(T ranscriptome A nnotation by M odular A lgorithms 是一款设计用于处理 Iso Seq 数据和其他长 reads 转录本数据,该软件 2019 年 在预印本在线期刊( bioRxiv )发表 。
            Illuminating the dark side of the human transcriptome with TAMA Iso Seq analysis:https://www.biorxiv.org/content/10.1101/780015v1
          • 三个主要应用:

            • 1 TAMA Collapse (折叠冗余转录本
            • 2 TAMA Merge
            • 3 TAMA GO
        • 下载:

          • git clone https://github.com/GenomeRIK/tama
        • 安装:直接使用,无需编译
        • 依赖环境:Python2、Biopython
        • 使用命令:

          • python /path-to-tama/tama_collapse.py -b BAM -s flnc.fasta.sorted.bam -f hg38.fa -x no_cap -e longest_ends -p isoform > tama.collapse.log
          • 参数说明
        • 结果展示

          • 文件
          • 正链基因,右边相同,左边折叠;负链基因,左边相同,右边折叠
      • cDNA_Cupcake:https://github.com/Magdoll/cDNA_Cupcake

        • 简介:

          • cDNA_Cupcake是用于分析测序数据的 Python 和 R 脚本的集合,主要用于 cDNA
          • 典型应用:

            • 1 折叠转录本;
            • 2 合并多样本结果
            • 3 饱和度曲线
            • 4 鉴定融合基因
        • 下载:

          • git clone https://github.com/Magdoll/cDNA_Cupcake.git
        • 安装:

          • cd cDNA_Cupcake
          • git checkout origin/Py2_v8.7.x
          • python setup.py build
          • python setup.py install
        • 使用命令:

          • python /path to cDNA_Cupcake/cupcake/tofu/collapse_isoforms_by_sam.py
          • --input flnc.fasta s flnc.fasta.sorted.sam
          • --min coverage 0.99 min identity 0.95
          • --max_5_diff 1000 max_3_diff 100
          • -o prefix
          • 参数说明:

        • 结果展示:

          • 结果文件
  • 基因/转录本鉴定
    • SQANTI3:https://github.com/ConesaLab/SQANTI3
      Corrigendum: SQANTI: extensive characterization of long read transcript sequences for quality control in full length transcriptome identification and quantification:https://genome.cshlp.org/content/28/7/1096

      • 简介:

        • SQANTI3是SQANTI 工具(发布)的最新版本,该工具合并 SQANT 1 和 SQANTI2 中的功能并添加新的功能 ,用于全长转录本的深度表征 。
        • 主要应用:

          • 1 sqanti3_qc.py (执行转录本的深度表征
          • 2 sqanti3_RulesFilter.py (基于机器学习算法过滤假阳性转录本
      • 下载:

        • git clone https://github.com/ConesaLab/SQANTI3.git
      • 安装:

        • 1 export PATH=$HOME/anacondaPy37/bin:$PATH
        • 2 conda update conda
        • 3 cd SQANTI3
        • 4 conda env create f SQANTI3.conda_env.yml
        • 5 wget http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/gtfToGenePred P
      • 使用命令:

        • ## step1: qc

          • export PATH=/local_data1/rna_training/liwei/software/anaconda3/bin:$PATH
          • export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/sequence/
          • export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/
          • source activate SQANTI3.env
          • python /local_data1/rna_training/liwei/software/SQANTI3/sqanti3_qc.py
          • test_chr13_seqs.fasta Homo_sapiens.GRCh38.86.chr13.gtf Homo_sapiens.GRCh38.dna.chromosome.13.fa
          • --fl_count chr13_FL.abundances.txt -o Sample
          • 参数说明

        • ## step2: filter

          • export PATH=/local_data1/rna_training/liwei/software/anaconda3/bin:$PATH
          • export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/sequence/
          • export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/
          • source activate SQANTI3.env
          • python /local_data1/rna_training/liwei/software/SQANTI3/sqanti3_RulesFilter.py
          • Sample_classification.txt Sample_corrected.faa Sample_corrected.gtf
          • 参数说明
      • 结果展示:

        • 结果文件
          https://github.com/ConesaLab/SQANTI3
    • TAPIS:https://bitbucket.org/comp_bio/tapis/src/master/(没有更新,存在bug不推荐)
  • 实操分析
    • SQANTI3测试数据(example文件夹)

      • 文件
    • 补充:SQANTI3 sqanti3_qc.py )分析的第一个输入文件来源于 collapse 之后的结果( gmap.collapsed.rep.fa

2020.12.03丨全长转录组之基因和转录本鉴定相关推荐

  1. 全长转录组之基因和转录本鉴定

    折叠转录本 分析目的:基于基因组比对结果,将相似的多转录本折叠成单个转录本(去冗余) PacBio分析软件: TAMA:https://github.com/GenomeRIK/tama TAMA简介 ...

  2. 2020.8.26丨全长转录组测序产品概述

    知识点梳理 全长转录组 测序发展史 测序原理 Sanger测序:毛细管电泳测序 illumina测序:制备文库.桥式PCR.可逆终止边合成边测序 SMRT测序:边合成边测序 二代拼接与组装 二代测序: ...

  3. 2020.10.08丨全长转录组之参考基因组比对

    比对软件介绍 目的:定位Iso-Seq分析得到的全长转录本在基因组中的位置,从而得到转录本结构和可变剪切等信息. 推荐比对软件:GMAP,minimap2,deSALT 参考网址:https://gi ...

  4. 2020.12.10丨cufflinks 简介及使用说明

    一. 简介 Cufflinks下主要包含cufflinks,cuffmerge,cuffcompare和cuffdiff等几支主要的程序.主要用于基因表达量的计算和差异表达基因的寻找. Cufflin ...

  5. TensorFlow GAN项目程序回顾2020.12.03

    1.前言 GAN项目被我搁置一旁很久了,最近想回顾一下写过的程序,看看能不能发现一些错误或是从中得到一些新的灵感和启发. 2.程序回顾 废话不多说,直接上代码,我只挑一些比较重要的进行分析. Tens ...

  6. Leetcode 2020/12/03打卡 204计算质数(简单)

    204. 计数质数 == 万一我侵犯了您的权利,联系我,我必删 统计所有小于非负整数 n 的质数的数量. 示例 1: 输入:n = 10 输出:4 解释:小于 10 的质数一共有 4 个, 它们是 2 ...

  7. 【2020.12.03提高组模拟】袋鼠

    题目 题目描述 你知道吗?乌拉圭的人口有345.7万,同时,仅澳大利亚就有4700万只袋鼠. 袋鼠决定入侵乌拉圭.袋鼠们将在平原上布阵,平原被划分成 n×mn \times mn×m 的网格. 每个格 ...

  8. 掌握三代全长转录组测序,看这一篇就够了!

    "三代转录组"是什么?对于混迹在科研领域的一员,如果现在还不了解全长转录组测序,恐怕都不好意思说自己了解高通量测序了呢! 今天小编总结了一些三代全长转录组测序的相关问题,给大家来一 ...

  9. 2020.8.28丨转录组、全转录组产品概述和应用方向

    知识点梳理 转录调控是基因表达调控的一种重要方式 转录水平调控 翻译水平调控 翻译后水平调控 转录调控测序研究热点 RNA分类 转录组研究 概念 转录组(transcriptome): 特定组织或细胞 ...

最新文章

  1. 终于有人把 SpringBoot 项目的Http客户端工具说清楚了!
  2. LinkedHashMap 实现缓存(LRU、FIFO、weakhashMap)
  3. 引入父文件夹中的py文件(转)
  4. hci0 没反应_哄女朋友专用表情包~你说你没女朋友?先收藏着嘛,万一有了呢?...
  5. html自动播放音乐播放器代码,[界面设计] 关于HTML 音乐播放器代码|音乐播放器网页代码大全(转)...
  6. c语言gps经纬度转换程序,GPS经纬度坐标的转换
  7. 痛苦的挣扎--msp430g2553我恨你!
  8. Android半圆形进度条动画,Android:半圆形进度条
  9. python爬取京东商品图片_Python---爬取京东商城的图片
  10. 淘宝推荐最靠谱的补单平台排行榜
  11. 【WPS】WPS之如何给文件加密?
  12. MySQL数据库管理员用户密码忘记了怎么办?
  13. Python HackerRank 刷题 Maximum Subarray Sum
  14. Z3735d android x86,首款搭载Z3735处理器 神秘平板被曝光
  15. Gitlab如何创建项目和添加成员
  16. iOS13新特性-WWDC2019大会总结-ipadOS发布-SwiftUI重磅发布
  17. 计算机专业跨考会计,这几个专业适合跨考,考研的同学注意,会计学跨考人数最多...
  18. CP(Cyclic Prefix)循环前缀介绍
  19. libsodium引用报错FileNotFoundError: [Errno 2] No such file or directory: b‘liblibsodium.a‘
  20. python安装 pymssql 异常

热门文章

  1. 看样子偶得了肩周炎了~~
  2. 收藏一些很励志的东西,不想学习时来看一看
  3. 快速理解LAN、WAN的区别?
  4. c++ encode 函数_C++常用函数
  5. SwiftUI教程第1章第14节:Image-Basic
  6. 服装行业智能生产制造执行系统(MES)——RFID技术的应用
  7. 《Javaweb医院分诊挂号管理系统》计算机毕业设计|java毕业设计|课程设计|医院分诊|医院挂号系统|医院管理系统|免费查重
  8. 闪耀暖暖服务器维护,闪耀暖暖服务器进不去
  9. Informatica PowerCenter 简介(二)
  10. cmd如何打开某一盘符下的文件