2020.12.03丨全长转录组之基因和转录本鉴定
- 折叠转录本
- 分析目的:基于基因组比对结果,将相似的多转录本折叠成单个转录本(去冗余)
- PacBio分析软件:
- TAMA:https://github.com/GenomeRIK/tama
- TAMA简介
- TAMA(T ranscriptome A nnotation by M odular A lgorithms 是一款设计用于处理 Iso Seq 数据和其他长 reads 转录本数据,该软件 2019 年 在预印本在线期刊( bioRxiv )发表 。
Illuminating the dark side of the human transcriptome with TAMA Iso Seq analysis:https://www.biorxiv.org/content/10.1101/780015v1
- 三个主要应用:
- 1 TAMA Collapse (折叠冗余转录本
- 2 TAMA Merge
- 3 TAMA GO
- TAMA(T ranscriptome A nnotation by M odular A lgorithms 是一款设计用于处理 Iso Seq 数据和其他长 reads 转录本数据,该软件 2019 年 在预印本在线期刊( bioRxiv )发表 。
- 下载:
- git clone https://github.com/GenomeRIK/tama
- 安装:直接使用,无需编译
- 依赖环境:Python2、Biopython
- 使用命令:
- python /path-to-tama/tama_collapse.py -b BAM -s flnc.fasta.sorted.bam -f hg38.fa -x no_cap -e longest_ends -p isoform > tama.collapse.log
- 参数说明
- 结果展示
- 文件
- 正链基因,右边相同,左边折叠;负链基因,左边相同,右边折叠
- 文件
- TAMA简介
- cDNA_Cupcake:https://github.com/Magdoll/cDNA_Cupcake
- 简介:
- cDNA_Cupcake是用于分析测序数据的 Python 和 R 脚本的集合,主要用于 cDNA
- 典型应用:
- 1 折叠转录本;
- 2 合并多样本结果
- 3 饱和度曲线
- 4 鉴定融合基因
- 下载:
- git clone https://github.com/Magdoll/cDNA_Cupcake.git
- 安装:
- cd cDNA_Cupcake
- git checkout origin/Py2_v8.7.x
- python setup.py build
- python setup.py install
- 使用命令:
- python /path to cDNA_Cupcake/cupcake/tofu/collapse_isoforms_by_sam.py
- --input flnc.fasta s flnc.fasta.sorted.sam
- --min coverage 0.99 min identity 0.95
- --max_5_diff 1000 max_3_diff 100
- -o prefix
- 参数说明:
- 结果展示:
- 结果文件
- 结果文件
- 简介:
- TAMA:https://github.com/GenomeRIK/tama
- 基因/转录本鉴定
- SQANTI3:https://github.com/ConesaLab/SQANTI3
Corrigendum: SQANTI: extensive characterization of long read transcript sequences for quality control in full length transcriptome identification and quantification:https://genome.cshlp.org/content/28/7/1096- 简介:
- SQANTI3是SQANTI 工具(发布)的最新版本,该工具合并 SQANT 1 和 SQANTI2 中的功能并添加新的功能 ,用于全长转录本的深度表征 。
- 主要应用:
- 1 sqanti3_qc.py (执行转录本的深度表征
- 2 sqanti3_RulesFilter.py (基于机器学习算法过滤假阳性转录本
- 下载:
- git clone https://github.com/ConesaLab/SQANTI3.git
- 安装:
- 1 export PATH=$HOME/anacondaPy37/bin:$PATH
- 2 conda update conda
- 3 cd SQANTI3
- 4 conda env create f SQANTI3.conda_env.yml
- 5 wget http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/gtfToGenePred P
- 使用命令:
- ## step1: qc
- export PATH=/local_data1/rna_training/liwei/software/anaconda3/bin:$PATH
- export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/sequence/
- export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/
- source activate SQANTI3.env
- python /local_data1/rna_training/liwei/software/SQANTI3/sqanti3_qc.py
- test_chr13_seqs.fasta Homo_sapiens.GRCh38.86.chr13.gtf Homo_sapiens.GRCh38.dna.chromosome.13.fa
- --fl_count chr13_FL.abundances.txt -o Sample
- 参数说明
- ## step2: filter
- export PATH=/local_data1/rna_training/liwei/software/anaconda3/bin:$PATH
- export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/sequence/
- export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/
- source activate SQANTI3.env
- python /local_data1/rna_training/liwei/software/SQANTI3/sqanti3_RulesFilter.py
- Sample_classification.txt Sample_corrected.faa Sample_corrected.gtf
- 参数说明
- ## step1: qc
- 结果展示:
- 结果文件
https://github.com/ConesaLab/SQANTI3
- 结果文件
- 简介:
- TAPIS:https://bitbucket.org/comp_bio/tapis/src/master/(没有更新,存在bug不推荐)
- SQANTI3:https://github.com/ConesaLab/SQANTI3
- 实操分析
- SQANTI3测试数据(example文件夹)
- 文件
- 文件
- 补充:SQANTI3 sqanti3_qc.py )分析的第一个输入文件来源于 collapse 之后的结果( gmap.collapsed.rep.fa
- SQANTI3测试数据(example文件夹)
2020.12.03丨全长转录组之基因和转录本鉴定相关推荐
- 全长转录组之基因和转录本鉴定
折叠转录本 分析目的:基于基因组比对结果,将相似的多转录本折叠成单个转录本(去冗余) PacBio分析软件: TAMA:https://github.com/GenomeRIK/tama TAMA简介 ...
- 2020.8.26丨全长转录组测序产品概述
知识点梳理 全长转录组 测序发展史 测序原理 Sanger测序:毛细管电泳测序 illumina测序:制备文库.桥式PCR.可逆终止边合成边测序 SMRT测序:边合成边测序 二代拼接与组装 二代测序: ...
- 2020.10.08丨全长转录组之参考基因组比对
比对软件介绍 目的:定位Iso-Seq分析得到的全长转录本在基因组中的位置,从而得到转录本结构和可变剪切等信息. 推荐比对软件:GMAP,minimap2,deSALT 参考网址:https://gi ...
- 2020.12.10丨cufflinks 简介及使用说明
一. 简介 Cufflinks下主要包含cufflinks,cuffmerge,cuffcompare和cuffdiff等几支主要的程序.主要用于基因表达量的计算和差异表达基因的寻找. Cufflin ...
- TensorFlow GAN项目程序回顾2020.12.03
1.前言 GAN项目被我搁置一旁很久了,最近想回顾一下写过的程序,看看能不能发现一些错误或是从中得到一些新的灵感和启发. 2.程序回顾 废话不多说,直接上代码,我只挑一些比较重要的进行分析. Tens ...
- Leetcode 2020/12/03打卡 204计算质数(简单)
204. 计数质数 == 万一我侵犯了您的权利,联系我,我必删 统计所有小于非负整数 n 的质数的数量. 示例 1: 输入:n = 10 输出:4 解释:小于 10 的质数一共有 4 个, 它们是 2 ...
- 【2020.12.03提高组模拟】袋鼠
题目 题目描述 你知道吗?乌拉圭的人口有345.7万,同时,仅澳大利亚就有4700万只袋鼠. 袋鼠决定入侵乌拉圭.袋鼠们将在平原上布阵,平原被划分成 n×mn \times mn×m 的网格. 每个格 ...
- 掌握三代全长转录组测序,看这一篇就够了!
"三代转录组"是什么?对于混迹在科研领域的一员,如果现在还不了解全长转录组测序,恐怕都不好意思说自己了解高通量测序了呢! 今天小编总结了一些三代全长转录组测序的相关问题,给大家来一 ...
- 2020.8.28丨转录组、全转录组产品概述和应用方向
知识点梳理 转录调控是基因表达调控的一种重要方式 转录水平调控 翻译水平调控 翻译后水平调控 转录调控测序研究热点 RNA分类 转录组研究 概念 转录组(transcriptome): 特定组织或细胞 ...
最新文章
- 终于有人把 SpringBoot 项目的Http客户端工具说清楚了!
- LinkedHashMap 实现缓存(LRU、FIFO、weakhashMap)
- 引入父文件夹中的py文件(转)
- hci0 没反应_哄女朋友专用表情包~你说你没女朋友?先收藏着嘛,万一有了呢?...
- html自动播放音乐播放器代码,[界面设计] 关于HTML 音乐播放器代码|音乐播放器网页代码大全(转)...
- c语言gps经纬度转换程序,GPS经纬度坐标的转换
- 痛苦的挣扎--msp430g2553我恨你!
- Android半圆形进度条动画,Android:半圆形进度条
- python爬取京东商品图片_Python---爬取京东商城的图片
- 淘宝推荐最靠谱的补单平台排行榜
- 【WPS】WPS之如何给文件加密?
- MySQL数据库管理员用户密码忘记了怎么办?
- Python HackerRank 刷题 Maximum Subarray Sum
- Z3735d android x86,首款搭载Z3735处理器 神秘平板被曝光
- Gitlab如何创建项目和添加成员
- iOS13新特性-WWDC2019大会总结-ipadOS发布-SwiftUI重磅发布
- 计算机专业跨考会计,这几个专业适合跨考,考研的同学注意,会计学跨考人数最多...
- CP(Cyclic Prefix)循环前缀介绍
- libsodium引用报错FileNotFoundError: [Errno 2] No such file or directory: b‘liblibsodium.a‘
- python安装 pymssql 异常
热门文章
- 看样子偶得了肩周炎了~~
- 收藏一些很励志的东西,不想学习时来看一看
- 快速理解LAN、WAN的区别?
- c++ encode 函数_C++常用函数
- SwiftUI教程第1章第14节:Image-Basic
- 服装行业智能生产制造执行系统(MES)——RFID技术的应用
- 《Javaweb医院分诊挂号管理系统》计算机毕业设计|java毕业设计|课程设计|医院分诊|医院挂号系统|医院管理系统|免费查重
- 闪耀暖暖服务器维护,闪耀暖暖服务器进不去
- Informatica PowerCenter 简介(二)
- cmd如何打开某一盘符下的文件