RSeQC软件包提供了许多有用的模块,可以全面评估高通量序列数据,尤其是RNA序列数据。一些基本模块快速检查序列质量、核苷酸组成偏差、PCR偏差和GC偏差,而RNA序列特定模块评估测序饱和度、映射读取分布、覆盖均匀性、链特异性、转录水平RNA完整性等。

1. 安装

RSeQC是python包,有很多模块:

  • bam2fq.py
  • bam2wig.py
  • bam_stat.py
  • clipping_profile.py
  • deletion_profile.py
  • divide_bam.py
  • FPKM_count.py
  • geneBody_coverage.py
  • geneBody_coverage2.py
  • infer_experiment.py
  • inner_distance.py
  • insertion_profile.py
  • junction_annotation.py
  • junction_saturation.py
  • mismatch_profile.py
  • normalize_bigwig.py
  • overlay_bigwig.py
  • read_distribution.py
  • read_duplication.py
  • read_GC.py
  • read_hexamer.py
  • read_NVC.py
  • read_quality.py
  • RNA_fragment_size.py
  • RPKM_count.py
  • RPKM_saturation.py
  • spilt_bam.py
  • split_paired_bam.py
  • tin.py
pip install RSeQC

2. bam_stat.py:统计BAM/SAM文件的比对情况

bam_stat.py -i test_rna_seq.bam 

3. bam2fq.py: bam转fq

bam2fq.py -i test_rna_seq.bam  -o test_bam2fq_out

4. geneBody_coverage.py

#bed文件可以有gtf/gff文件转换而来。genomic features通常使用bed 或者gff文件表示,两者最基本的
#信息就是染色体或Contig的ID或编号、DNA的正负链信息以及在染色体上的起始和终止位置数值。两种文件的区#别在于,BED文件中起始坐标为0,结束坐标至少是1,GFF中起始坐标是1而结束坐标至少是1。把BED转成对应
#的GFF格式(仅保留两者相同信息)
# cat hg38.refGene.gtf|awk '{if ($3=="transcript") print $0}'>hg38.refTranscripts.gtf
# cat hg38.refGene.gtf|awk '{print $1,$4-1,$5-1,$12,$6,$7}'|tr -d ';' >hg38.bed# 下载基因model
# https://sourceforge.net/projects/rseqc/files/BED/Human_Homo_sapiens/# wget https://sourceforge.net/projects/rseqc/files/BED/Human_Homo_sapiens/hg38_RefSeq.bed.gz/ ./# 解压
gunzip hg38_RefSeq.bed.gz#注: 染色体编号要一致: 有的为 1 VS 有的为 chr1
# 下载的染色体编号以chr开头
sed -n 's/^chr//p' hg38_RefSeq.bed > hg38_RefSeq_2.bed  # 去除chr# 如果有多个bam文件
samtools test_merged_rna_seq.bam test1_rna_seq.bam test2_rna_seq.bam test3_rna_seq.bam
samtools sort test_merged_rna_seq.bam >test_merged_rna_seq.sorted.bam
samtools index test_merged_rna_seq.sorted.bamgeneBody_coverage.py -i test_merged_rna_seq.sorted.bam -r hg38_RefSeq_2.bed -o test_merged_geneBody_coverage
# 注:太慢了,有待改进! (多线程,启用c代码)

5. bam2wig.py: bam转wig

# 下载染色体大小文件
wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/fetchChromSizes
bash fetchChromSizes hg38 > hg38.chrom.sizes# 注:bam文件中染色体编号没有chr
sed -n 's/^chr//p' hg38.chrom.sizes > hg38.chrom.sizes_2  # 去除chr samtools sort test_rna_seq.bam > test_rna_seq.sort.bam
samtools index test_rna_seq.sort.bam
bam2wig.py -i test_rna_seq.sorted.bam -s hg38.chrom.sizes_2 -o TestOut -u
# -u, --skip-multi-hits## wig转二进制的BigWig
#wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/wigToBigWig
#chmod +x wigToBigWig
#./wigToBigWig TestOut.wig hg38.chrom.sizes_2 TestOutBigWig.bw##bedGraph 转 bigwig
#wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/bedGraphToBigWig#./bedGraphToBigWig in.bedGraph chrom.sizes out.bw

6. clipping_profile.py :计算截短核苷酸在读数上的分布

clipping_profile.py -i test_merged_rna_seq.sorted.bam -s "PE" -o out

7. inner_distance.py:计算reads对之间的内部距离

inner_distance.py -i test_merged_rna_seq.sorted.bam -o output -r hg38_RefSeq_2.bed

参考:
https://pythonhosted.org/RSeQC/#usage-information

https://cloud.tencent.com/developer/article/1771487?ivk_sa=1024320u

RNA-Seq质控工具RseQC安装使用相关推荐

  1. 一文掌握RNA seq,RNA seq课程大汇总

    RNA测序(RNA-seq)在过往十年里逐渐成为全转录组水平分析差异基因表达和研究mRNA差异剪接必不可少的工具.RNA-seq帮助大家对RNA生物学的理解会越来越全面:从转录本在何时何地转录到RNA ...

  2. mysql 物理备份工具_mysql物理备份工具Xtrabackup安装配置

    mysql物理备份工具Xtrabackup安装配置 1Xtrabackup工具介绍 Xtrabackup是一个对InnoDB做物理数据备份的工具,支持在线热备份(备份时不影响数据读写),是商业备份工具 ...

  3. Xamarin.Form的Android SDK工具下载安装

    Xamarin.Form的Android SDK工具下载安装 本节将讲解如何下载Xamarin.Form的Android SDK工具,并使用其中的工具管理Android SDK,如何创建模拟器等内容. ...

  4. 虚拟机增强工具的安装

    虚拟机增强工具的安装 一.安装目的 1.实现界面平铺 2.实现虚拟机和物理机的交互 3.实现文本的粘贴复制,不过不能够直接把物理机上的文件直接拖到界面,而是要指定位置. 二.安装步骤 接着打开终端,用 ...

  5. 通过GPG非对称加密工具验证ECharts发布版本实例演示,win10下Gnu Privacy Guard工具的安装和使用方法

    GPG 验证 ECharts 发布版本实例演示 第一章:Gpg 工具的安装 ① Gpg 工具的下载 ② Gpg windows 版 Gpg4win 的安装 ③ Gpg 安装是否成功状态检测 第二章:使 ...

  6. Jupyter 工具的安装与使用方法,jupyter运行python代码演示,好用的python编辑器推荐!

    Jupyter 工具的安装与使用 第一章:环境搭建 ① Jupyter 工具的安装 ② Jupyter 服务的启动 ③ Python 代码运行演示 第二章:详细过程展示 ① Jupyter 详细安装过 ...

  7. php性能测试下载,PHP性能测试工具xhprof安装与使用方法详解

    本文实例分析了PHP性能测试工具xhprof安装与使用方法.分享给大家供大家参考,具体如下: xhprof概述: XHProf是一个分层PHP性能分析工具.它报告函数级别的请求次数和各种指标,包括阻塞 ...

  8. Xamarin.Forms教程Android SDK工具下载安装

    Xamarin.Form的Android SDK工具下载安装 本节将讲解如何下载Xamarin.Form的Android SDK工具,并使用其中的工具管理Android SDK,如何创建模拟器等内容. ...

  9. [原创] debian 9.3 搭建Jira+Confluence+Bitbucket项目管理工具(四) -- 安装bitbucket 5.7.0

    [原创] debian 9.3 搭建Jira+Confluence+Bitbucket项目管理工具(四) -- 安装bitbucket 5.7.0 安装Bitbucket的教程, 网上能找见的不多, ...

最新文章

  1. Windows Server vNext Technical Preview UI Build 9841
  2. Oracle imp导入数据
  3. 孟晚舟升任华为轮值董事长,任正非曾表态:她无技术背景,不会成为接班人...
  4. 数据中心网络架构 — 云网一体化数据中心网络 — 算力网络 — SDN 架构
  5. 信号、系统与滤波器设计(matlab)
  6. python 如何计算代码块运行(执行)时间?time() time.time() time.clock() 区别
  7. WPF 3D:使用GeometryModel3D的BackMaterial
  8. C语言实现的简单的线程池
  9. MongoDB 定位 oplog 必须全表扫描吗?
  10. linux配置apache2
  11. python tornado高并发_tornado IO并发真的很高么?
  12. UVA10701 Pre, in and post【二叉树遍历】
  13. maven新建的项目,不自动引入依赖包
  14. 100个2022实用微信小程序源码分享
  15. 汇编环境搭建 Windows10 VS2019 MASM32
  16. 智慧农业:各省市粮食产量排名,“鱼米之乡”湖南位居第十
  17. 计算机教师成绩分析总结与反思,小学教师成绩分析总结与反思
  18. 关于Negative values in data passed to MultinomialNB (input X)报错问题
  19. 2329: 小新同学爱加密
  20. EBUSY: resource busy or locked, symlink

热门文章

  1. 吉他“和弦”是什么?
  2. sklearn+机器学习
  3. html+css实现京东、英雄联盟静态页面
  4. eclipse项目类型的转换
  5. cuda安装以及conda安装对应版本的pytorch-gpu
  6. SSD制作自己的数据集
  7. 神州战神系列装系统过程,其他电脑大同小异
  8. Python Png转格式为Pdf。
  9. Qt5:报错error: ‘tr‘ was not declared in this scop
  10. python生成快递取件码没了怎么办_货到速递易,但没有收到取件码,怎么办