RNA-Seq质控工具RseQC安装使用
RSeQC软件包提供了许多有用的模块,可以全面评估高通量序列数据,尤其是RNA序列数据。一些基本模块快速检查序列质量、核苷酸组成偏差、PCR偏差和GC偏差,而RNA序列特定模块评估测序饱和度、映射读取分布、覆盖均匀性、链特异性、转录水平RNA完整性等。
1. 安装
RSeQC是python包,有很多模块:
- bam2fq.py
- bam2wig.py
- bam_stat.py
- clipping_profile.py
- deletion_profile.py
- divide_bam.py
- FPKM_count.py
- geneBody_coverage.py
- geneBody_coverage2.py
- infer_experiment.py
- inner_distance.py
- insertion_profile.py
- junction_annotation.py
- junction_saturation.py
- mismatch_profile.py
- normalize_bigwig.py
- overlay_bigwig.py
- read_distribution.py
- read_duplication.py
- read_GC.py
- read_hexamer.py
- read_NVC.py
- read_quality.py
- RNA_fragment_size.py
- RPKM_count.py
- RPKM_saturation.py
- spilt_bam.py
- split_paired_bam.py
- tin.py
pip install RSeQC
2. bam_stat.py:统计BAM/SAM文件的比对情况
bam_stat.py -i test_rna_seq.bam
3. bam2fq.py: bam转fq
bam2fq.py -i test_rna_seq.bam -o test_bam2fq_out
4. geneBody_coverage.py
#bed文件可以有gtf/gff文件转换而来。genomic features通常使用bed 或者gff文件表示,两者最基本的
#信息就是染色体或Contig的ID或编号、DNA的正负链信息以及在染色体上的起始和终止位置数值。两种文件的区#别在于,BED文件中起始坐标为0,结束坐标至少是1,GFF中起始坐标是1而结束坐标至少是1。把BED转成对应
#的GFF格式(仅保留两者相同信息)
# cat hg38.refGene.gtf|awk '{if ($3=="transcript") print $0}'>hg38.refTranscripts.gtf
# cat hg38.refGene.gtf|awk '{print $1,$4-1,$5-1,$12,$6,$7}'|tr -d ';' >hg38.bed# 下载基因model
# https://sourceforge.net/projects/rseqc/files/BED/Human_Homo_sapiens/# wget https://sourceforge.net/projects/rseqc/files/BED/Human_Homo_sapiens/hg38_RefSeq.bed.gz/ ./# 解压
gunzip hg38_RefSeq.bed.gz#注: 染色体编号要一致: 有的为 1 VS 有的为 chr1
# 下载的染色体编号以chr开头
sed -n 's/^chr//p' hg38_RefSeq.bed > hg38_RefSeq_2.bed # 去除chr# 如果有多个bam文件
samtools test_merged_rna_seq.bam test1_rna_seq.bam test2_rna_seq.bam test3_rna_seq.bam
samtools sort test_merged_rna_seq.bam >test_merged_rna_seq.sorted.bam
samtools index test_merged_rna_seq.sorted.bamgeneBody_coverage.py -i test_merged_rna_seq.sorted.bam -r hg38_RefSeq_2.bed -o test_merged_geneBody_coverage
# 注:太慢了,有待改进! (多线程,启用c代码)
5. bam2wig.py: bam转wig
# 下载染色体大小文件
wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/fetchChromSizes
bash fetchChromSizes hg38 > hg38.chrom.sizes# 注:bam文件中染色体编号没有chr
sed -n 's/^chr//p' hg38.chrom.sizes > hg38.chrom.sizes_2 # 去除chr samtools sort test_rna_seq.bam > test_rna_seq.sort.bam
samtools index test_rna_seq.sort.bam
bam2wig.py -i test_rna_seq.sorted.bam -s hg38.chrom.sizes_2 -o TestOut -u
# -u, --skip-multi-hits## wig转二进制的BigWig
#wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/wigToBigWig
#chmod +x wigToBigWig
#./wigToBigWig TestOut.wig hg38.chrom.sizes_2 TestOutBigWig.bw##bedGraph 转 bigwig
#wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/bedGraphToBigWig#./bedGraphToBigWig in.bedGraph chrom.sizes out.bw
6. clipping_profile.py :计算截短核苷酸在读数上的分布
clipping_profile.py -i test_merged_rna_seq.sorted.bam -s "PE" -o out
7. inner_distance.py:计算reads对之间的内部距离
inner_distance.py -i test_merged_rna_seq.sorted.bam -o output -r hg38_RefSeq_2.bed
参考:
https://pythonhosted.org/RSeQC/#usage-information
https://cloud.tencent.com/developer/article/1771487?ivk_sa=1024320u
RNA-Seq质控工具RseQC安装使用相关推荐
- 一文掌握RNA seq,RNA seq课程大汇总
RNA测序(RNA-seq)在过往十年里逐渐成为全转录组水平分析差异基因表达和研究mRNA差异剪接必不可少的工具.RNA-seq帮助大家对RNA生物学的理解会越来越全面:从转录本在何时何地转录到RNA ...
- mysql 物理备份工具_mysql物理备份工具Xtrabackup安装配置
mysql物理备份工具Xtrabackup安装配置 1Xtrabackup工具介绍 Xtrabackup是一个对InnoDB做物理数据备份的工具,支持在线热备份(备份时不影响数据读写),是商业备份工具 ...
- Xamarin.Form的Android SDK工具下载安装
Xamarin.Form的Android SDK工具下载安装 本节将讲解如何下载Xamarin.Form的Android SDK工具,并使用其中的工具管理Android SDK,如何创建模拟器等内容. ...
- 虚拟机增强工具的安装
虚拟机增强工具的安装 一.安装目的 1.实现界面平铺 2.实现虚拟机和物理机的交互 3.实现文本的粘贴复制,不过不能够直接把物理机上的文件直接拖到界面,而是要指定位置. 二.安装步骤 接着打开终端,用 ...
- 通过GPG非对称加密工具验证ECharts发布版本实例演示,win10下Gnu Privacy Guard工具的安装和使用方法
GPG 验证 ECharts 发布版本实例演示 第一章:Gpg 工具的安装 ① Gpg 工具的下载 ② Gpg windows 版 Gpg4win 的安装 ③ Gpg 安装是否成功状态检测 第二章:使 ...
- Jupyter 工具的安装与使用方法,jupyter运行python代码演示,好用的python编辑器推荐!
Jupyter 工具的安装与使用 第一章:环境搭建 ① Jupyter 工具的安装 ② Jupyter 服务的启动 ③ Python 代码运行演示 第二章:详细过程展示 ① Jupyter 详细安装过 ...
- php性能测试下载,PHP性能测试工具xhprof安装与使用方法详解
本文实例分析了PHP性能测试工具xhprof安装与使用方法.分享给大家供大家参考,具体如下: xhprof概述: XHProf是一个分层PHP性能分析工具.它报告函数级别的请求次数和各种指标,包括阻塞 ...
- Xamarin.Forms教程Android SDK工具下载安装
Xamarin.Form的Android SDK工具下载安装 本节将讲解如何下载Xamarin.Form的Android SDK工具,并使用其中的工具管理Android SDK,如何创建模拟器等内容. ...
- [原创] debian 9.3 搭建Jira+Confluence+Bitbucket项目管理工具(四) -- 安装bitbucket 5.7.0
[原创] debian 9.3 搭建Jira+Confluence+Bitbucket项目管理工具(四) -- 安装bitbucket 5.7.0 安装Bitbucket的教程, 网上能找见的不多, ...
最新文章
- Windows Server vNext Technical Preview UI Build 9841
- Oracle imp导入数据
- 孟晚舟升任华为轮值董事长,任正非曾表态:她无技术背景,不会成为接班人...
- 数据中心网络架构 — 云网一体化数据中心网络 — 算力网络 — SDN 架构
- 信号、系统与滤波器设计(matlab)
- python 如何计算代码块运行(执行)时间?time() time.time() time.clock() 区别
- WPF 3D:使用GeometryModel3D的BackMaterial
- C语言实现的简单的线程池
- MongoDB 定位 oplog 必须全表扫描吗?
- linux配置apache2
- python tornado高并发_tornado IO并发真的很高么?
- UVA10701 Pre, in and post【二叉树遍历】
- maven新建的项目,不自动引入依赖包
- 100个2022实用微信小程序源码分享
- 汇编环境搭建 Windows10 VS2019 MASM32
- 智慧农业:各省市粮食产量排名,“鱼米之乡”湖南位居第十
- 计算机教师成绩分析总结与反思,小学教师成绩分析总结与反思
- 关于Negative values in data passed to MultinomialNB (input X)报错问题
- 2329: 小新同学爱加密
- EBUSY: resource busy or locked, symlink
热门文章
- 吉他“和弦”是什么?
- sklearn+机器学习
- html+css实现京东、英雄联盟静态页面
- eclipse项目类型的转换
- cuda安装以及conda安装对应版本的pytorch-gpu
- SSD制作自己的数据集
- 神州战神系列装系统过程,其他电脑大同小异
- Python Png转格式为Pdf。
- Qt5:报错error: ‘tr‘ was not declared in this scop
- python生成快递取件码没了怎么办_货到速递易,但没有收到取件码,怎么办