使用MACS2进行差异peak分析
欢迎关注”生信修炼手册”!
MACS2作为使用最广泛的peak calling软件,在v2版本中添加了差异peak分析的功能,所有的子命令功能描述如下
通过bdgdiff
子命令来进行差异peak分析, 该命令不需要基于已有的peak calling结果,只需要输入每个样本对应的bedGraph格式的文件。需要注意的是,该命令只针对两个样本间的差异peak进行设计,适用于没有生物学重复的情况。
对于使用macs2来进行差异peak的完整流程,官方给出了详细的说明文档,链接如下
https://github.com/taoliu/MACS/wiki/Call-differential-binding-events
可以分为以下3步
1. 预测插入片段长度
通过predictd
子命令可以预测样本的fragment size,命令如下
macs2 predictd -i input.bam
2. peak calling
在peak calling时,需要添加-B
参数,这样才可以输出样本对应的bedgraph文件,同时需要保证peak calling时采用一致的--extsize
的值,就是第一步预测出来的数值,取多个样本的均值即可。官方也给出了推荐值,对于大多数的转录因子chip_seq数据,推荐值为200, 对于大部分组蛋白修饰的chip_seq数据,推荐值为147,命令如下
# condition1
macs2 callpeak -B -t cond1_ChIP.bam -c cond1_Control.bam -n cond1 --nomodel --extsize 120
# condition2
macs2 callpeak -B -t cond1_ChIP.bam -c cond1_Control.bam -n cond1 --nomodel --extsize 120
在运行这一步的时候,会输出每个样本过滤之后的reads数目,示意如下
# tags after filtering in treatment: 19291269
# tags after filtering in control: 12914669
这个数值在差异分析中会用到,所以要记录下来。
3. 差异peak分析
命令如下
macs2 bdgdiff --t1 cond1_treat_pileup.bdg --c1 cond1_control_lambda.bdg --t2 cond2_treat_pileup.bdg \
--c2 cond2_control_lambda.bdg --d1 12914669 --d2 14444786 -g 60 -l 120 --o-prefix diff_c1_vs_c2
其中-d1
和-d2
的值就是第二步运行时输出的reads数目,-o
参数指定输出文件的前缀。运行成功后,会产生3个文件
diff_c1_vs_c2_c3.0_cond1.bed
diff_c1_vs_c2_c3.0_cond2.bed
diff_c1_vs_c2_c3.0_common.bed
其中, con1.bed保存了在condition1中上调的peak, con2.bed保存了在condition2中上调的peak, common.bed文件中保存的是没有达到阈值的,非显著差异peak。
上述3个文件格式是完全相同的,最后一列的内容为log10 likehood ratio值,用来衡量两个条件之间的差异,默认阈值为3,大于阈值的peak为组间差异显著的peak, 这个阈值可以通过-c
参数进行调整。
·end·
—如果喜欢,快分享给你的朋友们吧—
原创不易,欢迎收藏,点赞,转发!生信知识浩瀚如海,在生信学习的道路上,让我们一起并肩作战!
本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于提供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。
更多精彩
KEGG数据库,除了pathway你还知道哪些
全网最完整的circos中文教程
DNA甲基化数据分析专题
突变检测数据分析专题
mRNA数据分析专题
lncRNA数据分析专题
circRNA数据分析专题
miRNA数据分析专题
单细胞转录组数据分析专题
chip_seq数据分析专题
Hi-C数据分析专题
HLA数据分析专题
TCGA肿瘤数据分析专题
基因组组装数据分析专题
CNV数据分析专题
GWAS数据分析专题
2018年推文合集
2019年推文合集
写在最后
转发本文至朋友圈,后台私信截图即可加入生信交流群,和小伙伴一起学习交流。
扫描下方二维码,关注我们,解锁更多精彩内容!
一个只分享干货的
生信公众号
使用MACS2进行差异peak分析相关推荐
- MPB:亚热带生态所谭支良组-基于微生物成分数据的差异zOTU分析流程
为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...
- python 分析两组数据的差异_R语言limma包差异基因分析(两组或两组以上)
使用limma包进行差异基因分析时,做最多的是两分类的,例如control组和disease组,但也会碰到按照序列进行的分组.这时,如果逐一使用两两比较求差异基因则略显复杂.其实开发limma包的大神 ...
- 蜜汁问题?差异基因分析谁比谁有差别吗?
做差异基因分析时经常会遇到有老师纠结是样品组A比样品组B还是样品组B比样品组A.每次我都是很诧异,这有区别吗? 这是一个典型的DESeq2输出结果,我们怎么知道他计算的是trt/untrt还是untr ...
- DESeq2差异基因分析和批次效应移除
差异基因鉴定 基因表达标准化 不同样品的测序量会有差异,最简单的标准化方式是计算 counts per million (CPM),即原始reads count除以总reads数乘以1,000,000 ...
- 基于TCGA数据库的差异基因分析实现
1.数据下载 1.1 网页下载 1.2 TCGABiolinks下载 setwd("D:\Bioinformatics data analysis") if (!requireNa ...
- python基因差异分析_R语言之生信②差异基因分析2
目录 R语言之生信②差异基因分析2 样品的无监督聚类 检查基因表达分析最重要的探索性策略之一是多维定标(MDS)图或类似的图.该图以无监督的方式显示了样本之间的相似性和不相似性,以便人们可以了解在进行 ...
- 跟着 Nat Med. 学作图 | GSVA+limma差异通路分析+发散条形图
跟着 Nat Med. 学作图 | GSVA+limma差异通路分析+发散条形图 Lambrechts D, Wauters E, Boeckx B, et al. Phenotype molding ...
- python基因差异分析_玉米RNA-seq测序数据差异基因分析
原标题:玉米RNA-seq测序数据差异基因分析 huanying今天给大家分享一个非常棒的玉米转录组的流程分析.原文作者是cxge,首发于omicshare论坛,阅读原文可跳转至本文的帖子哦~ 软件及 ...
- edger多组差异性分析_edgeR差异基因分析的一般过程
基于转录组测序获得的定量表达值,识别差异表达变化的基因或其它非编码RNA分子,实际上方法还是非常多的.但就目前来看,DESeq2和edgeR是出现频率最高的两种方法了. DESeq2已经在上一篇文章中 ...
最新文章
- 详解死机的原因和预防方法
- MSP430 苦逼学习日志
- beanfactorypostprocessor_Spring源码分析(六)容器的扩展点(BeanFactoryPostProcessor)
- SAP CRM One Order SERVICE_OS GUID调试指南
- TODO:Laravel增加验证码
- 【网络基础】《TCP/IP详解》学习笔记3
- c vector用法是什么
- 智能会议系统(7)---实时音视频技术难点及解决方案
- vue自定义组件递归实现树状_一道价值25k的腾讯递归组件面试题(Vue3 + TS 实现)...
- 链式编程在Java 中的应用
- Oracle刷建表语句
- 游戏启动是html,陈书艺:推动游戏前行 开启HTML5游戏之门
- 离散数学 习题篇 —— 关系的性质
- TimesTen In-Memory Database
- C++20 标准正式发布,命名为 ISO/IEC 14882:2020。
- XMLConstants.FEATURE_SECURE_PROCESSING错误
- Matlab之微分方程求解
- 游戏制作之路-unity捕鱼达人(一 开始以及加载界面的制作)
- 云集宣布品牌升级,推出全新slogan“购物享受批发价”
- 手机 CPU 架构类型了解