MACS2软件进行Peak calling
MACS2可以检出ChIP-Seq,ATAC-seq 以及 MeRIP-seq (RNA甲基化测序) 等富集的序列。
peaks calling 有不同的方法,MACS2是最常用的call peaks工具。 MACS全称Model-based Analysis of ChIP-Seq,最初的设计是用来鉴定转录因子的结合位点,但是它也可以用于其他类型的富集方式测序。
usage: macs2 [-h] [--version] {callpeak,bdgpeakcall,bdgbroadcall,bdgcmp,bdgopt,cmbreps,bdgdiff,filterdup,predictd,pileup,randsample,refinepeak}
### macs2检出peaks## 如果有多个实验组和对照组,先分别merge实验组和对照组的bam文件
samtools merge control.merge.bam c1_sorted.bam c2_sorted.bam
samtools merge chip.merge.bam chip1_sorted.bam chip2_sorted.bam ## shift model for ATAC-seq
nohup macs2 callpeak -c control.merge.bam -t condition.merge.bam -f BAM -B -g hs -n test --nomodel --shift -100 --extsize 200 --outdir ./peaks 2> test.log & nohup macs2 callpeak -c control.merge.bam -t condition.merge.bam -f BAM -B -g hs -n test --outdir ./peaks 2> test.log &# 设置阈值
macs2 callpeak -t condition.merge.bam -c control.merge.bam -f BAM -g hs -n sample5 --outdir ./peaks -B -q 0.01macs2 callpeak -t condition.merge.bam -c control.merge.bam -f BAM --broad -g hs -n sample4 --outdir ./peaks --broad-cutoff 0.1
macs2 callpeak 主要参数介绍:
输入文件参数:
-t
:实验组,IP的数据文件c
: 对照组f
:指定输入文件的格式,默认是自动检测输入数据是什么格式,支持bam,sam,bed等g
:有效基因组大小,由于基因组序列的重复性,基因组实际可以mapping的大小小于原始的基因组。这个参数要根据实际物种计算基因组的有效大小。软件里也给出了几个默认的-g 值:hs -- 2.7e9表示人类的基因组有效大小(UCSC human hg18 assembly).- hs: 2.7e9
- mm: 1.87e9
- ce: 9e7
- dm: 1.2e8
输出文件参数:
--outdir
:输出结果的存储路径-n
:输出文件名的前缀-B/--bdg
:输出bedgraph格式的文件,输出文件以NAME+'_treat_pileup.bdg' for treatment data, NAME+'_control_lambda.bdg' for local lambda values from control显示。bdg文件适合导入UCSC或IGV进行可视化,或者转换为bigwig格式再进行可视化。
peak calling 参数
-q/--qvalue
和-p/--pvalue
q value默认值是0.05,与pvalue不能同时使用。--broad
peak有narrow peak和broad peak, 设置时可以call broad peak 的结果文件。--broad-cutoff
和pvalue、以及qvalue相似--nolambda
: 不要考虑在峰值候选区域的局部偏差/λ
Shift 模型参数:
--nomodel
这个参数和extsize、shift是配套使用的,有这个参数才可以设置extsize和shift。--extsize
当设置了nomodel时,MACS会用--extsize
这个参数从5'->3'方向扩展reads修复fragments。比如说你的转录因子结合范围200bp,就设置这个参数是200。--shift
当设置了--nomodel,MACS用这个参数从5' 端移动剪切,然后用--extsize延伸,如果--shift是负值表示从3'端方向移动。建议ChIP-seq数据集这个值保持默认值为0,对于检测富集剪切位点如DNAsel数据集设置为EXTSIZE的一半。 示例:
- 想找富集剪切位点,如DNAse-seq,所有5'端的序列reads应该从两个方向延伸,如果想设置移动的窗口是200bp,参数设置如下:
--nomodel --shift -100 --extsize 200
- 对nucleosome-seq数据,用核小体大小的一半进行extsize,所以参数设置如下:
--nomodel --shift 37 --extsize 73
--call-summits
MACS利用此参数重新分析信号谱,解析每个peak中包含的subpeak。对相似的结合图谱,推荐使用此参数,当使用此参数时,输出的subpeak会有相同的peak边界,不同的绩点和peak summit poisitions.
参考:
https://pypi.org/project/MACS2/
https://blog.csdn.net/weixin_44748341/article/details/112050912
https://cloud.tencent.com/developer/article/1346057
MACS2软件进行Peak calling相关推荐
- MACS2 peak calling实战
欢迎关注"生信修炼手册"! MACS是一款最为流行的peak calling软件,最初是针对转录因子的chip数据来设计的,在最新版本中,也添加了对组蛋白修饰的适配.目前最新版本为 ...
- 使用MACS2进行差异peak分析
欢迎关注"生信修炼手册"! MACS2作为使用最广泛的peak calling软件,在v2版本中添加了差异peak分析的功能,所有的子命令功能描述如下 通过bdgdiff子命令来进 ...
- 高通---ChIP-Seq数据的Peak calling以及visualization
ChIP-Seq数据的Peak calling以及visualization 文章目录 ChIP-Seq数据的Peak calling以及visualization 一. 主要分析流程 二.去除PCR ...
- 虹科教您 | 基于CDE软件对PEAK CAN卡进行测试
虹科PCAN系列的CAN/CAN FD接口卡能够为PC扩展CAN/CAN FD协议接口的硬件模块,其扩展接口多样,包括USB,PCI,PCIe,MiniPCIe,M.2.,串口RS232等,光电解耦版 ...
- DNA甲基化与表观遗传学数据挖掘与分析学习会 (10月26-27 上海)
两天一夜高强度训练,理论与实战相结合 赠送高清视频供学员复习使用 会务背景 表观遗传学调控多种生命活动及疾病发生发展,已成为近年来生命科学领域的研究热点,促使了生物学多领域研究的突破性进展.随着实验和 ...
- 表观遗传学及DNA甲基化数据分析
关于举办"表观遗传学及DNA甲基化数据分析"专题班通知 各有关单位: 表观遗传学是研究基因的核苷酸序列不发生改变的情况下,基因表达的可遗传的变化的一门遗传学分支学科.随着实验技术的 ...
- hbctraining-05_peak_calling_macs2
算法,参数,输出. Peak calling ChIP-seq实验,从比对文件中观察到正/负链上以结合位点为中心的非对称reads 密度. For ChIP-seq experiments, what ...
- R语言也可以进行ATAC数据的完整分析啦!
欢迎关注"生信修炼手册"! 个人认为,R语言有两个强项,统计和绘图.在生物信息数据分析中,R语言更多时候是发挥一个科学计算和可视化的作用.当然,R语言的功能远不止于此,不仅可以作为 ...
- CHIP-seq流程学习笔记(9)-使用IDR 软件对生物学重复样本间的差异peak进行提取
参考文章: 使用IDR软件处理生物学重复样本的peak calling Irreproducible Discovery Rate (IDR) 1. 使用Conda安装IDR软件 (base) zex ...
最新文章
- 民族、学历学位、所学专业、、专业技术职务 对应表
- 《ASP.NET MVC 4框架揭秘》试读章节
- eureka 之前的服务如何关闭_干货分享 | 服务注册中心Spring Cloud Eureka部分源码分析...
- Linux rm 删除指定文件外的其他文件 方法汇总
- SploitFun Linux x86 Exploit 开发系列教程
- 用于服务器接入的防火墙网关的八个关键×××
- Visio 2019
- SPSS中介效应与调节效应插件Process简介(1)
- 建筑设计的未来是什么?| 建筑 · 人工智能专栏
- 靠问卷调查做副业,在家月入过万:聪明的人,从不挣辛苦钱!
- #9733;不评价别人的生活,是一个…
- 【文件包含漏洞-03】文件包含漏洞的利用及如何利用本地文件包含漏洞GetShell
- Node.js+Protractor+vscode搭建测试环境(1)
- Koomail VS. Foxmail
- Java开发面试题及答案分享
- 2022.10.21 单词背诵
- 中国省级GDP增长目标(2000-2018年)
- 【SAP ABAP 生产订单修改组件需求用量增强】
- VC 监视网页中的元素事件
- 调用java显示有何风险_Java学习----有风险的代码(异常)