MACS2可以检出ChIP-Seq,ATAC-seq 以及 MeRIP-seq (RNA甲基化测序) 等富集的序列。

peaks calling 有不同的方法,MACS2是最常用的call peaks工具。 MACS全称Model-based Analysis of ChIP-Seq,最初的设计是用来鉴定转录因子的结合位点,但是它也可以用于其他类型的富集方式测序。

usage: macs2 [-h] [--version]             {callpeak,bdgpeakcall,bdgbroadcall,bdgcmp,bdgopt,cmbreps,bdgdiff,filterdup,predictd,pileup,randsample,refinepeak}

### macs2检出peaks## 如果有多个实验组和对照组,先分别merge实验组和对照组的bam文件
samtools merge control.merge.bam c1_sorted.bam c2_sorted.bam
samtools merge chip.merge.bam chip1_sorted.bam chip2_sorted.bam ## shift model for ATAC-seq
nohup macs2 callpeak -c control.merge.bam -t condition.merge.bam -f BAM -B -g hs -n test --nomodel --shift -100 --extsize 200 --outdir ./peaks 2> test.log & nohup macs2 callpeak -c control.merge.bam -t condition.merge.bam -f BAM -B -g hs -n test --outdir ./peaks 2> test.log &# 设置阈值
macs2 callpeak -t condition.merge.bam -c control.merge.bam -f BAM -g hs -n sample5 --outdir ./peaks -B -q 0.01macs2 callpeak -t condition.merge.bam -c control.merge.bam -f BAM --broad -g hs -n sample4  --outdir ./peaks --broad-cutoff 0.1

macs2 callpeak 主要参数介绍:

输入文件参数:

  • -t:实验组,IP的数据文件
  • c: 对照组
  • f:指定输入文件的格式,默认是自动检测输入数据是什么格式,支持bam,sam,bed等
  • g:有效基因组大小,由于基因组序列的重复性,基因组实际可以mapping的大小小于原始的基因组。这个参数要根据实际物种计算基因组的有效大小。软件里也给出了几个默认的-g 值:hs -- 2.7e9表示人类的基因组有效大小(UCSC human hg18 assembly).
    • hs: 2.7e9
    • mm: 1.87e9
    • ce: 9e7
    • dm: 1.2e8

输出文件参数:

  • --outdir:输出结果的存储路径 -n:输出文件名的前缀
  • -B/--bdg:输出bedgraph格式的文件,输出文件以NAME+'_treat_pileup.bdg' for treatment data, NAME+'_control_lambda.bdg' for local lambda values from control显示。bdg文件适合导入UCSC或IGV进行可视化,或者转换为bigwig格式再进行可视化。

peak calling 参数

  • -q/--qvalue 和 -p/--pvalue q value默认值是0.05,与pvalue不能同时使用。
  • --broad peak有narrow peak和broad peak, 设置时可以call broad peak 的结果文件。
  • --broad-cutoff 和pvalue、以及qvalue相似
  • --nolambda: 不要考虑在峰值候选区域的局部偏差/λ

Shift 模型参数:

  • --nomodel 这个参数和extsize、shift是配套使用的,有这个参数才可以设置extsize和shift。
  • --extsize 当设置了nomodel时,MACS会用--extsize这个参数从5'->3'方向扩展reads修复fragments。比如说你的转录因子结合范围200bp,就设置这个参数是200。
  • --shift 当设置了--nomodel,MACS用这个参数从5' 端移动剪切,然后用--extsize延伸,如果--shift是负值表示从3'端方向移动。建议ChIP-seq数据集这个值保持默认值为0,对于检测富集剪切位点如DNAsel数据集设置为EXTSIZE的一半。 示例:
  1. 想找富集剪切位点,如DNAse-seq,所有5'端的序列reads应该从两个方向延伸,如果想设置移动的窗口是200bp,参数设置如下: --nomodel --shift -100 --extsize 200
  2. 对nucleosome-seq数据,用核小体大小的一半进行extsize,所以参数设置如下: --nomodel --shift 37 --extsize 73 --call-summits

MACS利用此参数重新分析信号谱,解析每个peak中包含的subpeak。对相似的结合图谱,推荐使用此参数,当使用此参数时,输出的subpeak会有相同的peak边界,不同的绩点和peak summit poisitions.

参考:

https://pypi.org/project/MACS2/

https://blog.csdn.net/weixin_44748341/article/details/112050912

https://cloud.tencent.com/developer/article/1346057

MACS2软件进行Peak calling相关推荐

  1. MACS2 peak calling实战

    欢迎关注"生信修炼手册"! MACS是一款最为流行的peak calling软件,最初是针对转录因子的chip数据来设计的,在最新版本中,也添加了对组蛋白修饰的适配.目前最新版本为 ...

  2. 使用MACS2进行差异peak分析

    欢迎关注"生信修炼手册"! MACS2作为使用最广泛的peak calling软件,在v2版本中添加了差异peak分析的功能,所有的子命令功能描述如下 通过bdgdiff子命令来进 ...

  3. 高通---ChIP-Seq数据的Peak calling以及visualization

    ChIP-Seq数据的Peak calling以及visualization 文章目录 ChIP-Seq数据的Peak calling以及visualization 一. 主要分析流程 二.去除PCR ...

  4. 虹科教您 | 基于CDE软件对PEAK CAN卡进行测试

    虹科PCAN系列的CAN/CAN FD接口卡能够为PC扩展CAN/CAN FD协议接口的硬件模块,其扩展接口多样,包括USB,PCI,PCIe,MiniPCIe,M.2.,串口RS232等,光电解耦版 ...

  5. DNA甲基化与表观遗传学数据挖掘与分析学习会 (10月26-27 上海)

    两天一夜高强度训练,理论与实战相结合 赠送高清视频供学员复习使用 会务背景 表观遗传学调控多种生命活动及疾病发生发展,已成为近年来生命科学领域的研究热点,促使了生物学多领域研究的突破性进展.随着实验和 ...

  6. 表观遗传学及DNA甲基化数据分析

    关于举办"表观遗传学及DNA甲基化数据分析"专题班通知 各有关单位: 表观遗传学是研究基因的核苷酸序列不发生改变的情况下,基因表达的可遗传的变化的一门遗传学分支学科.随着实验技术的 ...

  7. hbctraining-05_peak_calling_macs2

    算法,参数,输出. Peak calling ChIP-seq实验,从比对文件中观察到正/负链上以结合位点为中心的非对称reads 密度. For ChIP-seq experiments, what ...

  8. R语言也可以进行ATAC数据的完整分析啦!

    欢迎关注"生信修炼手册"! 个人认为,R语言有两个强项,统计和绘图.在生物信息数据分析中,R语言更多时候是发挥一个科学计算和可视化的作用.当然,R语言的功能远不止于此,不仅可以作为 ...

  9. CHIP-seq流程学习笔记(9)-使用IDR 软件对生物学重复样本间的差异peak进行提取

    参考文章: 使用IDR软件处理生物学重复样本的peak calling Irreproducible Discovery Rate (IDR) 1. 使用Conda安装IDR软件 (base) zex ...

最新文章

  1. 民族、学历学位、所学专业、、专业技术职务 对应表
  2. 《ASP.NET MVC 4框架揭秘》试读章节
  3. eureka 之前的服务如何关闭_干货分享 | 服务注册中心Spring Cloud Eureka部分源码分析...
  4. Linux rm 删除指定文件外的其他文件 方法汇总
  5. SploitFun Linux x86 Exploit 开发系列教程
  6. 用于服务器接入的防火墙网关的八个关键×××
  7. Visio 2019
  8. SPSS中介效应与调节效应插件Process简介(1)
  9. 建筑设计的未来是什么?| 建筑 · 人工智能专栏
  10. 靠问卷调查做副业,在家月入过万:聪明的人,从不挣辛苦钱!
  11. #9733;不评价别人的生活,是一个…
  12. 【文件包含漏洞-03】文件包含漏洞的利用及如何利用本地文件包含漏洞GetShell
  13. Node.js+Protractor+vscode搭建测试环境(1)
  14. Koomail VS. Foxmail
  15. Java开发面试题及答案分享
  16. 2022.10.21 单词背诵
  17. 中国省级GDP增长目标(2000-2018年)
  18. 【SAP ABAP 生产订单修改组件需求用量增强】
  19. VC 监视网页中的元素事件
  20. 调用java显示有何风险_Java学习----有风险的代码(异常)

热门文章

  1. python相关系数_python怎么计算偏相关系数?
  2. 计算机网络概述 - 跟小智一起学网络(2)
  3. Nginx 基础详解(二)
  4. he系列高端服务器机柜,HE系列九折型材服务器机柜
  5. 30分钟了解C++11新特性
  6. ❤️强烈推荐!Word、Excel、PPT、PDF在线预览解决方案
  7. 计算机名、主机名、用户账户名与NetBIOS名有什么区别
  8. 占胜自己是战胜一切的期础。
  9. 计算机硬件的主要技术指标
  10. 《五、企业级知识管理系统:Confluence权限管理》