随着测序技术的改进,染色质免疫沉淀和高通量测序(ChIP-Seq)在研究全基因组蛋白质-DNA相互作用方面越来越流行。为了解决芯片序列分析方法的不足,我们提出了基于模型的芯片序列分析(MACS),用于识别转录因子结合位点。MACS捕捉基因组复杂性的影响以评估富集芯片区域的重要性,并且MACS通过结合测序标签位置和方向的信息来提高结合位点的空间分辨率。MACS可以很容易地单独用于芯片序列数据,或用于增加特异性的对照样品。此外,作为一般的峰值调用者,MACS也可以应用于任何“DNA富集分析”,如果要问的问题很简单:我们可以在哪里找到比随机背景更重要的读取覆盖率。

MACS中有七个主要功能作为子命令。

子命令 描述
callpeak 主MACS2从对齐结果调用峰值的功能。
bdgpeakcall 从bedGraph输出调用峰值。
bdgbroadcall 从bedGraph输出调用宽峰。
bdgcmp 比较bedGraph格式的两个信号轨道。
bdgopt 操作bedGraph文件的得分列。
cmbreps 结合重复分数的BEDGraphs。
bdgdiff 基于成对的四个bedgraph文件的差分峰值检测。
filterdup 删除重复读取,然后以BED / BEDPE格式保存。
predictd 从对齐结果预测d或片段大小。
pileup 堆积对齐读取(单端)或片段(配对端)
randsample 随机选择总读数的数量/百分比。
refinepeak 采取原始读取对齐,细化峰值峰值。
### 1. conda 安装
conda install macs2### 2. 比对和统计bwa mem ref.fa test_read1.fq test_read2.fq > test_pe.sam  # PE # bwa mem ref.fa test.fq.gz > test_pe.sam  # SEsamtools flagstat test_pe.sam
# 保留只比对到一个位点的序列
samtools view -bq test_pe.sam >test_unique.bam
samtools flagstat test_unique.bam###3. 去重
macs2 filterdup -i test_unique.bam -g hs --keep-dup 1 -o test.bed# % redundancy in the .err file### 3. Call peaks# without control
macs2 call peaks  -t test.bed -f AUTO -g hs -q <FDR cutoff> -fe-cutoff <fold change>
--outdir path/to/save/your/output/dir  -n output_prefix#-t/--treatment filename, -c/--control, -n/--output name, -f/--format of tag files
#--outdir/--the folder where all the output files saved into, -n/--name of the output as NAME_peaks.bed
#-g/--gsize The default hs -- 2.7e9 is recommended as for UCSC human hg18 assembly
#-q/--qvalue (minimum FDR) cutoff to call significant regions. Default is 0.05.# with control
macs2 call peaks  -t treat.bed -c control.bed -f AUTO -g hs -q <FDR cutoff> -fe-cutoff <fold change>
--outdir path/to/save/your/output/dir -n output_prefix

参考:

https://macs3-project.github.io/MACS/

Macs处理ChIP_Seq数据相关推荐

  1. 利用bedtools预测chip_seq数据的靶基因

    欢迎关注"生信修炼手册"! 通常在分析peak区域对应的靶基因时,会选取转录起始位点TSS上下游一定长度的区域作为候选的靶基因范围,本文介绍下如何利用bedtools来对peak与 ...

  2. CHIP-seq流程学习笔记(13)-ATAC_seq 数据加工处理

    今天第一次尝试处理ATAC_seq数据,希望能尽快做完吧. 先放个找好的参考文章:ATAC-seq/ChIP-seq分析方法 1.建立相应目录 对新数据建立对应实验人员(zhaoyingying).测 ...

  3. TCGA肿瘤数据分析专题

    欢迎关注"生信修炼手册"! 癌症作为人类健康的头号杀手,其研究的意义不言而喻.目前世界范围内已经有大量的肿瘤相关数据,鉴于公共数据库的数据挖掘成为一种趋势. GEO是一个国际化的开 ...

  4. 不会linux也没关系,点击鼠标即可完成的LDSC分析来了

    欢迎关注"生信修炼手册"! LDSC分析基于已有的GWAS结果,即gwas summary数据,可以评估性状的遗传力,分析两个性状间的遗传相似度.相比GREML, 其运算速度快,更 ...

  5. DNA甲基化数据分析专题

    欢迎关注"生信修炼手册"! DNA 甲基化作为重要的表观遗传学的标记,能够调控基因的表达,在生长发育和疾病相关研究领域都有着重要意义.测定甲基化的手段有很多,芯片作为一种成熟的手段 ...

  6. 想要进行gene prioritization分析,请看这里!

    欢迎关注"生信修炼手册"! 通过GWAS分析可以识别到与性状关联的SNP位点,然而从生物学角度出发,我们更想了解的是哪些基因或者通路导致了这些位点与性状的关联现象.为了解决这一问题 ...

  7. mRNA数据分析专题

    欢迎关注"生信修炼手册"! mRNA是基因实时表达的产物,研究mRNA可以探究基因表达以及调控的规律:同时也可以用于发现基因结构的变化,比如可变剪切,融合基因等事件,本文整理了mR ...

  8. GWAS中的Gene-Gene Interactions如何分析?看这里

    欢迎关注"生信修炼手册"! 在遗传学中,当两个基因相互作用然后导致对应性状的出现,说明两个基因间存在相互作用.在之前的文章中,介绍了很多的基因相互作用模型,列表如下 互补作用 积加 ...

  9. GWAS数据分析专题

    欢迎关注"生信修炼手册"! 全基因组关联分析是目前研究复杂疾病易感性的最有效手段之一,通过芯片或者高通量测序得到全基因组规模的SNP分析结果,再结合卡方,费舍尔精确检验,线性回归等 ...

最新文章

  1. 利用Use Case为系统行为建模(1)
  2. TSNE 有代码实现有附3D 2D效果图
  3. CF908G New Year and Original Order
  4. php 两次post,ajax跨域往php程序post数据时,php程序总是执行两次的解决办法
  5. 消息队列系列二(IOT中消息队列的应用)
  6. JavaFX UI控件教程(十七)之Slider
  7. C++之纯虚函数和抽象类
  8. xss绕过字符过滤_IE8 xss filter bypass (xss过滤器绕过)
  9. ES6新特性_Symbol的内置属性---JavaScript_ECMAScript_ES6-ES11新特性工作笔记017
  10. 怎样编写和执行Js文件
  11. [4G5G专题-67]:RF层 - 天线常见指标与选型
  12. SOUI GDI+渲染引擎下的字体特效,抛砖引玉
  13. roslaunch的.launch文件的标签总结
  14. 10-Transformation
  15. python3连接mysql获取ansible动态inventory脚本
  16. TaiShan服务器介绍
  17. 关于《深圳市龙华区技能人才扶持办法(试行)》的政策解读
  18. linux的系统监视器图片_用Nvidia Jetson Nano 2GB和Python构建一个价值60美元的人脸识别系统...
  19. 2021-2027全球与中国单点润滑器市场现状及未来发展趋势
  20. 专业心理性格测试软件,专业心理性格测试题目

热门文章

  1. 全局平衡二叉树 P4751 【模板】“动态DP“
  2. 鼠标右键设置自定义文件打开方式
  3. HBase入门至进阶以及开发等知识梳理
  4. 腊月廿六链界观区块链资讯
  5. vue中使用sortable插件实现拖拽 upload上传图片改变顺序
  6. 南京信息工程大学计算机专业是几本,南京信息工程大学是211还是985
  7. iframe嵌套其它网站页面 全屏设置
  8. ASP.NET编程规范
  9. switch支持的10种数据类型和注意事项
  10. 最短路径算法【matlab仿真】