欢迎关注”生信修炼手册”!

HiC-Pro软件非常灵活,不仅可以处理各种不同建库方式的Hi-C数据,也可以处理capture Hi-C数据。软件安装过程如下

yum install -y epel-release
# R
yum install -y R
R
install.packages(c("ggplot2", "RColorBrewer"))
# python
yum install -y gcc gcc-c++ make
yum install -y python2 python-devel  python2-pip
pip install pysam
pip install "scipy<1"
pip install bx-python
# bowtie2
yum  install -y wget
wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.3.4.1/bowtie2-2.3.4.1-linux-x86_64.zip
unzip bowtie2-2.3.4.1-linux-x86_64.zip
# samtools
yum install bzip2 bzip2-devel libcurl libcurl-devel ncurses-devel openssl openssl-devel
wget https://github.com/samtools/samtools/releases/download/1.6/samtools-1.6.tar.bz2
tar xjvf  samtools-1.6.tar.bz2
cd samtools-1.6/
./configure
make
make install
# HiC-Pro
wget https://github.com/nservant/HiC-Pro/archive/v2.11.1.tar.gz
tar xzvf v2.11.1.tar.gz
cd HiC-Pro-2.11.1
make configure
make install

安装好之后,需要准备以下几种参考物种的相关文件

1. 酶切图谱

通过软件自带的脚本可以产生基因组对应的酶切图谱,输入内切酶的名称或者酶切位点序列都可以,用法如下

digest_genome.py -r A^AGCTT -o mm9_hindiii.bed mm9.fasta
digest_genome.py -r hindiii -o mm9_hindiii.bed mm9.fasta

2. 参考基因组索引

软件采用bowtie2将reads比对到参考基因组上,所以需要对基因组的fasta文件建立索引,用法如下

bowtie2-build hg19.fasta hg19

3. 染色体长度文件

从UCSC下载染色体长度文件,或者自己根据fasta序列统计长度都可以,该文件内容如下

chr1    249250621
chr2    243199373
chr3    198022430
chr4    191154276

这里我们用官网提供的测试数据展示下基本用法,首先下载测试数据

wget --no-check-certificate https://zerkalo.curie.fr/partage/HiC-Pro/HiCPro_testdata.tar.gz
tar xzcf HiCPro_testdata.tar.gz

HiC-Pro的所有参数都记录在配置文件中,安装目录提供了配置文件的模板config_test_latest.txt`, 在此基础上进行编辑就可以了。常见的需要配置的参数如下

BOWTIE2_IDX_PATH = /data/annotation/Human/hg19/base
REFERENCE_GENOME = hg19
GENOME_SIZE = chrom_hg19.sizes
GENOME_FRAGMENT = HindIII_resfrag_hg19.bed
LIGATION_SITE = AAGCTAGCTT

对于这个测试文件,只需要编辑bowtie2索引所在目录就可以了,编辑好之后直接运行,用法如下

HiC-Pro -i test_data/ -o out_dir -c config_test_latest.txt

用法非常简单,-i参数指定样本fastq文件文件所在目录,-o参数指定输出结果的目录,-c参数指定配置文件的名称。

对于fastq文件所在目录,结构如下所示

├── dixon_2M
│   ├── SRR400264_00_R1.fastq.gz
│   └── SRR400264_00_R2.fastq.gz
└── dixon_2M_2├── SRR400264_01_R1.fastq.gz└── SRR400264_01_R2.fastq.gz

每个样本一个子文件夹,下面是对应的双端测序的fastq文件。输出结果目录如下

|-- bowtie_results
|-- config_test_latest.txt
|-- hic_results
|-- logs
|-- rawdata -> /HiC-Pro-2.11.1/test_data/
`-- tmp

其中hic_results目录下是最终结果,包含了不同分辨率下的hi-c图谱和质控的图表。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

HiC-Pro实战详解相关推荐

  1. 《Unity 4 3D开发实战详解》一6.7 物理引擎综合案例

    本节书摘来异步社区<Unity 4 3D开发实战详解>一书中的第6章,第6.7节,作者: 吴亚峰 , 杜化美 , 张月霞 , 索依娜 责编: 张涛,更多章节内容可以访问云栖社区" ...

  2. R语言基于forestplot包可视化森林图实战详解:美化的森林图:自定义字体设置、置信区间、坐标轴(刻度、标签、范围)、无效线去除、水平线、辅助线、box形状、色彩等

    R语言基于forestplot包可视化森林图实战详解:美化的森林图:自定义字体设置.置信区间.坐标轴(刻度.标签.范围).无效线去除.水平线.辅助线.box形状.色彩等 目录

  3. R语言使用survminer包生存分析及可视化(ggsurvplot)实战详解:从数据集导入、生存对象生成、ggsurvplot可视化参数配置、设置、可视化对比

    R语言使用survminer包生存分析及可视化(ggsurvplot)实战详解:从数据集导入.生存对象生成.ggsurvplot可视化参数配置.设置.可视化对比 目录 R语言使用survminer包生 ...

  4. R语言tidyr包gather()函数实战详解:数据收缩、从宽表到窄表

    R语言tidyr包gather()函数实战详解:数据收缩.从宽表到窄表 目录 R语言tidyr包gather()函数实战详解:数据收缩.从宽表到窄表 收缩两列数据

  5. R语言tidyr包spread()函数实战详解:数据裂变、从窄表到宽表

    R语言tidyr包spread()函数实战详解:数据裂变.从窄表到宽表 目录 R语言tidyr包spread()函数实战详解:数据裂变.从窄表到宽表

  6. R语言tidyr包Unite()函数实战详解:多个数据列合并为一列

    R语言tidyr包Unite()函数实战详解:多个数据列合并为一列 目录 R语言tidyr包Unite()函数实战详解:多个数据列合并为一列

  7. R语言tidyr包separate()函数实战详解:一列裂变为多列

    R语言tidyr包separate()函数实战详解:一列裂变为多列 目录 R语言tidyr包separate()函数实战详解:一列裂变为多列 一列裂变为两列

  8. 《oracle大型数据库系统在AIX/unix上的实战详解》讨论31: oracle、sybase 数据库的不同访问...

    <Oracle大型数据库系统在AIX/UNIX上的实战详解> 讨论31:  oracle.sybase 数据库的不同访问方式   文平. 用户来信要求更细节比较一下Oracle和sybas ...

  9. 《Java和Android开发实战详解》——2.5节良好的Java程序代码编写风格

    本节书摘来自异步社区<Java和Android开发实战详解>一书中的第2章,第2.5节良好的Java程序代码编写风格,作者 陈会安,更多章节内容可以访问云栖社区"异步社区&quo ...

  10. python 自动化-Python API 自动化实战详解(纯代码)

    主要讲如何在公司利用Python 搞API自动化. 1.分层设计思路 dataPool :数据池层,里面有我们需要的各种数据,包括一些公共数据等 config :基础配置 tools : 工具层 co ...

最新文章

  1. 达摩院实现自动驾驶核心技术突破,达摩院首次实现3D物体检测精度与速度的兼得
  2. Linux下socket最大连接数 ulimit -n 最大值修改
  3. 休眠事实:等于和HashCode
  4. java 收集系统资源_方法:Linux 下用JAVA获取CPU、内存、磁盘的系统资源信息
  5. opencv-api fit
  6. BZOJ 2120: 数颜色
  7. python大作业五子棋人人对战_五子棋总结(人人对战)
  8. mac安装win7之后鼠标失灵_苹果电脑装WIN7鼠标不能动怎么处理
  9. 计算机主板会自动切断电源是怎么回事,告诉你电脑自动断电怎么办
  10. 【论文阅读】Multi-hop Question Answering via Reasoning Chains
  11. 投票刷票 php,关于PHP写的投票网站之刷票终结版_PHP教程
  12. 高级 JavaScript Day04 | 正则表达式
  13. win7计算机广告更改,win7系统屏蔽营销广告的设置办法
  14. 考研英语阅读12种解题技巧!快来马!
  15. 超螺旋滑模控制(STA)
  16. 【图像分割】直觉模糊C均值聚类的图像分割IFCM
  17. 39岁研究生毕业14年的经验和教训
  18. C语言结构体的四种定义方式
  19. 保存计算过程的计算器Java实现
  20. asp.net小说网系统VS开发物业sqlserver数据库web结构c#编程计算机网页源码项目

热门文章

  1. 2022互联网面经(未完待续)
  2. 为什么要malloc()?何时要malloc()?如何使用malloc()?
  3. Leanote 蚂蚁笔记 云笔记
  4. 更改android模拟器dns,安卓模拟器网络异常修改DNS教程
  5. c++计算空间向量的夹角
  6. Dubbo SPI机制学习总结(持续更新...)
  7. 需求基本流程和要求——公司培训
  8. 打造自己本地的渗透测试武器库-工欲善其事必先利其器
  9. 一加连续点Android版本号,一加5T Android8.0全国首刷/附加教程和ROM
  10. Gmail Api 的解读及例子