易基因:染色质免疫共沉淀测序(ChIP-seq)的数据挖掘思路 |干货系列
大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。
CHIP-seq研究的数据挖掘思路主要分为3步:
整体把握CHIP-seq图谱特征:peak/reads在基因组上的分布、peak在元件上的富集、peak在基因元件上的分布、peak的motif分析、peak距离TSS位点的距离分析、peak修饰基因的功能分析
筛选具体差异peak和基因:差异 peak鉴定、非时序数据的分析策略、时序数据的分析策略、差异peak关联基因的功能分析、差异peak关联基因的PPI分析、感兴趣目标区域的可视化展示
CHIP-seq&转录组学关联分析:Meta genes整体关联、peak关联基因与DEG对应关联、目标区域和靶基因的筛选
后期视情况是否需要下游实验设计验证TF结合/组蛋白修饰的目标区域和候选靶基因。
![](/assets/blank.gif)
1、图谱分析
(1)peak/reads在基因组上的分布
Peak的分布就是蛋白与DNA互作图谱。
不同蛋白对DNA的结合可以按照峰的宽窄和分布特征分为:
narrow peak:即发生在DNA上特定的短序列,结合的区域很短。
broad peak:这种类型的peak在DNA上呈弥 散的连续的分布,峰型较宽。
一般来说,转录因子的峰型都是narrow peak;而对于组蛋白修饰,有的峰型为 narrow peak,有的为broad peak。
可以通过调整参数或使用不同的软件分别鉴定narrow peak及broad peak。
![](/assets/blank.gif)
peak分布圈图
(2)信号的富集程度分析——覆盖度累积曲线
对样本比对结果reads累积情况进行展示。一定长度窗口(bin)上reads数进行计数,然后排序,再依次累加画图。input (能测到90 DNA片段)在基因组理论上是均匀分布,随着测序深度增加趋近于直线,实验组在排序越高的窗口处reads累积速度越快,说明这些区域富集的越特异。
narrow peak :富集程度高;broad peak:富集程度低。
富集程度低不代表失败, 如broad peak。
但是如果是转录因子, 富集程度低则需要谨慎对待。
(3)peak/reads的基因元件富集分析
reference-point(relative to a point): 计算某个点的信号丰度
scale-regions(over a set of regions): 把所有基因组区段缩放至同样大小,然后计算其信号丰度。
基于信号富集的靶基因集分类鉴定(基于聚类算法)
![](/assets/blank.gif)
(4)peak/reads的基因元件分布分析
![](/assets/blank.gif)
(5)peak/reads与TSS的相对距离分布
转录因子、组蛋白修饰往往具有重要的转录调控功能,而TSS附近是主要的转录调控区域,因此判断peak与TSS的位置关系有重要的意义。
![](/assets/blank.gif)
(6)降维分析
将基因组分为等长窗口(bins),计算各样本各窗口内的Reads覆盖情况并进行标准化。基于此数据进行相关性、聚类和PCA分析。
![](/assets/blank.gif)
(7)motif分析
Motif为一段有特征的DNA短序列,主要为转录因子的识别位点,不同的motif对应不同的转录因子。
根据motif可以推测结合的转录因子。
已知转录因子则分析该转录因子识别的序列特征。
![](/assets/blank.gif)
(8)peak的基因注释和功能分析
ORA
GSEA: 可以按照peak信号强度排序
![](/assets/blank.gif)
2、差异peak分析
(1)非时间序列数据:
![](/assets/blank.gif)
(2)时间序列数据:
(3)差异peak关联基因的PPI分析
感兴趣基因的差异peak展示
3、组学关联分析:CHIP-seq&转录组学
(1)Meta genes整体关联
距离TSS位点不同距离的peak注释到的基因的表达水平分析
不同表达水平的基因,peak的数量分布对比
![](/assets/blank.gif)
转录水平倍数变化 vs. peak倍数变化
(2)差异peak基因-DEG对应关联:筛选关键目的基因
peak关联基因与差异表达基因的重叠分析。
peak关联基因可以是peak注释到启动子区,TSS±10kb区的基因,也可以来自已 知公共数据库的注释,如Human Enhancer Disease Database (HEDD)。
九象限图法
关于易基因染色质免疫共沉淀测序 (ChIP-seq)
染色质免疫共沉淀(Chromatin Immunoprecipitation,ChIP),是研究体内蛋白质与DNA相互作用的经典方法。将ChIP与高通量测序技术相结合的ChIP-Seq技术,可在全基因组范围对特定蛋白的DNA结合位点进行高效而准确的筛选与鉴定,为研究的深入开展打下基础。
DNA与蛋白质的相互作用与基因的转录、染色质的空间构型和构象密切相关。运用组蛋白特定修饰的特异性抗体或DNA结合蛋白或转录因子特异性抗体富集与其结合的DNA片段,并进行纯化和文库构建,然后进行高通量测序,通过将获得的数据与参考基因组精确比对,研究人员可获得全基因组范围内某种修饰类型的特定组蛋白或转录因子与基因组DNA序列之间的关系,也可对多个样品进行差异比较。
应用方向:
ChIP 用来在空间上和时间上不同蛋白沿基因或基因组定位
转录因子和辅因子结合作用
复制因子和 DNA 修复蛋白
组蛋白修饰和变异组蛋白
技术优势:
物种范围广:细胞、动物组织、植物组织、细菌微生物多物种富集经验;
微量建库:只需5ng以上免疫沉淀后的DNA,即可展开测序分析;
方案灵活:根据不同的项目需求,选择不同的组蛋白修饰特异性抗体。
技术路线:
![](/assets/blank.gif)
有ChIP-seq测序或组学研究需要的老师可联系易基因。
![](/assets/blank.gif)
相关阅读:
干货分享:DNA甲基化研究的测序数据挖掘思路
独家分享:高通量测序后的下游实验验证方法——DNA甲基化篇
干货系列:m6A RNA甲基化研究的数据挖掘思路
干货系列:高通量测序后的下游实验验证方法——m6A RNA甲基化篇
![](/assets/blank.gif)
易基因:染色质免疫共沉淀测序(ChIP-seq)的数据挖掘思路 |干货系列相关推荐
- 易基因|染色质免疫共沉淀测序(ChIP-seq)分析实验全流程
大家好,这是专注表观组学十余年,领跑多组学科研服务的易基因. 本期,易基因小编给您讲讲染色质免疫共沉淀测序(ChIP-seq)实验怎么做,从技术原理.建库测序流程.信息分析流程和实验成功的关键问题等四 ...
- 染色质免疫共沉淀(ChIP)实验技术
广州如期生物技术有限公司的染色质免疫沉淀(Chromatin Immunoprecipitation,简称ChIP)是一种生物技术,用于检测特定蛋白与染色质的相互作用.在ChIP实验中,特定蛋白与染色 ...
- 项目集锦 | 易基因DNA羟甲基化5hmC测序研究成果
大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 羟甲基化5hmC是哺乳动物基因组上的第六碱基,在发育.衰老.神经退行性疾病.复杂疾病及肿瘤发生过程中起重要作用.本期以科研内容为序,总结 ...
- 易基因|m5C RNA甲基化测序技术---从mRNA到全转录组(mRNA+lncRNA+tRNA)m5C单碱基分辨检测|技术解读
易基因|m5C RNA甲基化测序技术---从mRNA到全转录组(mRNA+lncRNA+tRNA)m5C单碱基分辨检测|技术解读 m5C是RNA百余种修饰中研究较多的一种.m5C存在于tRNA上时,可 ...
- 易基因|RNA m5C甲基化测序(RNA-BS)技术介绍
大家好,这是专注表观组学十余年,领跑多组学科研服务的易基因. m5C是RNA百余种修饰中研究较多的一种.m5C存在于tRNA上时,可以对翻译进行调节:存在于rRNA上时,可以对核糖体的生物合成进行质控 ...
- 易基因|RNA m7G甲基化测序(m7G-MeRIP-seq)
N7-甲基鸟苷(N7-methylguanosine,m7G)是真核生物tRNA.rRNA和mRNA 5'cap中最丰富的修饰之一.作为一种重要的表观遗传修饰,m7G RNA甲基化在基因表达.加工代谢 ...
- 易基因:全基因组ChIP-seq分析揭示细菌转录因子PhoB的基因内结合位点|mBio
大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 细菌编码许多转录因子(transcription factor,TF),这些转录因子通过与启动子周围的DNA结合并调控RNA聚合酶(RN ...
- 易基因:ChIP-seq等揭示热休克转录因子A1b调控植物高温胁迫响应的分子机制|应激反应
在拟南芥中,热休克转录因子A1b(HEAT SHOCK TRANSCRIPTION FACTORA1b,HSFA1b)通过影响种子产量来调控对环境胁迫的抗性.HSFA1b是生殖适应性的决定性因素,这种 ...
- 易基因:ChIP-seq等揭示METTL14调控哺乳动物二价结构域的表观遗传机制|科研进展
大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 组蛋白及其翻译后修饰在调控基因表达和其他染色质模板化过程中起着重要作用.组蛋白H3赖氨酸4三甲基化(H3K4me3)和组蛋白H3K27m ...
最新文章
- 解决vs2010下不能创建项目及文件的问题
- R开发(part5)--导数计算
- Java8-本地缓存
- 复制url直接能跳过验证_python 爬虫如何突破登录验证
- linux运行雷神之锤,Ubuntu18.04下可以完美运行Quake3..
- 京东云Ubuntu下安装mysql
- 流程管理的流程与角色
- pypy mysql 兼容_PyPy运行Django+MySQL简单教程
- html中class类怎么写,HTML class 属性 | 菜鸟教程
- 关于AE(AfterEffect)安装QuickTime后无法渲染H.264,出现报错问题的解决!!错误代码(-1610153459)
- 微型计算机主装箱中装有哪些,微型计算机及接口技术2016年10月真题试题(04732)...
- 修改XAMPP启动mysql报错Port 3306 in use by D:\xampp\mysql\bin\mysqld!
- arduino超声波测距接线图详细_Arduino系列之超声波测距模块代码(一)
- [HOW TO]-oppo手机安装google play
- iframe的常用方法
- C++核心准则​NR.4:不要坚持将每个类声明放在其自己的源文件中
- Jetson Xavier NX小坑——配置cuDNN
- 类与类图,以及类间关系
- 钉钉windows端多开软件_Windows7系统便签怎么找?适合Windows系统的便签
- Sublime和iTerm中使用FiraCode编程连字等宽字体的配置
热门文章
- 用计算机计数 常常出错怎么办,提示“ultra dma crc错误计数”如何解决?原因分析+解决方法...
- Unity游戏开发客户端面经——网络(初级)
- RIL层源码分析(原)
- X86 LSS指令详解
- 企业网站服务器的配置研究背景,ftp服务器研究背景
- 【快应用】小程序转快应用如何退出整个快应用
- 如何抓到入侵网站的黑客?
- ch340t电路_CH340T模块的程序下载电路故障及解决方法
- 读论文,第十七天:Clench Interaction: Novel Biting Input Techniques
- 计算机网络题库——第6章 应用层