欢迎关注”生信修炼手册”!

GTEx全称如下

Genotype-Tissue Expression

该项目对来自人体多个组合和器官的样本,同时进行了转录组测序和基因分型分析,构建了一个组织特异性的基因表达和调控的数据库。网址如下

https://gtexportal.org/home/

包含的组织类型和样本个数如下图所示

对于所有的样本,主要进行了以下三种分析

1. RNA  seq

通过illumina Truseq试剂盒构建polyA+文库,采用Hiseq 2000/2500进行测序,对于下机数据,采用STAR进行比对,参照选择的是gencode V19版本的gtf文件,进行了以下3个level的定量

  1. gene-level,采用RNAseQC软件,对基因的raw count和TPM两种方式进行定量

  2. exon-level, 对exon的raw count进行定量

  3. transcript-level,采用RSEM进行转录本水平的定量

2. genotype

通过WGS对样本进行分型, 采用的是GATK germline variants calling的流程,步骤如下

  1. bwa-mem alignment

  2. picard markduplicate

  3. BQSR

  4. indel realign

  5. haplotypeCaller

3. eQTL

通过FastQTL软件进行cis-eQTL分析,将基因型和基因表达量进行关联。

通过官网可以查看基因表达量和eQTL分析的结果,以TP53为例,每个基因给出了以下3个层级的表达量

  1. Isoform Expression

  2. Exon Expression

  3. Junction Expression

分别对应转录本,外显子,剪切序列的表达量,对于不同组织中的表达量,以热图的形式进行展示,示意如下

对于基因结构,也进行了可视化,示意如下

eQTL的结果示意如下

提供了以下两种可视化方式,第一种是在单个组织内的小提琴图,eQTL violin plot, 示意如下

第二种用于多个组织间的比较,Multi-tissue eQTL plot, 示意如下

所有的分析结果可以通过官网进行下载,GTEx数据库不仅仅是一个正常组织的基因表达量数据库,其eQTL分析的策略更值得我们借鉴。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

GTEx:基因型和基因表达量关联数据库相关推荐

  1. 一文学会基因型和表型关联分析算法GEMMA

    基于GEMMA算法分析与细菌表型相关的基因型 1.介绍 1.1 介绍_简介 1.2 介绍_优点 1.2.1介绍_优点_排除了连锁不平衡的干扰3级标题 1.2.2介绍_优点_速度快 2.实际操作 2.1 ...

  2. FPKM值基因表达量的计算、基因ID转gene symbol的例子

    高通量测序数据一般公司都会提供两种矩阵,一种是Row counts,前面说过的用于差异基因的筛选.第二种是FPKM值,可以理解为转录组基因的表达矩阵,可以用于做热图和基因表达变化的比较.但是数据挖掘中 ...

  3. R语言中如何进行PCA分析?利用ggplot和prcomp绘制基因表达量分析图

    学习笔记的主要内容是在R语言中利用ggplot2进行PCA分析和绘图,包括简单分析与操作流程,对比不同方式得到的结果差异,提供脚本代码供练习. PCA分析的原理 在处理基因差异表达数据时,有时候需要分 ...

  4. R语言基因表达量转换(TPM、FPKM、RPKM)

    基因表达量一般以TPM或FPKM为单位来展示. TPM,Transcripts Per Kilobase Million 计算公式: TPMi=(Ni/Li)*1000000/sum(Ni/Li+-- ...

  5. 听说,他用报表关联数据库表,运维效率提升70%?

    在"互联网+"的时代,以实体为基础.辅助电商与物流已经成为了零售行业"数字化转型"的必经之路.转型带来的数据激增不仅给数据人员带来了报表制作与维护压力,也给业务 ...

  6. 衡量基因相对表达量的RPKM、FPKM、TPM详解

    衡量基因相对表达量的RPKM和FPKM.及TPM 1.RPKM(Reads Per Kilobase per Million)和FPKM(Fragments Per Kilobase per Mill ...

  7. IDBLK_TIMING.dll群联量产数据库文件合集

    懂u盘群联量产工具的人都知道,每个不同版本的群联量产工具里都有一个不同版本的IDBLK_TIMING.dll主控信息数据库文件,有了这个文件才能找到你的群联主控U盘的主控版本,才能准确量产.这里提供一 ...

  8. IDEA2022版教程下(快键键总结、Debug断点调试总结、22版本idea创建各种工程、关联数据库、常用插件)

    8.快捷键的使用 8.1 常用快捷键 1 通用型(复制,黏贴,剪贴-) 说明 快捷键 复制代码-copy ctrl + c 粘贴-paste ctrl + v 剪切-cut ctrl + x 撤销-u ...

  9. 关联数据库中多张表_关联数据

    关联数据库中多张表 在本系列的前两篇文章(" 使用RDF创建数据网 "和" 使用SPARQL查询RDF数据 ")中,您了解了资源描述框架(RDF)以及SPARQ ...

最新文章

  1. 用栈、回溯算法设计迷宫程序
  2. 博客园外挂之一Web搜索引擎命中统计
  3. 怎么查询redis缓存的数据_阿里开发十年写出这份「Redis简明教程」+「Redis实战」请你查收...
  4. 西南大学网络教育学院计算机基础,西南大学网络与继续教育学院课程考试计算机基础【1056】...
  5. linux 信号 sigaction(是signal的扩展,在多线程应用中替代了signal)(除了信号值信息外,还可以附加数值信息(以及指针:不可跨进程):sigqueue()函数)
  6. 音视频技术开发周刊 | 192
  7. 那些年,我和发哥在恒大的日子
  8. 【毕业寄语】我们不缺少鼓励但却缺少了批评
  9. vue从创建到完整的饿了么(10)city.vue的完善(v-if 的简单使用及本地缓存的存储与读取)...
  10. C++计算两平面之间的夹角
  11. DHT11温湿度传感器原理剖析
  12. Github学生认证指北
  13. android qq勋章墙实现,科技教程:如何在手机QQ中进入勋章墙?
  14. 高含盐废水处理资源化——双极膜电渗析
  15. python循环结构语句实现_Python的循环结构
  16. 十六进制与ascii码的互转(c语言),十六进制与ASCII码转换
  17. 工程师职称评审两大阶段要明白!
  18. SWUST OJ#1052 输出利用先序遍历创建的二叉树中的指定结点的双亲结点
  19. 梅科尔工作室-李庆浩 深度学习-KNN算法
  20. CANoe入门基础教程(一)

热门文章

  1. java 接入百度地图api
  2. 前端开发常用UI组件库(vue、react)
  3. 误删windows启动分区的修复方法
  4. Bash/Shell-脚本整理
  5. 28马力轮式拖拉机最终传动及驱动轴设计(说明书+CAD图纸+文献翻译)
  6. 通过js将26个英文字母按顺序依次排列
  7. 中国十大坑人“民族”品牌排行榜,不要再被他们骗了!
  8. HMI-54-【多媒体】音乐播放器 3
  9. 人工智能基本概念(一)
  10. Ap6255 调试记录