这两天被黄三文老师的团队刷屏了(2022年6月8日,中国农业科学院深圳农业基因组研究所(“基因组所”)黄三文团队在Nature 杂志同时在线发表了两篇研究论文),报道了该团队在植物基因组学领域的两项重要研究成果,为实现泛基因组在作物育种的应用提供了新的解决方案。其中一篇《Graph pangenome captures missing heritability and empowers tomato breeding》介绍了通过图泛基因组(Graph Pan-genome)解释了重要的数量遗传学的问题:丢失的遗传力。

这里学习一下这个概念,并给出我的理解。

丢失的遗传力

“遗传力丢失”( Missing heritability)是一个重要的数量遗传学问题,即通过遗传标记估计的遗传力以及通过全基因组关联分析(GWAS)发现的所有相关基因所贡献的遗传力总和均低于实际的遗传力。

计算方法是:根据数量遗传学遗传评估得到的遗传力是真正的遗传力,比如身高的遗传力是0.8,但是GWAS分析中显著性的SNP只解释了45%的变异(遗传力为0.45),这样还是有0.35的遗传力丢失了,这就叫做丢失的遗传力。

概念细分

遗传力,更通用的遗传力不是狭义遗传力和广义遗传力,而是:

第一种:h2 family :

hfamily2h^2_{family}hfamily2​,双胞胎研究,通过比较同卵与异卵双胞胎的相似性,计算得到h2,通常为这三种中最高。

飞哥理解:这个相当于加入了共同环境效应的重复力

第二种:h2 SNP

hSNP2h^2_{SNP}hSNP2​,GWAS研究所用chip上所有variants共同解释的方差 与 性状方差的比值,比 h2 family 低,但会显著高于h2 GWAS。

飞哥理解:这个相当于是GBLUP中加性方差组分所在的百分比,即是狭义遗传力。

第三种:h2 GWAS

hGWAS2h^2_{GWAS}hGWAS2​,仅由GWAS所发现的某疾病相关variants解释的方差 与 性状方差的比值 ,三者中最低。

飞哥理解:这个相当于是显著SNP占的百分比,PVE的值

上面三者的关系是

hGWAS2<hSNP2<hfamily2h^2_{GWAS} < h^2_{SNP} < h^2_{family}hGWAS2​<hSNP2​<hfamily2​

我们所说的消失的遗传力(Missing Heritability)就是:

hMissing2=hfamily2−hGWAS2h^2_{Missing} = h^2_{family} - h^2_{GWAS} hMissing2​=hfamily2​−hGWAS2​

消失的遗传力主要原因:非加性遗传效应,效应量大的稀有变异(rare variants),或是双胞胎研究中由于共同的环境因素而造成的过高估计。

消失的遗传力又可以分为:

  • 依旧消失的遗传力(still missing heritability)
  • 隐藏的遗传力(hidden heritability)

依旧消失的遗传力(still missing heritability):
hstillmissing2=hfamily2−hSNP2h^2_{still missing} = h^2_{family} - h^2_{SNP} hstillmissing2​=hfamily2​−hSNP2​

隐藏的遗传力(hidden heritability)的计算方法:
hhidden2=hSNP2−hGWAS2h^2_{hidden} = h^2_{SNP} - h^2_{GWAS} hhidden2​=hSNP2​−hGWAS2​

在GWAS研究中,由于我们所选显著阈值的高低,遗传力或许并不是消失(missing)而是被隐藏( hidden )了。另一种可能则是,人群的异质性(heterogeneity),因为 h2 GWAS 大多来自包含多群体的meta分析,而遗传效应在这些群体中的异质性也可能使 h2 GWAS 偏低。

飞哥理解:在育种中,家系估计的遗传力(同卵双胞胎、异卵双胞胎)很少使用,我们感兴趣的应该是动物模型(GBLUP)估计的遗传力和GWAS显著SNP估计的遗传力相差的部分,即是:隐藏的遗传力(hidden heritability),能够找到导致差异的因素,对于我们实施分子标记辅助(MAS),比如显著性的SNP、INDEL,其它变异,以及实施全基因组选择(GS),考虑这些因素,放到模型中可以提升GS估计的准确性。

飞哥感言

Graph pangenome 的提出和应用,把利用多组学信息提升育种效率这句话落到了实践上!单纯算法上有机器学习、神经网络、强化学习,单纯生物学角度有基因组、转录组、蛋白组,但是图泛基因组的提出和应用,感觉才是最好的出路。对于育种数据分析的从业人员(比如我),是需要好好学习研究掌握这种方法的!

参考:

《An Introduction to Statistical Genetic Data Analysis》
https://zhuanlan.zhihu.com/p/362604272

丢失的遗传力--Missing heritability相关推荐

  1. 手把手教你计算广义遗传力

    1.广义遗传力的定义: 广义遗传力(broad-sense heritability)是遗传力的一种,是指遗传变异占表现型总变异的百分数,或遗传方差占表现型方差的百分数,用H²或hB2表示.这个概念可 ...

  2. Long-read human genome sequencing and its applications

    Long-read human genome sequencing and its applications 长read的人类基因组测序及其应用 Glennis A. Logsdon, Mitchel ...

  3. 一般线性模型和混合线性模型_线性混合模型如何工作

    一般线性模型和混合线性模型 生命科学的数学统计和机器学习 (Mathematical Statistics and Machine Learning for Life Sciences) This i ...

  4. 基因大数据的集成分析

    基因大数据的集成分析 胡湘红1, 彭衡2, 杨灿3, 张纵辉1, 万翔1, 罗智泉1 1 深圳市大数据研究院,广东 深圳 518172 2 香港浸会大学数学系,香港 999077 3 香港科技大学数学 ...

  5. 统计遗传学:第一章,基因组基础概念

    1. 基因组基础概念 大家好,我是飞哥. 前几天推荐了这本书,可以领取pdf和配套数据代码.这里,我将各个章节介绍一下,总结也是学习的过程. 引文部分是原书的谷歌翻译,正文部分是我的理解. 这本书共有 ...

  6. 最新综述:推荐系统的Bias问题和Debias方法

    ©PaperWeekly 原创 · 作者|陈佳伟 学校|中国科学技术大学博士后 研究方向|信息检索 导言 bias 是推荐系统中普遍存在的问题,受到广大研究者和从业者的关注.本文将分享何向南老师团队最 ...

  7. 精通 RPM 之校验篇_检验篇_检测篇

    文章目录 一.校验介绍 二.参考示例 (一)校验某个已安装的软件包的所有文件 (一)校验系统中所有已安装的软件包 (二)校验含有指定文件的软件包 (三)校验指定类别的软件包 (四)校验指定包裹文件 ( ...

  8. SQL Server FILESTREAM数据库损坏和修复

    This article will cover corruption and recovery scenarios in the context of SQL Server FILESTREAM in ...

  9. DXUT框架剖析(8)

    本文版权归博客园 lovedday 所有,转载请详细标明原创作者及原文出处,以示尊重! 原创作者: lovedday  原文出处:DXUT框架剖析(8) DXUT框架与错误处理 Direct3D AP ...

  10. 分享课丨微软研究院资深主任研究员郑宇教授:多源数据融合与时空数据挖掘(一)...

    3月3日,中国人工智能学会AIDL第二期[人工智能前沿讲习班]在北京中科院自动化所举行,本期讲习班的主题为[机器学习前沿].周志华教授担任学术主任,前来授课的嘉宾均为中国机器学习界一流专家.资深科研人 ...

最新文章

  1. windows平台搭建Mongo数据库复制集(类似集群)(三)
  2. 常考数据结构与算法:求二叉树的层序遍历
  3. 基本概念学习(9001)---指令系统
  4. html中如何使用渐变颜色代码,html – 如何在CSS中使用渐变作为字体颜色?
  5. python的flask微服务-flask微服务框架的初步接触
  6. 机器学习(六)——PCA降维处理
  7. QT正则表达式截取字符串末尾数字
  8. 电工模拟接线软件 app_超全的电工接线方法口诀
  9. 第21集丨问君何能尔?心远地自偏
  10. 美国计算机一年制,美国一年制硕士
  11. 南大计算机技术复试分数线,南大计算机复试分数线
  12. 刚刚,中国电子学会给阿里云飞天颁发了15年来首个特等奖
  13. PHP和web页面交互(一)
  14. 回溯(backtrack)描述
  15. 智能垃圾识别训练数据
  16. 数学通道的应用(十五)-电阻的测量
  17. Vue实现简单聊天对话框案例
  18. Google Earth Engine ——Landsat 5 TM_TOA数据集DN值缩放的、校准的传感器辐射度数据集
  19. RGB渐变LED,实现停止在任意颜色
  20. 微服务解决方案_微服务为您提供正确的解决方案

热门文章

  1. CSS 幻术 | 抗锯齿
  2. 【Python】UnicodeDecodeError: 'gbk' codec can't decode byte 0xfe
  3. 打造家庭影音网络:Gen8魔改ITX实现Esxi虚拟NAS+Openwrt+Win10
  4. python解决乱码转成中文
  5. CentOS7将home目录下中文目录改为英文目录
  6. python-opencv-使图片更清晰的几种方法
  7. Linux CentOS安装增强功能--完整版命令
  8. 广东四大姓氏,排名第三的是李姓,你的姓氏排名第几?
  9. 一文读懂TCP/IP组包发包全过程
  10. 计算机网络毕业设计选题背景,毕业设计论文选题依据与背景