连锁不平衡LD以及相关式子的推导
看了几篇LD的相关文章,都只有公式没有相关的解释,所以尝试自己理解一下。
- 等位基因(alleles): 同一位点上可能出现的基因,例如ABO血型基因
- 基因型(genotype): 同一位点上两个等位基因的组合。
- 基因频率(allele frequency):人群中一个等位基因占该位点全部基因的比例。
- 基因型频率(allele frequency):人群中特定基因型占该位点全部基因型的比例。
- 单体型(
haplotype
)是指一条染色体上紧密相连的两个或两个以上基因座一组等位基因的基因型,通常作为一个单位遗传不同基因座位的各等位基因在人群中以一定的频率出现。 - 称连锁不平衡 (
linkage disequilibrium,LD
):在某一群体中,不同座位上某两个等位基因出现在同一条单元型上的频率与预期的随机频率之间存在明显差异的现象。
简单点说,就是随机先后抛两枚骰子A,B,这两枚骰子的数字应该互不影响,我想抛出一个“A骰子是6,B骰子也是6”的情况(6,6),理论上概率是1/36。但我现在有两枚骰子很特殊,骰子A抛出6点的时候,骰子B一定也是6点,我手上的两枚骰子出现(6,6)的概率就是1/6,而不是理论的1/36,这时候我手上的两枚骰子就是“连锁不平衡”。
假设在同一染色体上有临近的两个双等位基因位点A和B,4个等位基因的频率分别为、
、
和
。我们就能画出如下表格:
B | b | total | |
A |
|
|
|
a |
|
|
|
total |
|
|
1 |
如果两个位点之间完全独立分离,那么单倍型AB的频率的期望值为,而如果观察到的实际频率为
,那么两个位点之间的连锁不平衡程度可以表达为如下式子:
只要D不等于0,就是连锁不平衡。
同理,利用上面表格里的数据,我们也能有如下代换
这个D的范围是和等位基因A、B的频率挂钩的,我们没法用它来在等位基因间做比较。
知道,D的范围该怎么算?
注意到我们之前有个表,只要让做一点小小的替换
B | b | |
A |
|
|
a |
|
|
由于每个格子里面都是基因型的频率,所以每个格子的取值范围都是≥0
计算就能得出D的范围
上面这个不等式中,我已经用和
代换过了。
因为D的范围不同,导致不同等位基因的D值不能做比较,那么一个显而易见的的想法就是将D的范围归一化,于是我们就有了一个D’:
- 当两个位点组成的可能4种单倍型只出现其中3种时,
D’=±1
,即两个位点处于“完全连锁不平衡(complete LD
)”。如果两个等位基因频率相近时,较高的D‘值意味着较高的连锁不平衡程度。 - 而|
D'|<1
的时候,D’
的数值究竟表征了多大程度的连锁不平衡,是很难做出准确判断的。如果样品量太小,D’值的实际含义很容易被夸大,尤其某个位点的其中一个等位基因的频率很低的时候。因此,较高D’值的背后,实际上可能是连锁不平衡程度很低的两个位点。
另一种归一化的思想是:
r2 =1表示两个等位基因提供完全相同的信息。
(未完待续)
连锁不平衡LD以及相关式子的推导相关推荐
- NE555基本原理及相关公式的推导
NE555基本原理及相关公式的推导 基本原理 公式推导 基本原理 NE555主要由分压电路,电压比较器,RS触发器三部分组成: 分压电路 电压比较器 RS触发器 提供电压比较器比较电压 根据触发信号输 ...
- 位运算里面几个式子的推导
关于位运算以前接触得不多,对里面补码运算的一些式子看得我一头雾水.今天花了点时间,自己把那些公式全部推导一遍,顿时觉得心中明了很多.希望本文能给有意学习位运算的同学带来帮助 首先开始说之前,先约定好一 ...
- 计算差分方程的收敛点_时间序列分析第一章 差分方程
时间序列分析关注事件或者说变量在时间上的动态变化情况.如果将时间人为分期,并记变量y在第t期的值为yt,那么将变量在第t期的值yt与另外的变量wt及第t期以前的值(如yt-1)联系起来的方程即为差分方 ...
- 专题:深度神经网络基本问题的原理详细分析和推导
文章目录 **写在最前面** **1 神经网络算法的直观了解** **1.1 神经网络过程描述**: **1.2 神经网络相关的几个问题** **1.2.1 表征假设和激活函数** **1.2.2 结 ...
- 四旋翼姿态解算——互补滤波算法及理论推导
转载请注明出处:http://blog.csdn.net/hongbin_xu 或 http://hongbin96.com/ 文章链接:http://blog.csdn.net/hongbin_xu ...
- zemax模拟ld_Zemax光学设计实例(83)在非序列模式下LD阵列的光束整形
导论:半导体激光器(Laser Diode,LD)是很常用的激光器件,普遍应用在光通信.激光泵浦等领域.阵列LD通常因为管芯空间分布的原因导致光束质量较差,需要光束整形以后才能使用.本文以LD ba ...
- Python 字典推导式 - Python零基础入门教程
目录 一.Python 字典推导式简介 二.Python 字典推导式语法 三.Python 字典推导式实战 1.在字典中提取或者修改数据,返回新的字典 2.在字符串中提取数据,返回新的字典 四.重点总 ...
- Python 列表推导式 - Python零基础入门教程
目录 一.Python 列表推导式简介 二.Python 列表推导式语法 三.Python 列表推导式练习 1.Python 列表推导式案例一 2.Python 列表推导式案例二 3.Python 列 ...
- Python 条件推导式 - Python零基础入门教程
目录 一.Python 条件推导式简介 二.Python 条件推导式使用 1.Python 条件推导式语法 2.Python 条件推导式练习 三.猜你喜欢 零基础 Python 学习路线推荐 : Py ...
最新文章
- 万众瞩目,2018中国企业数字化转型国际峰会,重磅来袭
- Charles拦截与篡改
- LINUX2.4.x网络安全框架
- mfc 创建线程函数AfxBeginThread,线程中访问mfc控件
- ARMA模型的性质之方法性工具
- 国庆档电影《我和我的祖国》3天票房破10亿
- Kafka中的配置项参数unclean.leader.election.enable
- bug-Skipping optimization due to error while loading function libraries: Invalid argument: Functions
- 订单同步有技巧,双十一高峰不再怕
- cmd(批处理脚本)实现批量下载图片
- igraph基本使用方法示例
- BurpSuite使用详解(三)Spider功能
- 蒟蒻的单调队列orz,真的蒻
- browsersync——代码变动实时更新到页面
- 宝塔php memory_limit,优化宝塔面板提高网站运行速度教程
- 【TCP专题】TCP的可靠性传输
- 选择隔离电源还是非隔离电源?
- 字符串(字符串的拼接及一些常用方法)
- C++版本OpenCv教程(四十三)直线拟合
- 基层管理之正负向激励