linux系统 gwas分析,GWAS真的只有关联分析这么简单?
原标题:GWAS真的只有关联分析这么简单?
近年来,全基因组关联分析(Genome wide associationstudy,GWAS)在筛查和鉴定动植物重要经济性状的主效基因方面得到了广泛应用。GWAS关联精度高,研究周期短,已成为功能基因挖掘的重要手段。
我们在看文献的时候一般会看到全基因组关联分析线性模型计算出的曼哈顿图和QQ图。那在关联分析之前,如何评估群体结构和亲缘关系?你知道么?
图1 曼哈顿图和QQ图[1]
今天我们就从GWAS入手,分享其相关的研究方法,帮助大家深入了解应该怎么进行GWAS。
1
系统发育树的构建
我们进行系统发育树的构建是为了揭示群体中每个个体的聚类关系,它可以用来描述样本之间的分类和演化关系,是反映群体结构最经典、直观、有效的方法。目前发育树主要的构建方法有距离法(如NJ)、最大简约法(MP)、最大似然法(ML)和贝叶斯推断法(BI)。
但是ML、BI法主要用于序列差异较大材料的进化树构建,构建过程需要的时间较久;MP法则易出现长枝吸引(LBA)现象,会使原本不是姐妹群的分类元错误的聚集在一起,干扰发育树的构建。而在GWAS模型中,个体间关系相对较近,序列差异小,因此采用NJ法即可满足要求。
图2 系统发育树
2
群体结构分析
群体结构分析是为了显示每个个体的来源以及个体的组成信息。一般利用Structure软件进行群体结构推断,该软件是使用贝叶斯推断的方法,对每个K值模拟的结果都会对应产生最大似然值(likelihood)。
structure软件中每个最大似然值是取了自然对数后输出的(ln likelihood)。lnlikelihood越大、重复间的ln likelihood变化越小,说明K值越接近于真实情况。简单来说,就是likelihood越大,越趋近于平缓处对应的最小K值,则是我们要选择的最优K值。
但是Structure软件有一个很大的缺点就是运行效率太慢,因此出现了很多类似的代替软件,其中Admixture软件是比较常用的。该软件与Structure软件分析原理相同。但Admixture是根据交叉验证错误率来确定最优分数群,交叉验证错误率最小的K值对应最优的分群数。
最优K值对应的样本遗传成分矩阵,可以作为GWAS的固定效应协变量矩阵(Q矩阵),用以控制群体结构造成的假阳性。
图3 Admixture群体结构分析
3
PCA分析
在群体遗传学中,PCA分析可以把成千上万的标记进行综合,抽取主要信息,用2-3个维度把群体中样本的聚类关系弄清楚。PCA分析与群体结构分析可以相互验证,使用时选择其一即可。
当群体结构的最优分群数较低,从进化树和PCA结果看材料分化程度又比较高时,优先选用PCA分析中各个材料在前几个主成分中的得分矩阵作为协方差矩阵参与关联分析,用于模型中控制群体结构造成的假阳性。
图4 样本聚类图
4
亲缘关系的评估
亲缘关系是指在非家系群体或系谱不明确的群体中两特定材料之间的遗传相似度与任意材料之间的遗传相似度的相对值。材料间不平衡的血缘关系是导致标记出现非连锁相关的另一个重要原因,小家系的存在会使关联分析结果出现假阳性。为了避免这种情况的产生,往往会把亲缘关系矩阵作为随机效应协变量矩阵(K矩阵)加入GWAS模型。
图5 亲缘关系矩阵
那么现在,你了解GWAS了么?
基迪奥一直秉持优秀的服务质量和定制化的个性分析,全面更新了群体进化与全基因组关联分析流程,让您的GWAS更丰富、更简单。欢迎各位老师与我们联系!
参考文献
[1]Huang X, Zhao Y, Wei X, et al. Genome-wide association study of flowering time and grain yield traits in a worldwide collection of rice germplasm[J]. Nature Genetics, 2012, 44(1):32.返回搜狐,查看更多
责任编辑:
linux系统 gwas分析,GWAS真的只有关联分析这么简单?相关推荐
- GWAS理论 1-5 全基因组关联分析结果解读与经典案例介绍
一.主要结果 二.结果可视化与后续分析建议 置换检验(Permutation test) bonferroni threshold 和 FDR 看我之前的简书文章有解释 可视化 理想结果 失败结果 受 ...
- GWAS - 基因型与表型的关联分析流程
这里介绍的SNP数据与单一表型的相关分析流程 一.准备plink文件 ped和map文件转换为bed.fam.bim plink --file mydata --out mydata --make-b ...
- Linux系统异常夯死或宕机分析
一.问题描述 某次某云主机访问异常,登录云主机后来发现vnc界面夯死,输入命令无反应,console界面发送重启指令也无反应,只能云平台管理页面强制重启. 二.问题分析: 1>重启后查看sysl ...
- python灰色关联度分析代码_灰色关联分析法步骤 - osc_uwnmtz9n的个人空间 - OSCHINA - 中文开源技术交流社区...
https://wenku.baidu.com/view/dc356290af1ffc4fff47ac0d.html?rec_flag=default&sxts=1538121950212 利 ...
- 灰色关联度分析_数学建模|关联分析之术|灰度预测模型预备知识
关联分析 作者:PureFFFmennory 联系方式:ProdigyYanng@gmail.com 1. 目的 现实客观事物的每个现象非常复杂,影响因素繁多.对某一个系统而言,需要对该系统进行因素分 ...
- python做灰色关联度分析_python实现灰色关联分析(GRA)——以红酒质量指标为例
目录 程序简述 数据集截图 程序/数据集下载 核心代码解析 Module/BuildModel.py(接口,可以直接运行) 接口调用.运行效果 Main.py 程序简述 对红酒质量指标数据进行灰色关联 ...
- python 灰色关联分析_基于灰色关联分析和功效组分的大黄药材质量评价
基于灰色关联分析和功效组分的大黄药材质量评价* 拱健婷 1,2 ,李 莉 1,2 **,邹慧琴 3 ,张金霞 1,2 ,徐 东 3 ,毛克臣 1 ,陈慧 荣 3 ,张明明 3 ,杨瑞琦 3 [摘 要] ...
- 韦东山二期驱动视频-热拔插驱动——RK3399自制linux系统不支持HDMI热拔插问题分析
背景: 公司的板子,对于HDMI的显示器热拔插不支持,只能在插入HDMI时启动才能输出,而当开机之后,再插入HDMI显示器则无输出,不知道原因. 推测如下: 1.设备树的引脚配置有误,导致插入HDMI ...
- Linux系统下ifconfig命令使用及结果分析
Linux下网卡命名规律:eth0,eth1.第一块以太网卡,第二块.lo为环回接口,它的IP地址固定为127.0.0.1,掩码8位.它代表你的机器本身. 1.ifconfig是查看网卡的信息. if ...
最新文章
- codeforces水题100道 第二十七题 Codeforces Round #172 (Div. 2) A. Word Capitalization (strings)...
- 埃森哲5G智慧城市报告:美国GDP将狂增5千亿
- G - Mike and gcd problem
- htmlbuilder php phantomjs
- jvm(6)-java类文件结构(字节码文件)
- python3字符串拼接_Python3基础 str + 字符串变量拼接
- Zuul和Eureka的负载均衡示例
- 算法高级(13)-常见负载均衡算法Java代码实现
- Default Folder X几个小技巧分享
- Litespeed如何安装phpmyadmin/pureftpd
- 为何区块链能成为金融行业的香饽饽?只因这5个关键因素!
- 用60行代码实现一个高性能的圣诞抽抽乐H5小游戏(含源码)
- phpcms extention.func.php数据的使用
- 【区块链108将】流量之王的48小时生死转折
- php怎样转换成html格式,php实现转换html格式为文本格式的方法
- 海思SD3403开发板学习(一)
- 如何部署JSP应用到阿里云服务器上(一)
- 『计组』CPU 如何区分指令和数据
- OA协同办公系统存在的意义是什么?
- 如何使用SecureCRT连接华为eNSP模拟器
热门文章
- MySQL 5.7 PREPARE、EXECUTE、DEALLOCATE语句介绍
- VMware克隆步骤
- 如何解决深度冲突(Z-fighting),画面闪烁的问题
- 经纬度不同表示方式转换
- 彻底了解JAVA-策略模式(皇室战争是怎样炼成的)
- php 网站计数器,PHP用函数嵌入网站访问量计数器
- Linux——exec函数族原理及特性、execlp和execl函数
- URP——后期处理特效——Shadows Midtones Highlights
- Running the evict task with compensationTime 0ms
- win7驱动程序未经签名可以使用吗_win7系统怎么禁用驱动程序签名强制