使用TASSEL学习GWAS笔记(5/6):混合线性模型进行GWAS分析(MLM模型)
笔记计划分为六篇:
第一篇:读取plink基因型数据和表型数据
第二篇:对基因型数据质控:缺失质控,maf质控,hwe质控,样本质控
第三篇:基因型数据可视化:kingship,LD,MDS,PCA
第四篇:一般线性模型进行GWAS分析(GLM模型)
第五篇:混合线性模型进行GWAS分析(MLM模型)
第六篇:TASSEL结果可视化:QQ plot,曼哈顿图
已完成前四篇,本篇是第五篇。
1. 将质控的plink数据和表型数据读入到TASSEL软件
质控后的plink数据和表型数据:
读取表型数据到TASSEL中:
读取基因型数据到TASSEL中:
2. 一般线性模型(GLM)介绍
MLM模型中,将每个SNP作为固定因子进行回归分析,将亲缘关系矩阵(kinship或者A矩阵)作为随机因子,进行SNP的显著性检验,P值就是GWAS分析的p-value,effect就是SNP的effect值。如果有其它因素需要考虑,就放到协变量里面,比如性别,PCA,Q矩阵等。MLM和GLM不同的就是它考虑kinship的影响。
重点是对每个SNP做回归分析,提取effect和p-value。
3. 合并数据
TASSEL分析中,需要将分析的表型和基因型数据进行合并,合并为一个数据框,然后对该数据框进行分析。
3.1 对基因型数据进行PCA分析
选中qc_plink基因型数据,点击菜单 Analysis --> Relatedness --> PCA,然后点击确定即可。
PCA分析结果:
3.2 根据基因型数据计算kinship
选中基因型数据,点击菜单 Analysis --> Relatedness --> Kinship
默认选项即可:
查看kinship:
3.3 将PCA+表型+基因型合并
选中三个数据,然后点击Data中的Intersect Join,进行数据合并。注意,不要讲kinship放进去。
3.3 查看合并后的数据
可以看到,数据中包括ID,PCA及结果,表型性状数据,基因型数据。
4. MLM模型
选中合并后的数据 + kinship,点击Analysis --> Association --> MLM
点击默认Run运行即可。
5. MLM结果查看
可以看到,Result中有两个MLM结果,第一个为GWAS结果,第二个为每个SNP的效应值情况。看第一个就行。
因为这是多个性状的分析,所以所有结果放在了一起。
- 第一列为性状,这里包括三个性状,在进行作图时需要将数据分开
- 第二列为SNP名称
- 第三列为染色体名称
- 第四列为SNP的物理位置
- 第五列为df
- 第六列为F检验结果
- 第七列为p值
- ……
6. 导出结果
查看结果:
7. TASSEL中的结果可视化
QQ图:
曼哈顿图:
这里,曼哈顿图需要指定性状,这里我们选择EarDia这个性状进行可视化:
图片可以保存到本地。
ok,第五篇搞定了。下一篇是GWAS结果放到R语言中可视化,欢迎继续关注。
欢迎关注我的公众号:
育种数据分析之放飞自我
。主要分享R语言,Python,育种数据分析,生物统计,数量遗传学,混合线性模型,GWAS和GS相关的知识。
使用TASSEL学习GWAS笔记(5/6):混合线性模型进行GWAS分析(MLM模型)相关推荐
- 深度学习系列笔记——贰 (基于Tensorflow Keras搭建的猫狗大战模型 一)
猫狗大战是著名的竞赛网站kaggle几年前的一个比赛,参赛者得到猫狗各12500张图片,作为训练集,另外还会得到12500张猫和狗的图片,作为验证.最后提交结果至kaggle平台,获得评测分数. 本篇 ...
- 深度学习系列笔记——贰 (基于Tensorflow2 Keras搭建的猫狗大战模型 三)
深度学习系列笔记--贰 (基于Tensorflow Keras搭建的猫狗大战模型 一) 深度学习系列笔记--贰 (基于Tensorflow Keras搭建的猫狗大战模型 二) 前面两篇博文已经介绍了如 ...
- 转:tensorflow深度学习实战笔记(二):把训练好的模型进行固化
原文地址:https://blog.csdn.net/chenyuping333/article/details/82106863 目录 一.导出前向传播图 二.对模型进行固化 三.pb文件转tfli ...
- 使用TASSEL学习GWAS笔记(1/6):读取plink基因型数据和表型数据
今天整理一下TASSEL操作GWAS的笔记. 笔记计划分为六篇: 第一篇:读取plink基因型数据和表型数据 第二篇:对基因型数据质控:缺失质控,maf质控,hwe质控,样本质控 第三篇:基因型数据可 ...
- 使用TASSEL学习GWAS笔记(3/6):基因型数据可视化:kingship,PCA,MDS
笔记计划分为六篇: 第一篇:读取plink基因型数据和表型数据 第二篇:对基因型数据质控:缺失质控,maf质控,hwe质控,样本质控 第三篇:基因型数据可视化:kingship,LD,MDS,PCA ...
- 使用TASSEL学习GWAS笔记(6/6):TASSEL结果可视化:QQ plot,曼哈顿图
笔记计划分为六篇: 第一篇:读取plink基因型数据和表型数据 第二篇:对基因型数据质控:缺失质控,maf质控,hwe质控,样本质控 第三篇:基因型数据可视化:kingship,LD,MDS,PCA ...
- 使用TASSEL学习GWAS笔记(4/6):一般线性模型进行GWAS分析(GLM模型)
笔记计划分为六篇: 第一篇:读取plink基因型数据和表型数据 第二篇:对基因型数据质控:缺失质控,maf质控,hwe质控,样本质控 第三篇:基因型数据可视化:kingship,LD,MDS,PCA ...
- GWAS分析中SNP解释百分比PVE | 第三篇,MLM模型中如何计算PVE?
之前,想研究一下GWAS分析汇中PVE(表型方差解释百分比)的计算方法,写了两篇: GWAS分析中SNP解释百分比PVE | 第一篇,SNP解释百分比之和为何大于1? GWAS分析中SNP解释百分比P ...
- GWAS分析中SNP解释百分比PVE | 第四篇,MLM模型中如何手动计算PVE?
系列部分: GWAS分析中SNP解释百分比PVE | 第一篇,SNP解释百分比之和为何大于1? GWAS分析中SNP解释百分比PVE | 第二篇,GLM模型中如何计算PVE? GWAS分析中SNP解释 ...
- 混合线性模型学习笔记1
1. 课程来源: https://02429.compute.dtu.dk/Frontpage 需要安装的R包 install.packages(c('lmerTest', 'lsmeans', 'c ...
最新文章
- python为什么中文要encoding-python中encoding是什么意思
- 电脑日常故障及处理(二)
- 【计算机网络】计算机网络 相关概念 ( 计算机网络概念 | 计算机网络功能 | 组成 | 工作方式 | 功能组成 | 分类 )
- 重启sshd_调整linux服务器sshd的MaxStartups,确保可以并行登录
- 【矩阵乘法】【倍增】美食家(luogu 6772)
- java虚拟内存扩展_Java 8虚拟扩展方法
- 路由器距离向量算法计算举例_路由器基本原理是什么 路由器基本发展情况介绍【图文】...
- Windows Mobile 开发系列文章收藏 - Windows Mobile 6.x
- (52)Xilinx差分原语-IBUFGDS与OBUFGDS(第11天)
- Android OpenGL ES(六)创建实例应用OpenGLDemos程序框架 .
- 我们需要什么样的计算
- HTML常用的标签总结
- html异步 post,Jquery中Ajax/Post同步和异步请求
- 循环中需要调用异步怎么确保执行完再执行其他的_什么是事件循环和异步编程?5种使用async/await更好地编码方式!...
- 截图工具-Excel加载宏(图片大小可调)
- appbase 和docbase
- 修改Android10系统源码关闭selinux
- 使用dom4j来解析xml文件或xml字符串
- 一文读懂 Redis!
- 单工通信模式、半双工通信模式和全双工通信模式的区别
热门文章
- 用于检测未知恶意软件的深度学习方法
- Python使用matplotlib绘制龟兔赛跑中兔子和乌龟的行走轨迹
- 【电子技术】高速串行信号的预加重(Pre-emphasis)和去加重(De-emphasis)
- html设置字体仿宋GB2312,怎么设置仿宋gb2312字体,仿宋gb2312字体设置教程
- 蓝光护目镜 v6.66.6.3
- 【大屏可视化模板】vue-dataV-echarts-elementul大屏数据可视化方案,屏幕适配方案等比例缩放
- Python题目:判断101-200之间有多少个素数,并输出所有素数,简单方法
- BUU WEB [SUCTF 2019]EasyWeb
- 无人车系统(四):轨迹跟踪PID控制
- Origin绘制图表所需要的步骤