链客,专为开发者而生,有问必答!

此文章来自区块链技术社区,未经允许拒绝转载。

我们上一期介绍了如何实现GO分析的可视化,运行了GOplot包自带的数据并且很畅通。然而我们如何才能获取那些可以直接输入的数据表格或者说前期的工作是怎么实现的。今天就跟大家介绍下如何利用R语言实现GO的流程化分析。

我们需要以下三个包:GO.db是GO分析的数据基础它包含了GO的基本分层信息;topGO是基因的功能富集分析包;GOProfiles利用GO谱进行富集分析。接下来我们逐个介绍如何使用以上三个R包。所有包的安装我们就不赘述了,都是通过bioconductor进行安装的。

GO.db的使用:

首先,我们看下GO.db数据包的构成:

以上都是GO.db中的数据包,首先我们看下GO.db中包含的列

其他的数据是以工程文件的形式存在,在此需要进行转化转化函数as.list(GOTERM)可将其转化为list 的可检索文件。

接下来我们介绍下其主要的检索函数select(),首先看下它的函数构成:

Select(data,keys,columns,keytypes)

Keys检索的关键词,keytypes指的关键词的类型,columns指的那些列被列出来。

当然还有其他一些有用的函数:

Keys()列出数据的主键列,或者加keytypes参数获取对应的列

MapIds进行数据库的批量匹配。

以上在GO.db中适用的所有函数在其他.db的数据包中都可以适用。如下:

GO的基础数据已经准备好,接下来是如何做功能富集分析并输出我们想要的结果,那么就用到了下面的包topGO,为了方便我们举例我们还载入了ALL数据包。还是那句话安装啥的直接略过。

首先我们的数据包括ALL,还有topGO自带的geneList。

这样我们就可以构建我们的检索数据。其中用到一个函数topDiffGenes()其主要功能是获取P小于0.01的基因列表。数据构建如下

affyLib

library(package = affyLib, character.only =TRUE) #这里其实就是需要载入hgu95av2.db包

sampleGOdata

运行后的结果如下:

至此我们的GO和gene匹配的过程结束了,接下来就是我们的核心部分富集分析了。富集分析有很多方法,在此包中的方法我们列出如下:

我们在此指提供fisher的检验方法,如果你需要更多方法可以自行去尝试。

resultFisher

相信聪明的你指导如何扩展,运行结果如下:

接下来就是整理结果了,整理成我们可以用的数据从而导入GOplot实现完美展示。不多说,请看下面的代码:

allRes

运行结果如下:

这个结构很熟悉了吧,接下来就是GOplot上场的时刻了。在此省略。。。。。。。。。。一万字。自行去实验吧。

我们继续降格topGO可视化的功能,那就是绘制GO层级图。

showSigOfNodes(sampleGOdata, score(resultFisher),firstSigNodes = 5, useInfo = 'all')#其中useInfo选项很多可以根据自己的需求显示对应的东西。

r语言进行go富集分析_R语言实现GO分析相关推荐

  1. go语言 第三方包安装方法_R语言3.6.3 安装程序下载及破解方法

    下载地址 百度网盘链接: https://pan.baidu.com/s/16smT3ceIjqaupn54AdgmgQ 提取码:7hap 解压密码:关注[菜瓜程序猿]微信公众号,回复[解压密码]获取 ...

  2. r语言进行go富集分析_R语言-GO富集分析的超几何检验和可视化

    Gene Ontology 可分为分子功能(Molecular Function),生物过程(biological process)和细胞组成(cellular component)三个部分.蛋白质或 ...

  3. r语言进行go富集分析_R语言GEO数据挖掘-功能富集分析

       功能富集分析 在得到了差异基因的基础之上,进一步进行功能富集分析,这里我们使用clusterprofiler包 本文将对差异基因进行 GO, KEGG注释并完成可视化,GSEA分析 Sys.se ...

  4. r语言进行go富集分析_R语言:clusterProfiler进行GO富集分析和Gene_ID转换

    一.读取文件,ID转换 1.读取文件 library(clusterProfiler) library(org.Hs.eg.db) #读取文件,原始文件中使用空格分割的 go_ythdf2 go_yt ...

  5. r语言pls分析_R语言:生存分析

    生存分析处理预测特定事件将要发生的时间.它也被称为故障时间分析或分析死亡时间.例如,预测患有癌症的人将存活的天数或预测机械系统将失败的时间. 命名为survival的R语言包用于进行生存分析.此包包含 ...

  6. r语言pls分析_R语言中的偏最小二乘PLS回归算法

    偏最小二乘回归: 我将围绕结构方程建模(SEM)技术进行一些咨询,以解决独特的业务问题.我们试图识别客户对各种产品的偏好,传统的回归是不够的,因为数据集的高度分量以及变量的多重共线性.PLS是处理这些 ...

  7. r语言pls分析_R语言中的偏最小二乘回归PLS-DA

    主成分回归(PCR)的方法 本质上是使用第一个方法的普通最小二乘(OLS)拟合​来自预测变量的主成分(PC).这带来许多优点: 预测变量的数量实际上没有限制. 相关的预测变量不会破坏回归拟合. 但是, ...

  8. r语言绘制精美pcoa图_R语言绘制交互式热图

    热图 通过热图可以简单地聚合大量数据,并使用一种渐进的色带来优雅地表现,最终效果一般优于离散点的直接显示,可以很直观地展现空间数据的疏密程度或频率高低.但也由于很直观,热图在数据表现的准确性并不能保证 ...

  9. 灰色关联分析_R语言使用灰色关联分析(Grey Relation Analysis,GRA)中国经济社会发展指标...

    原文链接: http://tecdat.cn/?p=16881​tecdat.cn 灰色关联分析包括两个重要功能. 第一项功能:灰色关联度,与correlation系数相似,如果要评估某些单位,在使用 ...

最新文章

  1. oracle 删掉虚拟目录,创建虚拟目录失败,必须为服务器名称指定“localhost”
  2. linux centos 丢失 grub.conf 启动系统
  3. scrollview背景
  4. python 文件处理软件_Python —— 文件处理
  5. Vuejs 写法实例
  6. python将输入值转化为元组_Python实现将元组中的元素作为参数传入函数的操作
  7. mongoose c++封装
  8. visual studio 让代码看起来更舒服
  9. 全局Angular CLI版本大于本地版本
  10. 分布式系统设计时,遵循CAP原则
  11. EtherCAT中AX58100烧写xml文件的说明(2)-TwinCAT软件安装
  12. 图解机器学习算法(14) | PCA降维算法详解(机器学习通关指南·完结)
  13. CodeIgniter session过期时间问题
  14. antv图例出现分页_自定义图例组件
  15. 双显示器扩展显示时怎么移动鼠标到另一块屏?
  16. 总结下利用python赚钱的方法,在闲余时间月赚2k-5k
  17. VBUS引脚外围电路设计
  18. Jedis实现批量删除redis cluster
  19. 基于matlab的雷达和通信系统,基于MATLAB的多功能通信信号源仿真
  20. 【Python】用A股当天收盘价去计算下一个交易日涨停价格

热门文章

  1. email是指利用计算机网络及时地,2015石家庄信息技术中考选择题
  2. ATT 和 GATT 协议学习
  3. 【ubuntu18.04安装】128G u盘安装ubuntu18.04
  4. BZOJ 2085 Poi2010 Hamsters Hash+倍增Floyd
  5. ffmpeg 代码阅读笔记1/2
  6. 高性能微服务网关APISIX - 常用插件(1)
  7. Lenovo X240/250锁定 Fn 键时 End 键工作不正常
  8. ManagementClass类|获取系统硬件配置
  9. 如何更快的查找线上系统问题--多次重大线上事故复盘
  10. 监听Android系统Log