从ArrayExpress数据库下载数据的方法

1、在ArrayExpress Search中输入编号或是关键词,选择符合的Accession,在ftp中进行手动下载,或是在R中用ArrayExpress包下载。

2、使用R包ArrayExpress的queryAE命令下载搜索结果,挑选合适的Accession,在R中使用ArrayExpress包进行下载。

ArrayExpress数据库的数据种类

1、IDF

The IDF contains an overview of the whole experiment, including the title, the submitter’s contact details, publication information, protocols and the experimental variables.

2、SDRF

The SDRF describes all the sample characteristics (e.g. cell type) or any treatment that the sample has been subjected to (e.g. growth in low oxygen conditions), and links each sample to its corresponding data file. The structure of the SDRF, i.e. the order of the columns, reflects the experimental workflow from source material, through intermediate steps (e.g. labelling of nucleic acids, preparation of sequencing libraries, running of sequencing assays) to raw and processed data.

3、ARF

The ADF describes how a microarray was manufactured and what was printed or synthesised on the array. Each position of the array or “probe” is annotated with information like the gene ID or the genomic position for which the probe is specific. This information is crucial for analysis of microarray raw data.

For commercially available microarrays, this file is provided by the array manufacturer and is often already archived in ArrayExpress.

Custom array designs need to be submitted to ArrayExpress before they can be associated with an experiment.

4、 Raw and processed data files

Experiment Page

范例

1 手动搜索并下载

在ArrayExpress搜索”cancer”

点击Accession,进入experiment页面,点击”Click to browse all available files”。

选择需要下载的文件进行下载,解压缩到指定目录。

2 使用bioconductor下载

2.1 使用queryAE命令搜索ArrayExpress数据库并下载搜索结果。

library("ArrayExpress")
sets <- queryAE(keywords = "pneumonia", species = "homo+sapiens")

报错。

上网搜索之后,发现最可能的问题是method="curl"不能执行。上github搜索queryAE,找到了函数的源代码。将其中的query = try(download.file(qr, queryfilename, mode="wb"))改成query = try(download.file(qr, queryfilename, mode="wb", method="auto")),手动输入代码,创建函数,再次执行命令。

成功

在这里附上queryAE函数的源代码。记得将query = try(download.file(qr, queryfilename, mode="wb"))改成query = try(download.file(qr, queryfilename, mode="wb", method="auto"))

2.2 下载数据

使用getAE函数下载全部数据,然后经过处理转化为数据对象。

mexp1422 <- getAE("E-MEXP-1422", type = "full")

或者:使用ArrayExpress函数直接下载raw data数据对象。

rawset <- ArrayExpress("E-MEXP-1422")

下载的raw data和processed data需要经过处理才能转化为数据对象。

raw data的处理

rawset= ae2bioc(mageFiles = mexp1422)

processed data的处理

确定要提取的列名。

cn <- getcolproc(mexp1422)
show(cn)

转换本地 processed MAGE-TAB 文件为R对象

proset <- procset(mexp1422, cn[2])

参考:

1、生信菜鸟团-用R语言包从EBI的arrayexpress数据库里面下载芯片数据

2、ArrayExpress: Import and convert ArrayExpress data sets into R object

3、ArrayExpress Reference Manual

芯片分析步骤1 芯片数据下载-ArrayExpress相关推荐

  1. ArcGIS利用DEM进行洪水淹没分析(附练习数据下载)

    ArcGIS利用DEM进行洪水淹没分析(附练习数据下载) 图片 基于数字高程模型 ( DEM )格网模型, , 实现给定水深情况下洪水淹没区的计算模型, 讨论洪水 淹没演进过程可视化实现的关键技术, ...

  2. 物种内共线性分析——JCVI安装以及数据下载(一)

    物种内共线性分析步骤--JCVI安装以及数据下载(一) 安装 最简单的方法是通过PyPI安装它: pip install jcvi #或者安装开发版本 pip install git+git://gi ...

  3. 第四次考核 Jimmy 学徒考核 Linux安装软件 rnaseq上游分析-2 ascp kingfisher数据下载ena Linux高速下载 Linux下载网页内容

    1 第四次考核 Jimmy 学徒考核 Linux安装软件 rnaseq上游分析_YoungLeelight的博客-CSDN博客 01-rna-seq从头开始 卖萌哥 Linux生信技能树Linux安装 ...

  4. TRMM降水数据下载步骤

    文章目录 1 TRMM数据下载地址 2 TRMM数据下载步骤 2.1 用户登陆 3.2 选择数据 3.3 数据选择结果 TRMM数据下载地址和下载步骤.更多数据下载地址详见:地学常用数据及其下载地址. ...

  5. LiDAR数据下载步骤

    文章目录 1 LiDAR数据下载地址 2 LiDAR标准数据集下载步骤 3 OpenTopography数据下载步骤 LiDAR数据下载地址和下载步骤.更多数据下载地址详见:地学常用数据及其下载地址. ...

  6. Gstreamer Dash直播数据下载分析

    Gstreamer Dash直播数据下载分析 Gstreamer Dash直播数据下载分析始于列表下载,止于container数据送到文件demux,比如送到qtdemux,主要是数据下载,尔后的流程 ...

  7. GEO数据库学习一(简介 数据下载 芯片知识)

    目录 1.GEO数据库简介 2.从GEO数据库下载数据 2.1使用GEOquery包从GEO数据库下载数据 2.2了解下载函数返回的对象 2.3ExpressionSet对象简单讲解 3.芯片基础知识 ...

  8. GEO芯片数据下载和探针ID转换(保姆级教程)

    GEO芯片数据下载和探针ID转换(保姆级教程) 一.问题描述 探针ID转换 数据是否预处理过 二.Rstudio的安装(建议阅读,避免后续转换时出错) 安装包的下载 安装步骤 三.(正文)芯片数据下载 ...

  9. 【GD32F427开发板试用】硬件SPI通信驱动CH376芯片,用单片机实现U盘数据下载

    本篇文章来自极术社区与兆易创新组织的GD32F427开发板评测活动,更多开发板试用活动请关注极术社区网站.作者:周文杰 SPI通信作为单片机多种基础数据传输模式中的一种,驱动外部芯片CH376实现数据 ...

最新文章

  1. Linux 中模拟延时和丢包的实现
  2. 双扬:一个非典型前端的成长之路
  3. Eclipse安装Gradle插件及配置
  4. js(Dom+Bom)第二天(2)
  5. centos8共享文件夹挂载_CentOS 8 安装并配置NFS服务
  6. UI标签库专题一:JEECG智能开发平台 BaseTag(样式表和JS引入标签)
  7. 2017.9.11 海拔 思考记录
  8. 支持上百万作业量自动调度与编排,BMC云课堂发布Control-M 20
  9. vue 可用于交互的表格
  10. 不知道这十项Linux常识,就别说自己玩过Linux!
  11. 记录ubuntu20.04成功编译安装opencv4 c++环境
  12. Java是什么?Java到底能干嘛?
  13. rf 遍历列表_RF之关键字、变量、循环
  14. 解密宝典——十招教你学会软件破解
  15. MySQL:慢查询日志
  16. Python×cmd:教你装X
  17. “澳本聪”是怎么从网红一步步变成“众矢之的”?
  18. P2P三种模式的分化和实质
  19. 微信消息延迟怎么办?
  20. CCF NOI 1041.志愿者选拔

热门文章

  1. 关于CardView的正解
  2. Baxter学习笔记4-Baxter仿真篇
  3. 微信小程序,时间戳转为日期格式
  4. 通过跳板服务器连接学校内网服务器并连接pycharm
  5. 存储笔记10 虚拟化
  6. 自定义控件——环形进度条
  7. 2021-08-01数据导出到Excel表格
  8. 中国电信目前的一些云产品
  9. MTK编译及修改记录
  10. c#查询QQ状态是否在线查询代码