GEO数据库架构介绍
欢迎关注”生信修炼手册”!
GEO是一个国际化的开源项目,允许研究者提交自己的数据到该数据库,在世界范围内公开共享自己的数据,网址如下
https://www.ncbi.nlm.nih.gov/geo/
该数据库最开始主要用于分享芯片数据,后来随着NGS技术的发展,也支持上传高通量测序数据。
在该数据库中,将所有相关信息分成以下几类,示意如下
1. Platform
芯片平台或者测序平台,每个平台有一个唯一的以GPL
开头的编号,高通量测序平台,示意如下
由测序仪和物种的组合构成了不同的platforn,芯片平台示意如下
芯片平台会给出探针相关信息,比如对应的基因,探针序列等,示意如下
2. Sample
sample代表的是一个样本的数据,可以是任意platform产生的数据,有一个唯一的以GSM
开头的编号,对于芯片数据,会给出探针的表达量值,示意如下
对于高通量测序数据,根据数据类型会给出不同种类的文件,如果原始的测序数据有上传到SRA数据库,也会给出对应SRA编号,示意如下
3. Series
series代表属于同一个实验设计的一组样本,通常情况下会给出该系列下所有样本的附件文件的压缩包,示意如下
以上这3种信息由数据的提交者提供,对于同一个series下的原始数据,GEO会对其进行简单的挖掘,比如基于表达量进行聚类分析等,这些分析的结果对应的类型为DataSet
, 有一个唯一的以GDS
开头的编号,GDS2225
示意如下
基于GSE3541
的数据得到,该数据是一套大鼠的芯片数据,样本分为case和control两组,每组3重复,基于表达量的聚类结果示意如下
根据DataSet中提供的表达谱数据,对于每个探针或者基因在所有样本中表达量进行探究,就得到了Profile
数据,示意如下
数据共享使得基于公共数据库的数据挖掘成为可能,也可以通过分析已有的同种类型数据来和自己的测序数据相互印证。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!
GEO数据库架构介绍相关推荐
- 昆仑分布式数据库架构介绍
一.前言 昆仑分布式数据库集群(下文简称昆仑数据库)是一个分布式关系数据库管理系统,面向TB和PB级别海量数据处理,以高吞吐量和低延时处理海量数据高并发读写请求. 它提供健壮的事务ACID保障,高效易 ...
- postgres 数据库架构介绍--1
简介 postgres 数据库是目前最流行的开源关系型数据库之一,其具有丰富的数据类型.多版本并发控制.同步/异步流复制.嵌套事务和预写式日志等功能,广泛地应用于金融.物流.制造/电信等领域 基 ...
- Mysql数据库架构介绍
一.Mysql单例数据库架构 1.Mysql体系介绍 网络连接层:提供与Mysql服务器建立连接的支持 核心服务层:主要包含系统管理和控制工具.连接池.SQL接口.解析器.查询优化器和缓存六个部分 存 ...
- 关系型数据库架构介绍及主流应用场景
前言 做为目前主流的模型数据库类型,关系型数据库的架构随着业务规模的增长做出相应的变化,本章我们来学习关系型数据库架构的变化以及主流的应用场景. 关系型数据库架构 随着业务规模增大,数据库存储的数据量 ...
- MySQL第4天:MySQL的架构介绍之修改数据库编码格式
MySQL的架构介绍之修改数据库编码格式 1.配置文件介绍 #编写时间:2017.3.6 #编写地点:广州 上一篇文章可知mysql的配置文件在:/usr/share/mysql,其中/usr/sha ...
- 数据库高级知识——mysql架构介绍(二)
文章目录 1.Mysql逻辑架构介绍 1.1 总体概览 1.2 查询说明 2.Mysql存储引擎 2.1 查看命令 2.2 各个引擎简介 2.3 MyISAM和InnoDB 2.4 阿里巴巴.淘宝用哪 ...
- 达梦数据库——DM8安装操作及体系架构介绍
文章目录 一.数据库行业的发展趋势 二.国产数据库的现状 1.自主研发 三.达梦公司的介绍和达梦产品 1.达梦公司的由来 2.达梦公司的产品线 四.DM8的安装及实例的管理 1.软件信息收集 2.硬件 ...
- 大型系统架构设计-阿里淘宝天猫双十一数据库核心技术介绍
目录 零.双十一是什么? 一.2013 双十一数据库指导思想 1.知己知彼,百战不殆 (1)如何做到知己 (2)如何做到知彼 2.平时多流汗,战时少流血 (1)真实环境压测之缓存穿透 (2)MetaQ ...
- 三种数据库架构的介绍
从数据库架构设计的角度,主要有三种,Shared Everything.Shared Disk以及Shared Nothing. 1. Shared Everything 一般指的是单个主机的环境,完 ...
最新文章
- 数据库_数据库篇-第一章:数据库基本概念
- web压力测试工具ab安装及使用
- 9.C++弱引用智能指针weak_ptr的用处
- 成功解决 _mssql.c(568): fatal error C1083: 无法打开包括文件: “sqlfront.h”: No such file or directory
- 【Android开发】线程与消息处理-Handler消息传递机制之Looper
- prometheus-net.DotNetRuntime 获取 CLR 指标原理解析
- Max Sum Plus Plus HDU - 1024
- 爬虫521错误(又是一次和可爱的前端vs的故事)
- Android Studio 安装具体步骤(配图)
- Netty空闲心跳检测机制
- 打印图片一直显示连接传真服务器,打印机打印时显示传真怎么办
- 脚上有一个很灵的止咳穴位
- Python简单处理excel数据(拆分合并单元格、根据表头合并sheet、添加列数、添加内容操作)
- 基频和倍频的概念_一倍频分析
- 【网络工程】9、实操-万达酒店综合项目(三)
- 2020年计算机专业最好的笔记本电脑,性价比最高的笔记本电脑推荐 2021年最值得入手的笔记本电脑...
- 2019 GDUT Winter Training III
- 系统应用 odex 转 dex
- 微型计算机原理第三版考试,微机原理试题及答案
- 敲代码之外,程序员创作创富的前景如何?