生物信息大数据数据库(NCBI、EBI、UCSC、TCGA)
想系统的学习生信数据库可以先看一下北大的公开课,有一章专门讲的数据库与软件:
1-生物信息学:导论与方法 北大\10 生物信息数据库及软件资源
一个优秀的生信开发者能够解决如下问题:
- 如何鉴定一个重要的且没有被解决的生物学问题?
- 如何将该问题转化为一个可计算的问题?
- 如何提出一个解决此问题的算法?
- 如何实现该算法?
- 如何评估算法?
生信工具使用者需要解决如下问题:
- 每个方法解决的是哪个生物学问题?
- 该方法有哪些基本的假设?
- 每个参数是什么意思,都是用来干什么的?
- 准确度评估,sensitivity and specificity,tradeoff,应该追求哪一个?
- 生物学问题和方法的局限性?
生信资源的分类:
- 集中资源&独立资源
- 数据库&软件工具
- 原始数据库&二级数据库
- 命令行工具&网页服务器工具
NCBI
EBI
UCSC Genome Browser:基因组浏览器,表达调控、变异数据,track,ENCODE 非编码元件(计划)
集中资源
NCBI |
EBI |
UCSC |
|
链接 |
Database、Tools、Resource List(A-Z) |
by topic |
Table Browser |
Tools |
BLAST |
BLAST、Exonerate、ClustalW2 |
BLAT、In-Silico PCR |
Data Repository |
GenBank、GEO、SRA |
ArrayExpress、ENA、PDBe |
ENCODE |
DNA/Genome |
Genome |
Ensembl、Genomes |
Ideogram、Recombination Rate、GC Content |
DNA/Gene |
Gene |
Ensembl |
UCSC Genes、GENCODE、RefSeq Genes |
RNA |
RefSeq |
Ensembl |
mRNAs、ESTs、UniGene |
Proteins |
Protein, RefSeq、Conserved Domain |
UniProt、InterPro、PRIDE |
|
Expression |
UniGene |
Expression、Atlas |
Affy Exon Array、Caltech RNA-seq、Allen Brain |
Regulation |
Transcription、TFBS、Epigenetics、DNaseI HS |
||
Literature |
PubMed |
||
Ontology |
Gene Ontology |
||
Comparative Genomics |
Taxonomy、HomoloGene |
*Ensembl |
Conservation、Neandertal |
Variation |
dbSNP、dbVar |
*Ensembl |
SNPs、DGV、RepeatMasker |
Disease |
OMIM、MeSH、dbGaP、ClinVar |
GAD、COSMIC、ClinVar、GWAS Catalog、QTLs |
独立资源
癌症
DNAnexus Reanalyzes Cancer Genome Atlas Data
DNAnexus完成世界上最大的泛癌症数据的重分析(附数据下载) - 基因慧
DNANexus:DNANexus专注于建立一个云计算服务器中的DNA数据库,然后以服务方式将该数据库提供给研究者和科学家。DNAnexus和谷歌开展技术合作,提供最为全面的DNA数据库,它可通过美国国家生物技术信息中心(NCBI)下SRA的网站访问到这些DNA数据(2011年2月,NCBI曾宣布由于联邦政府削减经费支持逐步淘汰SRA)。
Cancer Genome Atlas:泛癌症基因组
The Cancer Genome Atlas:就是 TCGA 的全称,Atlas 古希腊的一个神
TCGA 官网 User Guides and Help
转载于:https://www.cnblogs.com/leezx/p/6182161.html
生物信息大数据数据库(NCBI、EBI、UCSC、TCGA)相关推荐
- 【推荐】2020,2021网易数字+大会(云原生微服务+大数据数据库+网易AI实践集合+其他) - (共187份)
[推荐]2020,2021网易数字+大会(云原生&微服务+大数据&数据库+网易AI实践集合+其他) - (共187份) 下载地址:https://download.csdn.net/d ...
- 大数据数据库的技术对垒:MapReduce vs. MPP[作者:李明]
大数据数据库的技术对垒:MapReduce vs. MPP --作者:李明(email: mli@pivotal.io) 这些年大数据概念已经成为IT界的热门,我们经常也会在新闻和报纸中看到.大数据概 ...
- 大数据数据库选型:NoSQL数据库入门
大数据处理,涉及到从数据获取到数据存储.数据计算的诸多环节,各个环节需要解决的问题不同,相关岗位要求的技能也不同.在数据存储阶段,对数据库选型是非常重要的一项工作.今天的大数据数据库培训分享,我们就来 ...
- 大数据数据库技术简介与分类分析
说起大数据生态,不得不提大数据生态系统图,而大数据行业却不断的发生着巨变,目前的这张图应该还算比较新了. 创业者们蜂拥至这个行业,这个行业正变得越来越拥挤.Hadoop似乎已经奠定了其作为整个大数据生 ...
- 大数据 数据库 评测_为什么腾讯QQ的大数据平台选择了这款数据库?
导读:本文带你了解一个开源的.高性能的时序型数据库--InfluxDB. 作者:韩健来源:大数据DT(ID:hzdashuju) 00 为什么QQ要选择InfluxDB?从2016年起,笔者在腾讯公司 ...
- 阿里大数据-数据库总结:RDS ADS OTS Maxcompute(ODPS)
阿里云大数据开发套件的使用,主要涉及到odps.ads.rds.ots相关数据库的操作,所以针对性的做一些总结,并将阿里云中产品与实际产品对应分析. Maxcompute(原odps) 阿里云中的Ma ...
- 面对高并发,大数据 数据库分区、分表、分库,读写分离
https://blog.csdn.net/liangz/article/details/79352870 https://www.cnblogs.com/sunny3096/p/8595058.ht ...
- 大数据时代数据库-云HBase架构生态实践
2019独角兽企业重金招聘Python工程师标准>>> 摘要: 2018第九届中国数据库技术大会,阿里云高级技术专家.架构师封神(曹龙)带来题为大数据时代数据库-云HBase架构&a ...
- 大数据Map Reduce 和 MPP数据库 的区别
总结来说MR是一个编程模型,你可以用MR这个编程模型自己实现MPP所做的事. MPP则是一种SQL的计算引擎. "MR分而治之的策略" 和 "Massively Para ...
最新文章
- linux修改密码和宽限天数,Linux chage用法详解:修改用户密码状态
- 红黑树(三)之 C++的实现
- numba.jit警告:warnings.warn(errors.NumbaDeprecationWarning(msg, state.func_ir.loc))
- hadoop删除DataNode节点
- linux tomcat 启动权限不足解决办法
- 前端学习(3270):js中this的使用call bind
- 关于SEL的简单总结
- https open api_通过bilibili_api获取弹幕+绘制词云的方法
- C 中的左值(Lvalues)和右值(Rvalues)
- matlab 短时能量计算+源代码
- windows删除文件时需要管理员权限的方法
- 【Python笔记】Pandas时区处理
- 网络工程管理 第四章 路由器 RIP OSPF 及配置实验
- java ext_ext下载及使用
- 解决必应biying搜索跳转到百度www.baidu.com搜索的解决方法
- 学计算机二手笔记本,二手笔记本中的套路 坑你就跟玩一样
- 读书笔记: 变系数波方程
- linux远程端口查看
- 首席技术官(ChiefTechnologyOfficer)
- 芬兰免学费留学选拔项目“Finfly芬鸟计划”详细介绍
热门文章
- C++数组名做函数形参/指针
- tinyxml 读取文本节点_【C++】【TinyXml】xml文件的读写功能使用——写xml文件
- python中的df是什么意思_在python中从df-h输出中选择特定列
- linux网络驱动架构,Linux网络体系架构和网卡驱动设计
- 删除第一个_可能是圆谷最后悔的决定!他本应是中国第一个奥特曼,惨遭删除...
- mysql copy pending_mysql 案例 ~ 主从复制延迟之并行复制
- mysql主从 查询负载_MySQL集群:主从数据库配置 实现查询负载
- 计算机一级多选题没有选分,计算机一级多选题
- ryu和mysql实现控制_openflow的初步认识及RYU控制器实践
- netcore 图片 文件大小_NetCore 3.0文件上传和大文件上传的限制详解