欢迎关注公众号:oddxix

COSMIC遗传资源数据库

1.简介


COSMIC是一个在人类癌症中发现的体细胞获得性突变的在线数据库。体细胞突变是在非生殖细胞中发生的,不是由儿童遗传的。 COSMIC是癌症中体细胞突变目录(Catalogue Of Somatic Mutations In Cancer)的首字母缩写,它从科学文献中的论文和桑格研究所癌症基因组计划的大规模实验筛选中提取数据。该数据库可供学术研究人员免费使用,并可向其他人商业许可。

COSMIC数据库旨在收集和显示有关癌症体细胞突变的信息。它于2004年推出,仅有四种基因HRAS,KRAS2,NRAS和BRAF的数据。已知这四种基因在癌症中是体细胞突变的。自创建以来,数据库迅速扩展。到2005年,COSMIC包含从115,327个肿瘤中筛选出的529个基因,描述了20,981个突变。到2009年8月,它包含了150万次实验的信息,包括近370,000个肿瘤中的13,423个基因,并描述了超过90,000个突变。2010年7月发布的COSMIC第48版,与国际癌症研究机构合作,整合了p53的突变数据。此外,它还为最新的人类参考基因组构建提供了更新的基因坐标。以后每 3 个月更新一次。

该网站专注于以图形方式呈现复杂的表型特异性突变数据。数据取自选定的基因,最初在癌症基因普查中,以及PubMed的文献检索。

可以通过选择基因或癌症组织类型(表型)来访问数据,使用按功能浏览或搜索框。结果显示具有突变计数和频率的摘要信息。基因摘要页面提供了突变谱图和外部资源;表型(组织)摘要页面提供了突变基因的列表。

COSMIC数据库包含数千种与癌症发展有关的体细胞突变。该数据库从两个主要来源收集信息:

  • (1)从文献中收集已知癌症基因的突变。经历人工治疗的基因列表通过它们在癌症基因普查中的存在来确定。

  • (2)纳入数据库的数据来自癌症基因组计划进行的癌症样本的全基因组重测序研究。

image

CDKN2A_COSMIC_histogram.png

2.数据库介绍


网址如下:https://cancer.sanger.ac.uk/cosmic/

网站首页

最新版本为v87,更新与2018年11月13日。

核心板块

2.1 COSMIC


网址:https://cancer.sanger.ac.uk/cosmic
整个网站的核心,癌症相关的体细胞突变数据。


2.2 Cell Lines Project

网址:https://cancer.sanger.ac.uk/cell_lines
Cell Lines Project 是对最常使用的 1000 多种肿瘤细胞系的深入分析的数据,而标准的 COSMIC 版本中,包含的数据更多,但是分析没有 Cell Lines Project 深入,可以理解为网站的两种模式。


2.3 COSMIC-3D

网址:https://cancer.sanger.ac.uk/cosmic3d/
通过交互式的网页,展现了基因突变导致的蛋白结构域的变化。在搜索框中输入一个具体的基因名称或者蛋白名称,可以查看具体的记录。

EGFR示例

▲ 这个功能超级好玩!可以看蛋白质的三维结构,可以放大,缩小,旋转,截图……

EGFR示例

▲ 继续往下拉,可以看到各种错义突变的位置,炫酷的是,右上角的蛋白结构还在转个不停
还可以预测小分子结合位点,也可直接转至PDB详细查看


2.4 Cancer Gene Census


Cancer Gene Census首页

网址: https://cancer.sanger.ac.uk/census
在癌症研究中,找到相关的突变基因是最核心的目的之一。通过对各种癌症进行调研,整理了一份癌症相关的突变基因列表,这份列表就是Cancer Gene Census,简称CGC。这里又分为三个子菜单 Census、Breakdown(统计分析)、Abbreviations,其中 Census 菜单,显示目前所有的癌基因,而且这个数据表可以搜索,导出(需要先注册)。

CGC种,将所有的癌症相关基因分成两类

  • (1)Tier1
    基因必须具有与癌症相关的记录活动,以及癌症突变的证据,其以促进致癌转化的方式改变基因产物的活性。

  • (2) Tier2
    包含具有癌症作用的强烈迹象但具有较少广泛可用证据的基因。只能说在癌症中检测到了大量该基因的突变,但是并没有充分证据表明该基因突变对癌症发生的影响。

image

CGC的完整列表

导出的格式有CSV和TSV


2.4.1 Census

以 DNMT3A 为例,点击基因名,可以进入详细的页面:

▲最右边的灰色条可上下拉动,以控制页面中峰的显示幅度。鼠标落在一个突位点上,显示该突变点的位置以及突变数。

▲根据结构信息,分析该突变位点是否落在具有功能的结构域。

其他的功能,比如Tissue、Distribution、Drug Resistance、Variant 等也非常重要,这里不逐一介绍。


2.4.2 Breakdown(统计分析)

▲这里是对所有癌细胞中的突变进行了整理


2.4.3 Abbreviations:对表格中的缩写进行解释。


2.5 Drug Sensitivity


▲鉴定肿瘤的分子特征,预测抗肿瘤药物的响应

这里主要包括 Compound、Cancer Feature、Cell Line 三种数据。

▲一共有265个小分子化合物,可以靶向不同的癌基因和信号通路


2.6 Mutational Signatures(突变特征)

导致体细胞突变的原因很多,比如 DNA 复制的失真、暴露到内源性或外源性的诱变源、 DNA 酶修饰、DNA修 复的缺陷。不同的突变过程会产生不同的突变组合,这里定义为“突变特征”。在癌症中,突变位点是非常多。研究人员提出了Mutational Signatures这个概念,突变的特征集合,共划分了96种突变类型,首先根据碱基突变的类型,有C>A, C>G, C>T, T>A, T>C, T>G共6种基本类型,然后在考虑突变位点上有和下游的1个碱基,每个碱基有A,T,C,G 4种可能的情况,一共就有6X4X4 = 96 种突变类型。

不同癌症中这96种突变类型出现的频率有所不同,将96种突变类型的频率结合起来,可以作为一种固定的突变模式,用来表征某一类癌症。

image

▲Cosmic基于10952给外显子和1048个全基因组数据,总结出了 30 种“突变特征”


2.7 Tools

Tools 中主要包括 Cancer Browser、Genome Browser、CONAN、Beacon

  • (1)Cancer Browser

通过不同的组织来查看相关类型的癌症,更加的直观方便。

  • (2) Genome Broswer基因组浏览器

image

  • (3) CONAN
    copy nunber analysis, 查询拷贝数变异的工具。
    ▲这里需要输入基因名称或基因区间

  • (4) GA4GH Beacon Query

一个API工具,可以快速查询COSMIC数据库中某个突变是否存在。返回JSON格式的数据,

image


3.数据下载

网址:https://cancer.sanger.ac.uk/cell_lines/download
可下载内容:

Complete mutation data
Copy Number Data
PICNIC Average Ploidies
Gene Expression
Non coding variants
Raw Gene Expression
VCF files (coding and non-coding mutations)
QC
Sequence Coverage Statistics
Genotypes
Fasta File (genes)
Oracle Database Dump

下载时需要登陆的,而且部分数据只对大学和非盈利机构的用户公开。


4.参考

https://en.wikipedia.org/wiki/COSMIC_cancer_database
https://www.sohu.com/a/138745838_688647
https://cancer.sanger.ac.uk/cosmic
https://en.wikipedia.org/wiki/Mutational_signatures

转载请注明出处,谢谢

欢迎关注公众号:oddxix

【数据库-2】COSMIC遗传资源数据库相关推荐

  1. 合肥工业大学—SQL Server数据库实验四:数据库的分离和附加

    数据库的分离和附加 1. 数据库分离 2. 数据库附加 1. 数据库分离 当SQL Server服务器运行时,该服务器上所有的数据库自动处于运行状态,而运行中的数据库文件是无法进行数据库文件的拷贝的. ...

  2. 合肥工业大学—SQL Server数据库实验一:数据库的创建和删除

    数据库的创建和删除 1. 创建数据库EDUC 2. 创建数据库TestDB 3. 删除数据库TestDB 4. 设置当前数据库为EDUC 1. 创建数据库EDUC 数据库名称:EDUC 数据库存储路径 ...

  3. Mac MySQL 数据库配置(关系型数据库管理系统)

    本文已停止更新,点击此链接查看本文最新内容 !!! 前言 MySQL 关系型数据库管理系统. 1.配置准备工作 1)配置数据库准备工作 下载相关软件 mysql-5.7.21-1-macos10.13 ...

  4. Excel向数据库插入数据和数据库向Excel导出数据

    为了熟悉java里工作簿的相关知识点,所以找了"Excel向数据库插入数据和数据库向Excel导出数据"的功能来实现. 注意事项:1,mysql数据库: 2,需要导入的jar包有 ...

  5. Sql Server实用操作-无数据库日志文件恢复数据库两种方法

    数据库日志文件的误删或别的原因引起数据库日志的损坏 方法一 1.新建一个同名的数据库 2.再停掉sql server(注意不要分离数据库) 3.用原数据库的数据文件覆盖掉这个新建的数据库 4.再重启s ...

  6. 关系型数据库和非关系型数据库的优劣对比?

    关系型数据库和非关系型数据库的优劣对比? 关系型数据库和非关系型数据库的优劣对比? 关系型数据库最典型的数据结构是表,由二维表及其之间的联系所组成的一个数据组织. 优点: 1.易于维护:都是使用表结构 ...

  7. 数据库物理文件 mysql_MYSQL数据库-物理文件

    物理文件组成 日志文件:错误日志,查询日志,慢查询日志,事务日志,二进制日志 日志是 mysql 数据库的觉要组成部分.日志文件中记录珩 mysql 数据库运行期间发生的变化,也就是说用来记录 mys ...

  8. mysql5.5数据库名_mysql5.5数据库名

    Linux下Web开发服务器搭建之一_MySQL Linux下Web开发服务器搭建之一 安装与配置MySQL 在现在很多中小企业中,都喜欢使用Linux+Apache+MySQL+PHP的搭配来实现企 ...

  9. 数据库名、数据库实例、全局数据库名、服务名、SID等的区别

    [转载] http://www.cnblogs.com/rootq/articles/1235647.html 数据库名.实例名.数据库域名.全局数据库名.服务名 , 这是几个令很多初学者容易混淆的概 ...

最新文章

  1. iOS跳转到各种系统设置界面
  2. ios navigation的返回按钮长按_Android Jetpack架构组件 — Navigation入坑详解 [转]
  3. 让Socket穿透Windows防火墙
  4. CentOS搭建FTP
  5. 记一次SAP开发工程师给微软Azure报incident的体验
  6. 两点补充——CSS3新属性以及弹性布局
  7. iOS核心动画 Core Animation2-CABasicAnimation
  8. 电脑技巧:如何解决99%的电脑防弹窗广告?
  9. [css] width属性的min-content和max-content有什么作用
  10. 字符串最长公共子序列python_求解两个字符串的最长公共子序列
  11. Win11任务栏怎么隐藏
  12. 一款简约多类PHP导航源码
  13. 【java】List 根据实体属性值搜索
  14. 收集一些常用的CDN链接!无需下载快速使用!
  15. CentOS Linux服务器实现攻防演练
  16. Vue 项目断网时跳转到网络错误页面
  17. 流程图中的实线_教你如何正确看懂工艺流程图
  18. android textview 字体边框,android TextView加边框
  19. 面试问题——英语38 教育孩子 管理时间 看电视
  20. 无法执行磁盘检查,因为windows无法访问该磁盘的一种解决思路

热门文章

  1. 一名大学生在银行工作8年的职场感悟---功之成,非成于成功之日,盖必有所由起
  2. hive 中的正则表达式(筛选车牌号)
  3. 流式细胞仪荧光补偿调节方法
  4. 工控软件及计算机监控系统设计
  5. JDK的可视化分享 (第11期) 20190321
  6. 《博哥玩Arduino》- 蓝牙七彩灯优化版V2.0
  7. 字符串是python中特有的数据类型_python小项目一:NBA比赛数据分析
  8. 企业网站百度排名突然丢失原因分析及解决方法-www.bjrp.com
  9. ownCloud/Nextcloud OCC命令行工具详解
  10. 新西达电调驱动直流无刷电机