在瑞士达沃斯召开的世界经济论坛上的一个panel讨论中,美国副总统Joe Biden当场要求临床医生和研究者举例表示人类在抗击癌症中突破的障碍。当几个重要话题浮现时,最重要的议题是“大数据”,具体而言,即“大数据”的收集、分析和应用。

大量的肿瘤DNA测序通道接近20,000基因组

研究者表示:“ 大数据 ”是有效的,这是因为有重大的信息可以从大数据集合里分析。越是大样本的体量,越能发现一些在小样本体量中难以发现的小问题。另一些研究者则表示:“大数据”岂止于大?而是越多越好。

来自美国 St. Jude儿童研究中心的首席信息官、高级副总裁Keith Perry认为,“大数据”包含额外的三层意思:多个品种的数据类型、数据生成的速度和数据集成的程度。在他看来,目前的许多数据库之间无相互接口,因为它们是由单独的预防、研究和临床部门产生的,现在缺乏一个整合这些不同结构、集中信息的潜在平台。

另一位来自爱立信公司的Narayan Desai博士引用了其在2015年的新闻文章,基因组学将不得不解决的基本问题是数据是如何生成的。尽管目前的数据收集和分析能力有限,但应该利用好它,因为测序的可访问性,将导致访问信息出现爆炸性的增长,并在很大程度上较为分散,传统的信息挖掘将难以解决问题。

影响一:隐藏的弱点

最近,一些科学家建议:针对性和创造性的利用现有的数据可以指导临床实践。来自加州大学旧金山分校(UCSF)的Nevann Krogan教授表示:基因组学已经为癌症治疗带来了重大变革,其作用远超过以往的遗传学知识。尽管测序提供商认为我们投入的金钱越多,结果越清晰,事实上并不是如此。我们现在已经达到了提取有效信息的饱和点。

以癌症为例,目前针对各种各样的癌症已经出现了“海量”的数据。尽管数据暴增趋势在继续,但是Krogan 教授认为,突破癌症治疗所需的数据已经达标。成堆的新数据只能显示癌症惊人的多样性,即使是一个单一的肿瘤也包含独特的成千上万的基因突变,这使得使研究人员找出哪些是驱动疾病的基因愈加困难。

Krogan教授和同事于2015年5月21日在《Molecular Cell》上发表文章:除了积累更多的数据之外,研究者需要更加仔细地找出现有数据的关联,并成立了“肿瘤细胞地图项目”(CCMI),旨在系统地介绍癌症基因间的相互作用,以及它们如何导致了疾病与健康的状态,从而研究出癌细胞里的突变基因和蛋白的“路线图”。

影响二:肿瘤样本关联性分析

“肿瘤细胞地图项目”(CCMI)将加州大学圣迭戈分校(UCSD)的顶尖生物医学科学家和加州大学旧金山分校(UCSF)顶尖的细胞结构学家整合到一起,共同研究基因组学相关信息,瓶颈是如何解释肿瘤基因组信息。

加州大学圣地亚哥分校的Ideker教授表示:进行癌症DNA测序的样本已经接近20000例基因组,但仍然难以分析癌症基因组的基因网络,即“没有两个肿瘤患者在基因层面上看起来很相像。”因此,癌症基因组图谱(TCGA)项目,国际癌症基因组协会(ICGC)已经开始系统地分析成千上万的肿瘤的多重信息,包括mRNA和microRNA表达、DNA拷贝数和甲基化以及DNA序列。

现在强烈需要有一个可以整合和解释基因组规模分子信息的方法,以洞察驱动肿瘤恶化的过程;同时也迫切需要医疗机构的参与,以解决公司在分析肿瘤基因时因无法获得临床相关的数据而得出不当结论。

影响三:子网络分析

解决子网络分析需要综合信息方法,尤其是综合已知编码蛋白质的基因在表达蛋白质内部子网或通路作用间的数据库交互。这需要基因或蛋白质在各个子网络内形成的聚合表达式组成的巨大交互网络,而不是清单单个基因或蛋白质。

研究人员表示:这些子网可以识别不同种群患者之间的基因表达差异导致的不同临床行为。与传统的分析相比,虽然这种方法需要大量的生物信息学、统计学和蛋白结构知识,但这种子网分析能够解释基因表达差异下的分子通路,毕竟它使用的数据已经存在。

Ideker博士和他的同伴生物信息学专家表示:对于大多数中度乳腺癌风险的患者,传统因素不是预测,大约70 – 80%的淋巴癌阴性患者在接受不必要的辅助化疗。当前的许多风险因素可能是次要表现而不是疾病的主要机制。一个新的挑战是如何确定新的与疾病更加直接相关的疾病,可以更准确地预测个体患者的风险转移。

影响四:预后的影响

研究人员最新调查证据支持基因网络分析可以提供预后信息。例如,加州大学圣迭戈分校(UCSD)的Chang博士和同事们在2012年的《血液》杂志发文:通过单克隆B细胞在血液中、骨髓、次级淋巴组织的集聚,采用基因网络分析并预测慢性淋巴细胞白血病(CLL)患者的特点。

具体地说,研究人员使用subnetwork-based(子网络)基因表达分析概要文件区分组不同患者的慢性淋巴细胞白血病进展风险。 临床患者的慢性淋巴细胞白血病患者有很大的差异:有些病人无症状多年;有些患者则在被诊断后不久就出现较为严重的症状。

由于目前必须明确证据显示疾病进展或疾病相关的并发症,否则建议停止治疗,但标准疗法与显著的毒性有关,因此准确预测是至关重要的。目前已经有通过基因芯片检测的报告显示,替代标记物可作为慢性淋巴细胞白血病已知的预后因素,如IGHV突变状态。

预测子网的表达水平随着时间的推移而发生变化,但是在在之后的时间点表现出较强的相似性。大 数据挖掘 已经成为慢性淋巴细胞白血病患者等癌症的的治疗策略和潜在的观察途径。

本文转自d1net(转载)

大数据挖掘对癌症治疗的四大影响相关推荐

  1. 基于电子病历的临床医疗大数据挖掘流程与方法

    基于电子病历的临床医疗大数据挖掘流程与方法 阮彤1, 高炬2, 冯东雷3, 钱夕元1, 王婷1, 孙程琳1 1. 华东理工大学,上海 200237 2. 上海曙光医院,上海 200025 3. 万达信 ...

  2. Clinicast让癌症治疗不那么昂贵

    定心丸 根据美国学者研究数据,美国每年逝世的五个人当中有一人是因癌症致死,而在世界范围,每年每10万人中就有100-350人死于癌症.最新由国际癌症研究中心发布的<世界癌症报告>预测,20 ...

  3. 两篇Science文章揭示癌症治疗中细胞感应氧气的新机制

    奥卢大学和哈佛大学的研究人员发现了当前未知的新机制,身体细胞通过该机制感应氧气.缺氧对基因的功能有直接影响,并抑制细胞分化. 该研究发表在Science杂志,其将为癌症药物的开发开辟新的机会. 该发现 ...

  4. 大数据对医学发展有什么影响

    大数据已在各种行业中获得了应有的使用份额.然而,它对医学的影响确实非常显著.大数据提供的海量信息减少了进行研究和收集结果所需的时间.同样,大数据对保险也有相同的影响,从而可以提供更复杂的保险范围和更准 ...

  5. 大数据挖掘-伤寒论和金匮要略(COVID-19用药启示录)

    来自Toby老师,大数据挖掘-伤寒论和金匮要略 大家好,我是Toby老师,三年来新冠病毒肆虐全球,带来一些列症状,例如发热,恶寒,咳嗽,咽喉痛,腹泻,心脑血管疾病等等.诸多西药伤害人体五脏六腑,对人体 ...

  6. 饮食干预减轻癌症治疗相关症状和毒性

    现代化疗,放射疗法在摧毁癌细胞的同时,对健康细胞也造成了伤害,引发相关毒性,反应例如便秘,腹泻,疲劳,恶心,呕吐等. 癌症患者的营养状况可能是癌症治疗相关毒性的核心决定因素,也是癌症症状的指标. ​ ...

  7. 大数据挖掘-伤寒论和金匮要略(COVID-19用药启示录,1.4万字收藏)

    来自Toby老师,大数据挖掘-伤寒论和金匮要略 大家好,我是Toby老师,三年来新冠病毒肆虐全球,带来一些列症状,例如发热,恶寒,咳嗽,咽喉痛,腹泻,心脑血管疾病等等.诸多西药伤害人体五脏六腑,对人体 ...

  8. 论文解读+代码复现【AIDD】贝叶斯、决策树、随机森林+2种机器学习模型在癌症治疗药物发现中的应用

    AIDD(AI Drug Discovery & Design):是近年来非常火热的技术应用,且已经介入到新药设计到研发的大部分环节当中,为新药发现与开发带来了极大的助力.倾向于机器对数据库信 ...

  9. 30个学习大数据挖掘的重要知识点!

    https://www.jianshu.com/p/2441b69794b0 下面是一些关于大数据挖掘的知识点,今天和大家一起来学习一下. 1. 数据.信息和知识是广义数据表现的不同形式. 2. 主要 ...

最新文章

  1. 百度香港二次上市,12 岁开发者、AI 机器人同台敲响“芯片代码锣”
  2. SQL 数据库 存储过程 视图
  3. java date的使用_java:Date类的概述和方法使用
  4. java double 运算精度问题_关于java中Double类型的运算精度问题
  5. 打独立运行包遇到无法trim咋解决
  6. python安装第三方库时报错 SyntaxError: invalid syntax
  7. TensorFlow——Ubuntu系统上TensorFlow的安装教程
  8. 使用Maven前夕(Maven项目架构管理工具、配置环境变量、阿里云镜像、本地仓库)
  9. python3-基础8
  10. AJAX TabContainer 样式设置
  11. 浏览器安全防范,小程序类技术或许是更优的解决方式
  12. 自学web前端怎么学?web前端学习路线css属性
  13. 家长心态建设;一切都没想象的那么糟
  14. 相关性分析【用pythonpandas实现】
  15. 京东区块链开源项目——JD Chain介绍及区块链白皮书发布
  16. 数仓即席查询---Presto
  17. jquery 常用选择器和方法以及遍历(超详细)
  18. IMX6ULL系列学习记录-sii902x移植篇
  19. Always Day1 学会爱自己才能好好爱别人
  20. Linux内核功能模块图

热门文章

  1. 面向微信的WebApp产品观
  2. 人物走过的草丛,自动出现被踩踏的效果
  3. mysql字符串转int
  4. 高性能msyql读书日志
  5. 设计数据结构的方法论
  6. c语言如何float转换到uint,float转为int sql中float怎样转成int
  7. 关于类似新浪微博的后台问题
  8. 营养,运动与健康;控制饮食+体育锻炼
  9. C语言:表达式求值详解
  10. QT基础之QVariant类