标题 :[CIKM 2021] Integrating Static and Time-Series Data in Deep Recurrent Models for Oncology Early Warning Systems

【融合静态和时间序列数据的肿瘤预警系统深度循环模型】

相关工作

时间序列的临床模型
以时间序列数据为重点的临床预测模型已经有了重要的工作。Mao等人利用时间序列数据的特征工程和逻辑回归预测ICU的临床恶化[30]。ForecastICU使用贝叶斯信念系统根据生理数据流预测ICU入院[40]。Lipton等人[21]通过经验评估LSTM模型,根据EHR的多变量时间序列预测诊断结果。Liu等人[22]提出了多变量临床时间序列的个性化预测框架,以支持对患者未来生理信号的预测。UA-CRNN发现了临床时间序列的不规则性,并在生成的用于预测死亡率风险的常规数据中纳入了不确定性[36]。最近的研究,如GRAM[10]、RETAIN[7]、Dipole[27]、MIME[11]、KAME[28]、DoctorAI[8]和HiTANet[24],提出了可以与RNN联合训练的注意机制,以根据医院就诊的连续医疗代码预测临床结果。其他RNN方法,如m-RNN[40]、GRU-D[5]、BRITS[4]和LGnet[37],提出了基于临床时间序列的数据插补和结果预测综合模型。

重点内容

住院患者的临床病情恶化一直是医疗领域的一个重大挑战
肿瘤住院患者面临危及生命的临床恶化风险:根据最近的一项研究,6.4%的肿瘤住院患者至少有一个重症监护室(ICU)转移,其中2.7%死于医院病房异常的生命体征、实验室值或检测结果往往预示着临床恶化,这导致基于电子健康记录(EHR)的早期预警系统(EWS)的开发

我们工作的主要贡献有四个方面:(1)我们提出了一种多模式融合技术,可以在深度复发模型中整合静态和时间序列临床变量;(2) 我们提出了结合多模态融合和跨模态插补的CrossNet模型,以利用静态和时间序列数据之间的相关性进行临床预警;(3) 我们在一个大型EHR数据集(包括20700例成人肿瘤患者住院治疗)上证明了拟议方法的有效性,同时在MIMIC-III数据集上展示了我们方法的通用性;(4) 我们提供了一个案例研究,在肿瘤医院病房的实际临床环境下,为EWS建立了CrossNet模型的优势

  • 本文提出了一个综合临床预测模型,在整体框架中利用静态和时间序列临床变量。
  • 实验表明,在为临床恶化生成早期预警方面,所提出的方法在预测准确性方面优于最先进的模型
    对大型肿瘤住院患者数据集和公共MIMIC-III数据集的评估表明,所提出的方法在预测临床恶化方面具有优越的性能,并且对不同的递归神经网络(RNN)模型具有通用性。
启发点:

我们的方法受计算机视觉方法的启发,设计用于生成基于图像作为静态输入和描述性的图像字幕句子作为顺序输入。我们使用模型在静态变量训练得到的输出作为递归的初始输入,去训练时间序列变量层。这种综合方法有效利用从静态变量中学到的知识(可在
入院),为训练RNN模型提供用于时间序列数据的背景知识。

方法

为住院患者收集各种数据,包括静态数据和时间序列数据。

  • 静态数据,如人口统计、合并发病诊断(ICD-9和ICD-10代码来自以前入院)和住院地点,在入院时收集。
  • 时间序列数据,如生命体征和实验室值,在整个住院期间的多个时间点收集。模型的输出是一个二进制标签,指示劣化事件Y小时的开始,其中“Y小时”是预定义的预测范围。作者选择了72小时窗口和6小时预测期,以便于肿瘤住院患者及时进行临床干预。

作者提出了整合静态和时间序列变量的多模式融合,以及一种新的跨模式插补模型,该模型可以处理静态和时间系列变量中的缺失值

模型架构图

数据集处理

我们重复了对MIMIC-III的评估数据集,一个拥有60000多个重症监护室(ICU)的公共数据集。预测任务是生成重症监护室的病人的死亡预警。我们提取了25个时间序列变量(例如,生命体征、实验室结果)和32个静态变量(例如,人口统计、诊断)。我们使用了创建示例的类似滑动窗口方法,但具有更多颗粒段与ICU设置一致。对于每个时间序列变量,我们提取了前9小时的数据(包含18个 30分钟段)作为时间序列输入如果在30分钟的时间段内有多个值,我们使用上次观察到的值来表示该段中的值。如果在30分钟的时间段内没有值,我们将此段中缺少相应的变量。

结果

为了评估模型在未观察到的患者上的表现,作者按患者随机分割数据集,使75%的患者属于训练集,其余25%的患者属于测试集。
在训练集中的患者中,作者进一步将其中的10%作为超参数调整的验证集。
训练集(0.30%)、验证集(0.28%)和测试集(0.34%)的阳性率仍然接近整个数据集的阳性率(0.31%)。
作者执行上述预处理,以获得用于模型训练、验证和测试的样本。
由于肿瘤学数据集极不平衡,作者将随机过采样应用于训练集,得到的阳性率平衡在50%。
模型和实验通过PyTorch实现,代码可供公众使用(Github上开源)
代码链接

结论
  1. 本文提出了一个综合临床预测模型,在整体框架中利用静态和时间序列临床变量。
  2. 对大型肿瘤住院患者数据集和公共MIMIC-III数据集的评估表明,所提出的方法在预测临床恶化方面具有优越的性能,并且对不同的RNN模型具有通用性。
  3. 在现实临床环境下的一个案例研究表明,该模型能够以中等警报率提供准确的早期预警,从而支持有效的预警系统。

Integrating Static and Time-Series Data in Deep Recurrent Models for Oncology Early Warning Systems相关推荐

  1. <文献阅读>用转移熵通过微阵列的时间序列推断基因调控网络(inferring gene regulatory networks from microarray time series data

    这篇文章是2007的时候发表在IEEE杂志上,并没有收录到PubMed里面.是韩国的学者开发出来的方法.具体来说,通过转移熵计算基因对的因果关系(causal relations), 也就是转移熵的值 ...

  2. 论文笔记:Do We Really Need Deep Learning Models for Time Series Forecasting?

    Do We Really Need Deep Learning Models for Time Series Forecasting? Elsayed S, Thyssens D, Rashed A, ...

  3. Analyzing Neural Time Series Data 读书笔记6

    Analyzing Neural Time Series Data 第六章读书笔记 仅做学习记录 6 Practicalities of EEG Measurement and Experiment ...

  4. MAD-GAN: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks

    MAD-GAN: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks 文章 ...

  5. Analyzing Neural Time Series Data 读书笔记3

    Analyzing Neural Time Series Data 第三章读书笔记 仅做学习记录 3 Interpreting and Asking Questions about Time-Freq ...

  6. 读书笔记之-Analyzing Neural Time Series Data 1、2

    读书笔记之-Analyzing Neural Time Series Data 1.2 1.1 什么是认知电生理学(Cognitive Electrophysiology) 1.6 数据样本和在线代码 ...

  7. Fast and Accurate Partial Fourier Transform for Time Series Data

    Fast and Accurate Partial Fourier Transform for Time Series Data 给定一个时间序列向量,我们如何有效地检测异常?一种广泛使用的方法是利用 ...

  8. A Comparative Analysis of Deep Learning Approaches for Network Intrusion Detection Systems (N-IDSs)

    论文阅读记录 数据类型 在预定义时间窗口中,按照传输控制协议/互联网协议(TCP/IP)数据包将网络流量数据建模成时间序列数据. 数据:KDDCup-99/ NSL-KDD/ UNSW-NB15 NI ...

  9. 吴恩达deeplearning.ai系列课程笔记+编程作业(11)第四课 卷积神经网络-第二周 深度卷积网络:实例探究(Deep convolutional models: case studies)

    第四门课 卷积神经网络(Convolutional Neural Networks) 第二周 深度卷积网络:实例探究(Deep convolutional models: case studies) ...

最新文章

  1. python turtle基本语法_Python 基础语法-turtle篇
  2. mysql与Json学习总结
  3. 我の第一篇万字博文 | 带大家开开心心地进入Python世界
  4. GRE词汇乱序版-夹生的词汇3
  5. 惨一个字!Windows 10 October 2018 Update市占率太低
  6. 交换机应用之端口模式(access、trunk和hybird)、是否标记(tag、untag)、端口缺省vlan(pvid、native id)...
  7. 如何绘制业务架构图 — 3.分解图
  8. C++|Qt中QTreeWidget基本操作及完整代码下载
  9. 通过批处理调用SQL*Plus执行批量脚本
  10. SonicWall 督促客户立即修复NSM 本地版本漏洞
  11. 计算机刷bios版本,详细教你电脑刷bios
  12. HFSS远场辐射设置与辐射方向图设置
  13. 前端接收后端导出的excel乱码、打开excel格式或文件扩展名无效等问题
  14. Unity 4:DirectX 11
  15. .jar文件打开方式没有Java(TM) Platform SE binary怎么办?
  16. 操作系统 虚拟内存技术
  17. 《2023年金融科技趋势展望》发布,提出十大技术趋势
  18. 谈谈医疗行业数据治理的四个关键阶段【后附医院数据治理案例】
  19. 项目实战!Python分析广州房地产市场,房价还会再涨吗?
  20. 懈寄生---走出软件作坊:三五个人十来条枪 如何成为开发正规军(十四)[转]...

热门文章

  1. 呼叫中心系统基础接口文档
  2. 奥运相关 -- 特殊地区获胜后的升旗
  3. python的matplotlib.pyplot绘制甘特图
  4. pahoMQTT移植
  5. linux安装vnc服务
  6. git 创建远程分支 关联远程分支
  7. Speedoffice(excel)设置按颜色进行排序
  8. 百老汇大乐队音源 – Fable Sounds Broadway Big Band 2 Kontakt
  9. 初中计算机课的学情分析,初中信息技术课的现状与分析
  10. WebStorm安装及破解