Chest ImaGenome Dataset for Clinical Reasoning
文章来源:[NeurIPS2021 Datasets and Benchmarks]
Keywords:
本文提出的问题以及解决方案:
Methods
Silver Dataset Construction
使用atlas-based的方法提取bbox来构造anatomies;使用rule-based的文本分析方法来关联与anatomies相关的CXR attributes (finding, diseases, technical assessment, devices)。
本文的目标是不仅局部标记与CXR图像上的关键解剖位置相关的属性,而且能从大量CXR报告中提取记录的放射学知识,以辅助未来语义驱动和多模态临床推理工作。
在构造Chest ImaGenome dataset时,做出了两个关键假设:
- CXR imaging observations可以被标准化为可视化的anatomical location(object nodes)和位置包含的abnormalities、devices或其他CXR descriptions(attribute nodes)之间的关系。因此,检测到的目标的种类受到图像和报告中解剖位置检测粒度的限制。
- 提取的比较关系旨在允许对不同CXR解剖结构的疾病进展进行纵向建模。
上图为一个radiology knowledge graph,包括检查适应症的患者病史(橙色)、解剖位置(蓝色)及其相关属性,包括anatomical finding(粉色)、diseases(黄色)、technical assessment(紫色)和devices(绿色)节点。蓝色anatomy nodes (objects) 在CXR图像上也具有相应的边界框坐标。
Gold Standard Dataset Collection
- A) the object-to-attribute relations (i.e., CXR knowledge graph) extracted from individual reports
- B) the object-to-object comparison relations extracted between sequential CXR reports
- C) the anatomical location detection (i.e., the bounding box extraction pipeline) for the CXR images
Data description
Chest ImaGenome dataset包含两个方向,一是用于自动生成的场景图(“silver_dataset”),242, 072 scene graphs 自动生成来自于 217013 unique CXR studies。另一个用于手动验证和校正的500个唯一患者子集(“gold_dataset)。每个报告中大约有7个anatomical objects和5个attributes。
- anatomicalfinding:在短语分组中一些主观解剖学发现用于提取标签。
- disease:更具诊断水平的描述,通常需要图像之外的患者信息,并且对阅读放射科医生的推断/印象最为主观。
- technicalassessment:影响CXR观测解释的图像质量问题。
- texture:仅存在于‘texture-cues’字段中,保留了一组高度非特异性的属性(如不透明度、透明度、间隙、空域),这些属性往往会形成放射科医生在图像中观察到的最客观的初始描述。
Gold Standard Dataset Tables
1、gold_attributes_relations_500pts_500studies1st.txt
21,594 object-to-attribute relations manually annotated for 3,042 sentences from the first CXR study for 500 unique patients.
对应的notebook:‘object-attribute-relation_evaluation.ipynb’。
2、gold_comparison_relations_500pts_500studies2nd.txt
5,156 object-object (per attribute) comparison relations for 638 sentences from the second CXR study for the same 500 unique patients.
对应的notebook:‘object-object-comparison-relation_evaluation.ipynb’。
3、four bbox_coordinate_annotations.csv
manually annotated bounding box coordinates for the objects on the corresponding 1,000 unique CXR images.
对应的notebook为:‘object- bbox-coordinates_evaluation.ipynb’。
4、final_merging_report_and_bbox_ground_truth.ipynb combines the manual text and anatomical bbox annotations as gold_object_attribute_with_coordinates.txt and gold_object_comparison_with_coordinates.txt
Chest ImaGenome可以应用到的下游任务
Task 1: Change between sequential CXR exams
通过同一病人的时序(纵向)CXR图像,基于两次连续的CXR检查自动评估疾病随时间的变化。
change relations in the ’left lung’ and ’right lung’ objects that are related to the ‘pulmonary edema/hazy opacity’ and ‘fluid overload/heart failure’ attributes。关注“左肺”和“右肺”中与“肺水肿/朦胧混浊”和“液体过载/心力衰竭”属性相关的目标。训练、验证和测试数据中标记的实例数量分别为10515、1493和2987。
文章中设计了一个孪生(siamese)结构,先提取定位图像的bbox,使用预训练好的ResNet101(NIH, CheXpert, and MIMIC datasets)自动编码提取到的image patches。预测两次连续检查之间局部解剖结果的变化,准确率为75.3%。
Task 2: Localization of CXR attributes
了解CXR图像上非特异性发现/属性的解剖位置(anatomical location of non-specific findings/attribute)有助于缩小可能的疾病诊断范围,并指导下一步要求更具体的成像检查或治疗。
18个anatomical locations和9个公共的CXR attributes。 9个attributes为lung opacity, pleural effusion, atelectasis, enlarged cardiac silhouette, pulmonary edema/hazy opacity, pneumothorax, consolidation, fluid overload/heart failure, pneumonia。
Chest ImaGenome Dataset for Clinical Reasoning相关推荐
- Creation and validation of a chest X-ray dataset with eye-tracking and report dictation for AI devel
Creation and validation of a chest X-ray dataset with eye-tracking and report dictation for AI devel ...
- Medical X-rays Dataset汇总(长期更新)
目录 ChestX-ray8 ChestX-ray14 VinDr-CXR VinDr-PCXR ChestX-ray8 ChestX-ray8 is a medical imagin ...
- AGXNet: Anatomy-Guided Weakly-Supervised Abnormality Localization in Chest X-rays
文章来源:[MICCAI 2022] 代码:https://github.com/batmanlab/AGXNet Keywords:Weakly-supervised learning(WSL), ...
- 医学自然语言处理(NLP)相关论文汇总之 EMNLP 2021
医学自然语言处理(NLP)相关论文汇总之 EMNLP 2021 [写在前面]EMNLP2021前段时间已经放榜,一直没时间整理,最近抽时间整理了一下该会议在医疗自然语言处理方向上的相关论文,放在这里, ...
- 清华 NLP 团队推荐:必读的77篇机器阅读理解论文
https://mp.weixin.qq.com/s/2VhgEieBwXymAv2qxO3MPw [导读]机器阅读理解(Machine Reading Comprehension)是指让机器阅读文本 ...
- 【AI视野·今日CV 计算机视觉论文速览 第152期】Fri, 9 Aug 2019
AI视野·今日CS.CV 计算机视觉论文速览 Fri, 9 Aug 2019 Totally 31 papers ?上期速览✈更多精彩请移步主页 Interesting: ?***VOMonodept ...
- 【今日CV 计算机视觉论文速览】 11 Mar 2019
今日CS.CV计算机视觉论文速览 Mon, 11 Mar 2019 Totally 35 papers Interesting: ?Three-Player GAN,在通常GAN的基础上增加了生成器和 ...
- 【今日CV 计算机视觉论文速览】 25 Feb 2019
今日CS.CV计算机视觉论文速览 Mon, 25 Feb 2019 Totally 13 papers Interesting: ?美学评定方法,基于现有的深度学习模型,直接抽取全局.局部和场景的特征 ...
- AAAI-19录用论文清单
AAAI-19于1月27日在夏威夷召开,今年是33届会议. 会议录用论文清单, workshop16个,tutorials24个. 标题的词云分析: 作者单位词云(按作者人数计算/一篇文章可能有多个作 ...
最新文章
- php自动处理,thinkphp中的三种自动处理
- 网站性能优化之yahoo军规
- STM32定时器的TRGO信号
- Flink 1.13,面向流批一体的运行时与 DataStream API 优化
- 【Python】logging内置模块基本使用
- 笛卡尔函数_笛卡尔,伯克利和函数式React式编程
- X Window Bitmaps And Pixmaps
- 使用 Jupyter 近 2 年,发现了这 3 个实用技巧
- 据说微软已撤销了测试部门?
- lib、dll文件的中函数的查看与lib、dll、pdb文件的介绍
- 引入其他字体库 和 字体样式设置
- QQ、微信动态图表情包怎么制作?视频如何转GIF
- 惠普(HP) LaserJet Pro M1136 MFP 黑白多功能激光一体机 (打印 复印 扫描)驱动安装记录
- JavaScript将HTML元素导出PDF及World
- 街头篮球服务器未响应,肝的飞起 《街头篮球》魔王试炼FAQ
- 基于winsock的局域网聊天室实现
- html5在线学习系统,Canvas LMS 在线学习管理系统
- 四川农业大学计算机科学技术专业,四川农业大学计算机系简介
- 在几年后,程序员的薪资会一直这么高么?
- Eclipse安装内存分析工具(Memory Analyzer)