CVPR 2020
论文链接:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9156613

文章目录

  • 1 Background
  • 2 Motivation
  • 3 Related Work
  • 4 Advantages/Contributions
  • 6 Experiments
    • 6.1.Data Collection and Annotation
  • 7 Conclusions

1 Background

作为传染疾病的第二大致病原因,肺结核全球健康的主要威胁之一。每年大约有8,000,000 - 10,000,000新的肺结核病人,并且大约2,000,000 - 3,000,000人死于肺结核。肺结核是由肺结核分支杆菌引起的,它可以通过打喷嚏、咳嗽或者其他排出感染性细菌的方法传播。因此肺结核通常通过呼吸道在肺部产生。在发展中国家,免疫缺陷人群如艾滋病患者和营养不良者会增加患病机会。

如果不加一治疗,肺结核的死亡率还是非常高的,但是肺结核在早期的诊断并使用抗生素的治疗可以大大提高幸存的机会。肺结核的早期诊断也帮助控制传染疾病的传播。随着肺结核抗药性的增加也导致迫切需要一种及时准确的诊断方法来跟踪临床治疗的过程。然而,肺结核诊断仍然是一个主要的挑战。肺结核病诊断的金标准是痰液镜检和结核菌培养鉴定结核分枝杆菌。因此需要生物安全三级实验室(BSL-3)培养结核分枝杆菌,这个过程需要几个月的时间。更坏的是,许多发展中的国家和资源受限的社区医院都无法提供这样的条件。

目前x射线是目前医学图像检查中最常见和数据密集的筛查方法,x射线也是最常用的结核病筛查方法之一。通过X射线的早期的X射线筛选对早期的肺结核的检测、治理和预防控制有重要的意义。然而医生通常对X射线结果的检查产生错误,因为人眼很难注意到一些细节,这使得人眼很难分辨出肺结核的病变区域。目前的人类研究中,一些顶尖医院的经验丰富的医生会得到68.7%的准确率(与金标准相比)。因此 It is a natural idea to adopt deep learning for computer-aided TB diagnosis/screening with X-ray images。然而深度学习的方法需要大量的肺结核数据,现在的数据比较缺乏。

2 Motivation

  • 给计算机辅助肺结核诊断(CTD)提供充足的大量的数据

3 Related Work

  • Tuberculosis Datasets:肺结核数据是非常私密的,因此很难用金标准来进行诊断,公共可用的TB数据集是非常有限的。很多人提出了一些数据集,eg,Jaeger的 two chest X-ray datasets、Montgomery County chest X-ray set (MC) 、 Shenzhen chest X-ray set、DA
    and DB等等。这些数据太小以至于不能去训练深度卷积神经网络。而且这些数据集只有图像级的标注,因此不能训练TB检测器。
  • Computer-aided Tuberculosis Diagnosis:由于数据的缺乏,传统的CTD方法不可以训练深度卷积神经网络。大多数的传统的方法主要使用人工特征和训练二分类。eg, Jaeger等人使用 a graph cut segmentation method。Candemir等人采用基于图像检索的患者自适应肺模型的非刚性配准驱动的鲁棒肺分割方法、 Chauhan等人使用MATLAB工具箱实现了TB预测。

4 Advantages/Contributions

  • 通过与各大医院的长期合作,构建了一个大尺度的CTD数据集,它是更大、注释更好、比现在的TB数据集更实用的,可以被用来训练深度CNN网络。
  • 建立了CTD的benchmark通过为CTD修改现存的目标检测器,并使分类和检测指标适应CTD

6 Experiments

6.1.Data Collection and Annotation

对于数据的收集和注释,本文遵循三步:(1)分类制定(2)X射线采集(3)专业数据注释

  • Taxonomy Establishment:现存的数据集分为两个类别:肺结核数据和不含肺结核。现实中,胸部X射线的异常,比如TB、肺不张,心脏肿大,积液,浸润,肿块,结节等都有相似的异常现象。仅仅使用健康的X射线作为负样本会会有大的偏差,会产生很多假阳性患者。本文的数据集中又增加了一个患病但是不 non-TB类别。同时我们的数据集分为活性肺结核和潜伏型肺结核。因此本文的数据集分为四个类别:健康、患病但不是肺结核、活性肺结核和潜伏型肺结核。
  • X-ray Collection:肺结核X射线的收集面临两个困难:(1)肺结核X射线数据是非常隐私的,泄漏这些数据是违法的,因此很难去获得原始数据。(2)虽然世界上患肺结核的病人非常多,但是由于复杂而漫长的检测过程,,由金标准确定检测的结核病x射线很少。为了克服这些困难,我们和顶级医院进行合作,来收集TBX光片。我们得到了 TBX11K dataset,其中每张X光片属于一个人。数据集已经通过数据提供者被标识,并且获得政府的同意,因此我们把它作为公开数据集。
  • Professional Data Annotation:我们数据集的每张图像都已经经过金标准的测试,但是金标准仅可以提供图像级的标签。仅仅图像级的预测,使得人类很难用眼睛去识别TB区域。本文提出了bounding box注释对于TBX光片,这是第一个肺结核X光片数据集。边界注释是由顶级医院放射科有经验的医生标注的。

7 Conclusions

PaperReading:《Rethinking Computer-aided Tuberculosis Diagnosis》相关推荐

  1. 元计算:《元计算破解生命密码》听课笔记

    元计算:<元计算破解生命密码>听课笔记 目录 元计算背景 元计算技术 元计算系统 <元计算破解生命密码>听课笔记 问题提出 元计算理论引入 元计算意义 元计算背景 元计算技术 ...

  2. 学生党如何拿到阿里技术offer:《阿里面试(成功)》

    这次和大家分享的文章来自一位学姐,她这篇博文的题目和之前一篇相同,都是<阿里面试>,但是她与之前的学长不同,这位学姐成功拿到了阿里的数据研发工程师的offer.从两轮技术面试就可以看出学姐 ...

  3. 数据可视化组队学习:《Task02 - 艺术画笔见乾坤》笔记

    文章目录 前言 1 概述 1.1 matplotlib的使用逻辑 1.2 matplotlib的三层api 1.3 Artist类的结构 1.4 matplotlib标准用法 2 自定义你的Artis ...

  4. 高锟诺奖演讲:《古沙递捷音》

    高锟(1933.11.4 -2018.9.23).图片来源:诺奖官网 2018年9月23日,中秋节前一天,光纤通信专家.2009年诺贝尔物理学奖得主高锟(Charles Kuen Kao)在香港逝世, ...

  5. gorm 密码字段隐藏_【财富密码】第1期:《LSTM大战上证指数-PyTorch版》

    前言: Hello大家好,我是瑟林洞仙人!这里是[财富密码]系列第1期:<LSTM大战上证指数-PyTorch版>.在这里,我将用我的"意识流"代码,手把手教会大家如何 ...

  6. 过完备深度子空间聚类网络:《Overcomplete Deep Subspace Clustering Networks》

    论文:<Overcomplete Deep Subspace Clustering Networks> 论文原文链接:有道云笔记 论文讲解链接:子空间聚类入门(一)overcomplete ...

  7. 读书笔记 摘自:《创业就是要细分垄断》

    读书笔记 摘自:<创业就是要细分垄断>(作者: 李开复 汪华 傅盛) 本质上来说创业就是奔着垄断去的.--汪华 序言 除了理想.胆略.眼光.术业有专攻.个人魅力以外,创业者最需要的资源就是 ...

  8. □ 影片名:《陈好-女人要爱自己》(7012) 在线播放

    □ 影片名:<陈好-女人要爱自己>(7012)  在线播放 陈好-女人要爱自己

  9. 自我管理的经典书籍推荐:《自我管理必读12篇》

    自我管理的经典书籍推荐:<自我管理必读12篇> 什么是自我管理? 相信每一个追求高效的职场人士对这人词汇都不会感到陌生. 自我管理通常是指对自己时间.精力.情绪及心态等的管理.自我管理的最 ...

最新文章

  1. 陶哲轩实分析 定理 13.3.5 :紧致度量空间上的连续函数一致连续
  2. MongoDB3.4安装及卸载
  3. PHP 小tip .(@)符号和 php if 赋值
  4. WordCount单词计数
  5. html css 学习笔记(1)背景相关
  6. jqprint控件使用
  7. Python格式化字符串字面值 | 被官方文档称之为『漂亮』的输出格式
  8. 企业传播的云计算时代还有多远?―21世纪广告―文章摘要―龙源期刊网
  9. Win7旗舰版如何激活超级管理员权限
  10. 03筑基期——循环、嵌套循环、循环跳转、随机数(算法基础又篇)
  11. IE火狐的代理服务器的设置
  12. python爬取二手房信息,基于python爬取链家二手房信息代码示例
  13. 设计新鲜事(News Feed)系统
  14. linux 查看磁盘寿命,如何确定Linux下SSD的写周期数或预期寿命?
  15. Android统一推送联盟成立
  16. Datawhale团队第二期录取名单!
  17. 微信小程序-001-抽签功能-008-简单登录
  18. 建筑安全检查标准怎么计算机,建筑施工安全检查标准评分 怎么算
  19. arcmap字段计算器的使用
  20. Python每日一练——第26天:内置函数

热门文章

  1. HDU 5945 Fxx and game 单调队列优化dp
  2. 做了几年的网工也未必了解VLAN和VXLAN的区别,今天我来告诉你!
  3. matlab wik,MATLAB - Calculus
  4. 维度建模之 星型模型与雪花模型
  5. 电脑基本操作-电脑分屏快捷键
  6. 华盛顿州立大学招收机器学习方向全奖博士生
  7. zigbee zcl如何扩展cluster、扩展命令、扩展属性
  8. layuit 框架_layui前端框架
  9. 总裁导航系统2023开源版,简洁清爽的页面值得你前来体验
  10. 都闪开,这才是最牛x技术搜索引擎【云原生】