文章目录

  • LUNA 2016数据集
    • 肺结节数据集来源
    • LUNA16数据集介绍
  • 目标以及可能实现的模型
  • 运行模型的具体经历
    • LUNA16-Lung-Nodule-Analysis-2016-Challenge
    • 3D-Lung-nodules-detection
  • 遇到的问题

LUNA 2016数据集

肺结节数据集来源

天池的数据没有开放,LIDC数据集太大了,我将lLUNA16数据集存在了百度网盘,想要的朋友请点击这个链接

LUNA16数据集介绍

LUNA16的数据来源于一个更大的数据集LIDC-IDRI,该数据集共有1018个CT扫描,也就是1018个病例,每个CT图像都有xml格式的标签文件,这个数据集的数据来源于7家不同的学术机构,所采用的扫描器及其相关参数都不尽相同,所以,1018个图像可以说分布不均,用论文中的话来说就是very heterogeneous。

LUNA16数据集将切片厚度(slice thickness)大于3mm的CT去除,同时将切片space不一致以及缺失部分切片的CT也去除,最后产生了888张CT,构成了LUNA16.这里要解释两件事,一,剔除3mm以上的CT是因为切片越薄效果越好,这不难理解,对肺部进行扫描,肯定是扫描得出的数据越多越好,想的极端点,如果整个肺部只有一张切片,这厚度绝对够了吧哈哈,那就连3D数据都没法获取了,更别说有效检测肺结节。二,切片space是啥,个人理解就是切片出来的数据是3D的(把一张张二维切片组合一起),有z,y,x三个维度,spacez指的就是切片厚度,spacey和spacex指的是每张切片的单个像素代表着实际宽高多少的肺部组织。所有的CT图像都以.mhd格式存储。

这里,不妨看一下实际上LUNA16的文件,共有10个子文件夹,subset0~subset9,这是为了做10折交叉验证,每个文件夹里都是病例,每个病例对应两个文件,文件名相同,后缀不同,其中.mhd文件存储着ct的基本信息,.raw文件存储着实际的ct数据,可以看到,ct文件还是挺大的,LUNA16足足一百多G,下载起来也挺耗时的。


目标以及可能实现的模型

我找到的以LUNA 16为数据集的模型有如下几个

  1. LUNA16-Lung-Nodule-Analysis-2016-Challenge 这篇文章是我首先看到的.这篇文章里面主要做了两个工作,一个是detection(segmentation)图片可视化,另一个是classification.作者给了联系方式,总的来说是我的首选.
  2. LUNA16 Lung Nodule Analysis - NWI-IMC037 Final Project只是实现了prediction,感觉工作比较的仓促(跟我一样在赶ddl),而且有一部分似乎要manually ,排他自己也说 “hard to redo”,排除了
  3. 3D-Lung-nodules-detection只是实现了prediction,不过很有条理,可以参考一下.
  4. CASED-TensorflowREADME有点迷,最后可以尝试一下

运行模型的具体经历


LUNA16-Lung-Nodule-Analysis-2016-Challenge

  1. nodule detection
  • convert annotation.csv file to image mask file:run the LUNA_mask_extraction.py这一步调整了一下坐标系
  • analyze the ct image,and get the slice thickness and window width and position:run the dataAnaly.py 这一步print一下,可有可无
  • generate lung nodule ct image and mask:run the data2dprepare.py 生成了ct原来的图像和mask,mask大部分是全黑,只有一小部分一个白色的小点
  • generate patch(96,96,16) lung nodule image and mask:run the data3dprepare.py
  • save lung nodule data and mask into csv file run the utils.py,like this:G:\Data\segmentation\Image/0_161…
  1. nodule classify
  • convert candidates.csv file to nodule and not-nodule image(48,48,48):run the LUNA_node_extraction.py
  • Augment the nodule image data: run the Augmain.py
  • split data into train data(80%) and test data(20%):run the subset.py
  • save lung nodule data and label into csv file like this:1,G:\Data\classify\1_aug/0_17.npy

3D-Lung-nodules-detection

labels.csv是个神马东西啊,这玩意儿根本没法跑,值得注意的是他用了设置了一个config字典的py文件(config training)来设置各项地址,然后在prepare.py设置了385行设置各项参数,不过个人感觉还是使用argparse模块一目了然,这个东西我找了很久


遇到的问题

  1. 数据集过于庞大,加上预处理数据轻轻松松达到150gb以上,我尝试不使用全部dataset训练,但为candidates.csv无法修改的问题.这里一共551065条数据。其中,正例(class:1):1351条,其余都是负例(class:0),由于无法识别名称,不得不整个数据集进行训练.同时因为这个原因需要推倒重来,我将数据集放到了1TB的固态硬盘上进行训练

LUNA 2016 Detection and Segmentation相关推荐

  1. 全卷积神经网路【U-net项目实战】LUNA 2016 数据集详解

    文章目录 1.LUNA 2016 数据集详解 2.mdh数据格式详解 3.python读取mdh的方法 4.annotations.csv坐标转换 5.LUNA16数据集肺结节显示 1.LUNA 20 ...

  2. 【论文笔记】Region-based Convolutional Networks for Accurate Object Detection and Segmentation

    <Region-based Convolutional Networks for Accurate Object Detection and Segmentation>是将卷积神经网络应用 ...

  3. 【论文翻译】UniT: Unified Knowledge Transfer for Any-Shot Object Detection and Segmentation

    UniT: Unified Knowledge Transfer for Any-Shot Object Detection and Segmentation UniT:任意样本量的目标检测和分割的统 ...

  4. LUNA 2016 数据集详解

    LUNA 2016 数据集详解 LUNA16数据集的由来 LUNA 2016 数据集来自2016年LUng Nodule Analysis比赛,这里是其官方网站. LUNA16数据集是最大公用肺结节数 ...

  5. Simultaneous Detection and Segmentation

    Simultaneous Detection and Segmentation(SDS) 论文理解 ================================================== ...

  6. 视盘检测 Accurate and Efficient Optic Disc Detection and Segmentation by a Circular Transformation

    Accurate and Efficient Optic Disc Detection and Segmentation by a Circular Transformation 原文意思: 利用边缘 ...

  7. 异常检测论文阅读《PANDA: Adapting Pretrained Features for Anomaly Detection and Segmentation》

    <PANDA: Adapting Pretrained Features for Anomaly Detection and Segmentation> CVPR2021 论文背景: 近年 ...

  8. Lecture 11: Detection and Segmentation

    CS231n Lecture 11: Detection and Segmentation Semantic Segmentation Label each pixel in the image wi ...

  9. [SDS]Simultaneous Detection and Segmentation

    Motivation 作者认为,尽管检测和分割被分成两个任务,但是这些差异都是人为设定的.因此,这里应该存在一种任务--Simultaneous Detection and Segmentation, ...

最新文章

  1. 完成CitrixVDI架构了解及部署测试
  2. AI 一分钟 | 特斯拉科技创新中心落户北京;麻省理工开发透视技术
  3. XenServer 6 自动启动虚拟机
  4. C#进阶系列——WebApi 跨域问题解决方案:CORS
  5. BZOJ4066:简单题(K-D Tree)
  6. Python程序员每天必做的几个动作
  7. python redis list_Python redis list列表操作
  8. 基于ConvLSTM的伦敦空气质量预测(2) 算法实施
  9. 【体系结构】LGWR进程触发机制的理解
  10. 软件测试_Loadrunner_APP测试_性能测试_脚本优化_脚本回放
  11. 学前教育计算机课程设置,计算机网络背景下学前教育专业课程设置分析
  12. uniapp实现app跳转app
  13. php保留两位小叔_PHP价格格式化,保留两位小数
  14. 通信管理员(一)居于MAC地址的网络通信
  15. zabbix4.0配置钉钉机器人告警详细教程
  16. 基于深度学习的肺部CT影像识别——采用U-net、3D CNN、cGAN实现肺结节的检测(一)
  17. MATLAB 马尔可夫链
  18. 黑马程序员 日记(七)
  19. MySQL排查篇:该如何定位并解决线上突发的Bug与疑难杂症?
  20. uni-app微信小程序保持登录状态(vuex和本地存储)

热门文章

  1. 锐捷交换机配置MSTP以及VRRP
  2. error界面html,error.html
  3. 云计算产品学习(2)
  4. Workflow,要不要了解一下
  5. docker问题备忘:rpc error: code = 2 desc = containerd: container not found
  6. python图片隐写_CTF 图像隐写Python脚本处理
  7. #ifdef _cplusplus是什么意思
  8. 根据指定的n,返回相应的斐波纳契数列。
  9. 分享一本Java并发编程的免费好书
  10. 经历≠经验,码农如何工作10年依然是菜鸟?