LUNA 2016 Detection and Segmentation
文章目录
- LUNA 2016数据集
- 肺结节数据集来源
- LUNA16数据集介绍
- 目标以及可能实现的模型
- 运行模型的具体经历
- LUNA16-Lung-Nodule-Analysis-2016-Challenge
- 3D-Lung-nodules-detection
- 遇到的问题
LUNA 2016数据集
肺结节数据集来源
天池的数据没有开放,LIDC数据集太大了,我将lLUNA16数据集存在了百度网盘,想要的朋友请点击这个链接
LUNA16数据集介绍
LUNA16的数据来源于一个更大的数据集LIDC-IDRI,该数据集共有1018个CT扫描,也就是1018个病例,每个CT图像都有xml格式的标签文件,这个数据集的数据来源于7家不同的学术机构,所采用的扫描器及其相关参数都不尽相同,所以,1018个图像可以说分布不均,用论文中的话来说就是very heterogeneous。
LUNA16数据集将切片厚度(slice thickness)大于3mm的CT去除,同时将切片space不一致以及缺失部分切片的CT也去除,最后产生了888张CT,构成了LUNA16.这里要解释两件事,一,剔除3mm以上的CT是因为切片越薄效果越好,这不难理解,对肺部进行扫描,肯定是扫描得出的数据越多越好,想的极端点,如果整个肺部只有一张切片,这厚度绝对够了吧哈哈,那就连3D数据都没法获取了,更别说有效检测肺结节。二,切片space是啥,个人理解就是切片出来的数据是3D的(把一张张二维切片组合一起),有z,y,x三个维度,spacez指的就是切片厚度,spacey和spacex指的是每张切片的单个像素代表着实际宽高多少的肺部组织。所有的CT图像都以.mhd格式存储。
这里,不妨看一下实际上LUNA16的文件,共有10个子文件夹,subset0~subset9,这是为了做10折交叉验证,每个文件夹里都是病例,每个病例对应两个文件,文件名相同,后缀不同,其中.mhd文件存储着ct的基本信息,.raw文件存储着实际的ct数据,可以看到,ct文件还是挺大的,LUNA16足足一百多G,下载起来也挺耗时的。
目标以及可能实现的模型
我找到的以LUNA 16为数据集的模型有如下几个
- LUNA16-Lung-Nodule-Analysis-2016-Challenge 这篇文章是我首先看到的.这篇文章里面主要做了两个工作,一个是detection(segmentation)图片可视化,另一个是classification.作者给了联系方式,总的来说是我的首选.
- LUNA16 Lung Nodule Analysis - NWI-IMC037 Final Project只是实现了prediction,感觉工作比较的仓促(跟我一样在赶ddl),而且有一部分似乎要manually ,排他自己也说 “hard to redo”,排除了
- 3D-Lung-nodules-detection只是实现了prediction,不过很有条理,可以参考一下.
- CASED-TensorflowREADME有点迷,最后可以尝试一下
运行模型的具体经历
LUNA16-Lung-Nodule-Analysis-2016-Challenge
- nodule detection
- convert annotation.csv file to image mask file:run the LUNA_mask_extraction.py
这一步调整了一下坐标系
- analyze the ct image,and get the slice thickness and window width and position:run the dataAnaly.py
这一步print一下,可有可无
- generate lung nodule ct image and mask:run the data2dprepare.py
生成了ct原来的图像和mask,mask大部分是全黑,只有一小部分一个白色的小点
- generate patch(96,96,16) lung nodule image and mask:run the data3dprepare.py
- save lung nodule data and mask into csv file run the utils.py,like this:G:\Data\segmentation\Image/0_161…
- nodule classify
- convert candidates.csv file to nodule and not-nodule image(48,48,48):run the LUNA_node_extraction.py
- Augment the nodule image data: run the Augmain.py
- split data into train data(80%) and test data(20%):run the subset.py
- save lung nodule data and label into csv file like this:1,G:\Data\classify\1_aug/0_17.npy
3D-Lung-nodules-detection
labels.csv是个神马东西啊,这玩意儿根本没法跑,值得注意的是他用了设置了一个config字典的py文件(config training)来设置各项地址,然后在prepare.py设置了385行设置各项参数,不过个人感觉还是使用argparse模块一目了然,这个东西我找了很久
遇到的问题
- 数据集过于庞大,加上预处理数据轻轻松松达到150gb以上,我尝试不使用全部dataset训练,但为candidates.csv无法修改的问题.这里一共551065条数据。其中,正例(class:1):1351条,其余都是负例(class:0),由于无法识别名称,不得不整个数据集进行训练.同时因为这个原因需要推倒重来,我将数据集放到了1TB的固态硬盘上进行训练
LUNA 2016 Detection and Segmentation相关推荐
- 全卷积神经网路【U-net项目实战】LUNA 2016 数据集详解
文章目录 1.LUNA 2016 数据集详解 2.mdh数据格式详解 3.python读取mdh的方法 4.annotations.csv坐标转换 5.LUNA16数据集肺结节显示 1.LUNA 20 ...
- 【论文笔记】Region-based Convolutional Networks for Accurate Object Detection and Segmentation
<Region-based Convolutional Networks for Accurate Object Detection and Segmentation>是将卷积神经网络应用 ...
- 【论文翻译】UniT: Unified Knowledge Transfer for Any-Shot Object Detection and Segmentation
UniT: Unified Knowledge Transfer for Any-Shot Object Detection and Segmentation UniT:任意样本量的目标检测和分割的统 ...
- LUNA 2016 数据集详解
LUNA 2016 数据集详解 LUNA16数据集的由来 LUNA 2016 数据集来自2016年LUng Nodule Analysis比赛,这里是其官方网站. LUNA16数据集是最大公用肺结节数 ...
- Simultaneous Detection and Segmentation
Simultaneous Detection and Segmentation(SDS) 论文理解 ================================================== ...
- 视盘检测 Accurate and Efficient Optic Disc Detection and Segmentation by a Circular Transformation
Accurate and Efficient Optic Disc Detection and Segmentation by a Circular Transformation 原文意思: 利用边缘 ...
- 异常检测论文阅读《PANDA: Adapting Pretrained Features for Anomaly Detection and Segmentation》
<PANDA: Adapting Pretrained Features for Anomaly Detection and Segmentation> CVPR2021 论文背景: 近年 ...
- Lecture 11: Detection and Segmentation
CS231n Lecture 11: Detection and Segmentation Semantic Segmentation Label each pixel in the image wi ...
- [SDS]Simultaneous Detection and Segmentation
Motivation 作者认为,尽管检测和分割被分成两个任务,但是这些差异都是人为设定的.因此,这里应该存在一种任务--Simultaneous Detection and Segmentation, ...
最新文章
- 完成CitrixVDI架构了解及部署测试
- AI 一分钟 | 特斯拉科技创新中心落户北京;麻省理工开发透视技术
- XenServer 6 自动启动虚拟机
- C#进阶系列——WebApi 跨域问题解决方案:CORS
- BZOJ4066:简单题(K-D Tree)
- Python程序员每天必做的几个动作
- python redis list_Python redis list列表操作
- 基于ConvLSTM的伦敦空气质量预测(2) 算法实施
- 【体系结构】LGWR进程触发机制的理解
- 软件测试_Loadrunner_APP测试_性能测试_脚本优化_脚本回放
- 学前教育计算机课程设置,计算机网络背景下学前教育专业课程设置分析
- uniapp实现app跳转app
- php保留两位小叔_PHP价格格式化,保留两位小数
- 通信管理员(一)居于MAC地址的网络通信
- zabbix4.0配置钉钉机器人告警详细教程
- 基于深度学习的肺部CT影像识别——采用U-net、3D CNN、cGAN实现肺结节的检测(一)
- MATLAB 马尔可夫链
- 黑马程序员 日记(七)
- MySQL排查篇:该如何定位并解决线上突发的Bug与疑难杂症?
- uni-app微信小程序保持登录状态(vuex和本地存储)
热门文章
- 锐捷交换机配置MSTP以及VRRP
- error界面html,error.html
- 云计算产品学习(2)
- Workflow,要不要了解一下
- docker问题备忘:rpc error: code = 2 desc = containerd: container not found
- python图片隐写_CTF 图像隐写Python脚本处理
- #ifdef _cplusplus是什么意思
- 根据指定的n,返回相应的斐波纳契数列。
- 分享一本Java并发编程的免费好书
- 经历≠经验,码农如何工作10年依然是菜鸟?