文章目录

  • 数据集介绍
  • 如何从TCIA下载数据集
    • 下载数据集的一部分

数据集介绍

Lung-PET-CT-Dx是一个公开肺癌目标检测数据集,该公共数据集源自 The Cancer Imaging Archive(TCIA)。TCIA是肿瘤研究方面的著名的医学影像公开数据库。大部分数据以 DICOM 格式存储,所有数据都经过去隐私处理。

该数据集由肺癌受试者的 CT 和 PET-CT DICOM 图像组成,带有 XML 注释文件(xml文件中用边界框标识了肿瘤位置和分类)。 这些PET/CT影像是从肺癌患者中回顾性获得的,患者均经肺活检确诊 。 根据组织病理学诊断对受试者进行分组,分为4类,“A”诊断为腺癌,“B”为小细胞癌,“E”为大细胞癌,“G”为鳞状细胞癌。

数据集中共有355例次的影像记录,记录了患者的CT或PET-CT的影像资料,CT图像的分辨率是512×512。

下面两张图是下载好的数据集的CT图像部分。其主要是胸部PET-CT的图像,包括了 灰度的CT图像 和 带代谢摄取增高显像的CT图像。

如何从TCIA下载数据集

(该小节可能需要特殊方式访问目标网站)

Lung-PET-CT-Dx数据集源自TCIA。TCIA是肿瘤研究方向的医学影像公开数据库。
我们可以在官网的 Access The Data → Browse Data Collection 浏览所有数据集。

我们可以在Filter table处,输入“lung”等关键词筛选我们需要的数据集。


我们输入Lung-PET-CT-Dx进入我们的目标数据集页面。
找到下面的Data Access界面。

Images 为我们需要下载的影像资料。
Annotation Files是目标检测的标注数据(即XML注释文件,标注了肿瘤位置和分类)。
Clinical Data是患者相关的临床资料。
下面两个可以直接下载。


第一个Image,我们点击Download,会发现下载了一个tcia文件(Lung-PET-CT-Dx-NBIA-Manifest-122220.tcia)。
这是一个下载列表文件,需要使用网站提供的 NBIA Data Retriever 软件进行下载。

单击下面的NBIA Data Retriever,在新页面中选择 Downloading the NBIA Data Retriever,如果你是Windows系统,点击 Windows即可下载安装文件。

下载后打开安装文件完成安装。
安装完后直接打开软件会提示需要tcia文件。


我们把前面下载的 Lung-PET-CT-Dx-NBIA-Manifest-122220.tcia 文件直接和 NBIA Data Retriever 的快捷方式放在一起。

然后打开 tcia文件 即可,单击Agree,即可看到下载页面了。
单击 Start,开始下载数据集(准备好半天的时间下载)。

下载数据集的一部分

如果觉得数据集太大了,我只想要其中的一小部分该怎么做呢?
我们回到数据集页面,在刚才的 Images 处单击 Search 按钮。


我们可以在这里逐条浏览数据集中的各条数据,甚至可以浏览每一张的CT图片。
对于我们想要的条目,可以单击购物车 Cart 按钮。


挑完后,单击Cart进入购物车页面,单击Download即可下载对应的 tcia文件。
我们把这个文件和 NBIA Data Retriever 的快捷方式放在一起,即可打开下载我们想要的数据了。

玩转肺癌目标检测数据集Lung-PET-CT-Dx ——①从TCIA获取影像数据集相关推荐

  1. 玩转肺癌目标检测数据集Lung-PET-CT-Dx ——④转换成PASCAL VOC格式数据集

    文章目录 关于PASCAL VOC数据集 目录结构 ①创建VOC数据集的几个相关目录 XML文件的形式 ②读取dcm文件与xml文件的配对关系 ③创建VOC格式数据集 ④创建训练.验证集 本文所用代码 ...

  2. 玩转肺癌目标检测数据集Lung-PET-CT-Dx ——③整理、验证数据,建立Dataset对象

    文章目录 数据整理 整理出所有的dcm文件 整理出所有的xml标注文件 整理数据①--舍弃错误的标注文件 整理数据②--两个标注文件指向同一个目标图片的情况 封装函数,传入xml文件,显示标注效果 整 ...

  3. 玩转肺癌目标检测数据集Lung-PET-CT-Dx ——②预览数据集,绘制锚框

    文章目录 数据集预览 CT图片和xml文件的对应关系 查看dcm文件信息 将dcm图像与xml标注文件配对 本文接着预览数据集的概况,看看图像文件和标注文件该如何处理. 本文所用代码: 我的Githu ...

  4. 快速玩转Yolov5目标检测—没有好的显卡也能玩(二)

    上篇  快速玩转Yolov5目标检测-没有好的显卡也能玩(一) 已经将YoloV5在我的笔记本电脑上快速跑起来了,因为电脑显卡一般,所以运行的CPU版本,从推理结果来看,耗时还是蛮高的,如下图,平均每 ...

  5. 目标检测(Google object_detection) API 上训练自己的数据集

    应公司要求,利用谷歌最近开源的Google object_detection API对公司收集的数据集进行训练,并检测训练效果.通过一两天的研究以及维持四天的训练(GTX 1060  6GB),终于成 ...

  6. 数据民工,也能移动办公了:目标检测标注App上线Google Play,分分钟创建私人数据集...

    白交 发自 凹非寺  量子位 报道 | 公众号 QbitAI 想要快速建立目标检测模型,建立自己私人数据集吗? 现在用手机就可以做到. 最近,Reddit上介绍了这样一款移动版边框标注工具Mantha ...

  7. 快速玩转Yolov5目标检测—没有好的显卡也能玩(一)

    对目标检测关注很久了,比较有代表性的项目就是Yolov5了,前段时间终于安耐不住实验了一把. 多的不说了,先看下测试效果: 这是实时检测停车场的效果,还不错吧: 这是实时检测的北京卫视的效果: 安装方 ...

  8. 【自制数据集自动标注】yolo目标检测 voc格式 单调无遮挡背景单个物体自制数据集自动标注

    垃圾分类目标检测数据集准备 数据集背景: 参加全国大学生工程训练综合能力竞赛智能生活垃圾分类赛道时深感采集制作数据集过分彰显"有多少人工,就有多少智能"的惨痛,为了不辛苦麻烦身边小 ...

  9. 玩转CANN目标检测与识别一站式方案【介绍篇】

    背景介绍 目标检测与识别是计算机视觉领域中的关键技术,随着深度学习技术的发展,目标检测与识别的应用场景也越来越广泛.当前, 主要有以下几个应用场景: 安全领域:指纹识别.物体识别等. 交通领域:车牌号 ...

最新文章

  1. 你知道面试必问的AOP吗,跟Java初学者分享几点经验
  2. bugku ——加密 做题记录
  3. 输出毫秒_自学单片机第十三篇上:单点输出
  4. python换源还是不行_浅析Python3 pip换源问题
  5. Mysql数据库设计规范之四数据库操作行为规范
  6. 07-OSPF区域类型--NSSA区域/完全NSSA区域
  7. 互联网大厂、架构设计、稳定性、高可用、必备知识点技能,进大厂必备!!快来瞧瞧吧
  8. iPhone 14 Pro将采用开孔全面屏:明年iPhone 15全系标配
  9. @Valid注解详解
  10. python queue get 方法_Python语言中的Queue(队列)
  11. matlab monte carlo,Monte Carlo Simulation
  12. C# async await
  13. Linux常用命令汇总--cat
  14. Qt的环境与工具、信号与槽
  15. python 导入离线地图_PyQGIS开发 -- 离线地图
  16. 计算机如何分屏操作步骤,windows怎么分屏|windows系统开启分屏显示功能方法
  17. 《数据分析实战-托马兹.卓巴斯》读书笔记第1章-数据格式与数据交互
  18. 生物信息学二级计算机,生物信息学-张红-第二章-计算机基础
  19. 【textarea】按下回车发送消息不换行,怎么实现?
  20. redis之发布订阅

热门文章

  1. gcc的-l和-L是什么含义
  2. 解决Mac OS下JDK 1.8无法使用JMC问题
  3. 2023年江苏专转本成绩什么时候出
  4. python转置矩阵函数_对python 矩阵转置transpose的实例讲解
  5. 自走棋服务器太不稳定,《多多自走棋》将登陆Epic平台 PC版数据将与移动版互通...
  6. CGB2103-day06
  7. 《WebRTC实时通信》笔记整理汇总
  8. JVM(三)GC垃圾回收以及四种GC算法
  9. 【校内模拟】西行寺无余涅槃(FWT)
  10. 什么是功能性材料印刷?