1、假设只有一个source domain的训练数据,那么训练时就会存在一个精度与泛化能力之间平衡的问题

精度是要求在source domain上效果好,而泛化能力是要求模型在未知的target domain上结果好,两者似乎有一定权衡。比如,在做增广的时候,如果为了提高泛化,增加了增广的旋转角度和噪声水平,那么可能会影响模型在source domain上的精度?

2、一般解决模型泛化的方案有2个,transfer learning 以及domain adaptation (CycleGAN - based).

transfer learning 一般是微调一个预训练的网络(部分参数),让其适应target domain。这种方案只需要少量目标域的标注数据。但缺点也是,需要标注数据,而且预训练模型最好是基于大量的数据训练好的,另外这个方案,每遇到一个新的domain, 需要fine tuning一次模型,对于大规模应用部署来说,不太现实。

而domain adaptation的目标是把模型泛化到一个已知目标域(has data but no annotation),一般是在模型训练当中直接集成CycleGAN或其变种,手段要么是提取一些与域无关的特征(source domain和target domain共有的特征),要么是在source domain与target domain之间进行风格迁移。这个方案只能解决known target domain的问题,就是已经有数据。

总结起来,这2个方案都是针对known domain的问题,但是对于一个准确大规模部署的产品来说,可能遇到的数据会是各种差异性非常大的(i.e., different hospitals, scanner vendors, imaging protocols, patient populations, etc.)。那么什么样的模型才能满足这种需求呢?

3、unseen domain的泛化问题

1)采集数据,保证数量和勾画质量,另外还要保证多样性,尽量覆盖不同医院、不同设备、不同影像规范、不同患者群体;有文献表明,the error rate of a deep model for retinal image analysis was 5.5% on images from the same vendor used in training dataset, but decreased to 46.6% on images from another vendor。ref 《Clinically applicable deep learning for diagnosis and referral in retinal disease》 Nature Medicine, vol. 24, no. 9, p. 1342, 2018

2)数据增广,进一步增加数据多样性,参考《Generalizing Deep Learning for Medical Image Segmentation to Unseen Domains via Deep Stacked Transformation》;

3)模型本身;有没有什么模型结构或者是模块,本身就是比其他结构具有更强的泛化能力呢?在数据量一定的情况下,是否模型越深,参数量越多,模型泛化越强呢?比如三层unet 和四层unet,如果在source domain上结果相当,是否在unseen domain上会有差距呢?

参考文献《Generalizing Deep Learning for Medical Image Segmentation to Unseen Domains via Deep Stacked Transformation》的研究结果:

bigAug, 即对图像进行一系列级联的变化:

主要涉及图像的三个方面(image quality, appearance, and spatial configuration)

image quality的增广 ,包括锐化、模糊、噪声

appearance的增广,包括亮度,对比度,强度干扰

Spatial configuration的增广,包括旋转,缩放,变形

关于深度学习模型泛化问题的一些思考相关推荐

  1. 评估方法提高深度学习模型泛化能力

    三种经典的评估方法提高模型泛化能力 ①留出验证:评估模型时,将数据划分为训练集.验证集.测试集.(比较适合大数据集) 在训练数据上训练模型,在验证数据上评估模型,最后在测试数据上测试最佳参数的模型. ...

  2. 【AI初识境】如何增加深度学习模型的泛化能力​​​​​​​

    文章首发于微信公众号<有三AI> [AI初识境]如何增加深度学习模型的泛化能力 这是专栏<AI初识境>的第9篇文章.所谓初识,就是对相关技术有基本了解,掌握了基本的使用方法. ...

  3. 【AI初识境】如何增加深度学习模型的泛化能力

    这是专栏<AI初识境>的第9篇文章.所谓初识,就是对相关技术有基本了解,掌握了基本的使用方法. 今天来说说深度学习中的generalization问题,也就是泛化和正则化有关的内容. 作者 ...

  4. 实战 | 深度学习轻松学:如何用可视化界面来部署深度学习模型

    翻译 | AI科技大本营 参与 | 王赫 上个月,我有幸结识了 DeepCognition.ai 的创始人. Deep Cognition (深度认知) 建立的深度学习工作室,为很多准备部署深度学习框 ...

  5. 如何判断你的数据集是否适合使用深度学习模型?如果数据量太小有什么解决办法?

    如何判断你的数据集是否适合使用深度学习模型?如果数据量太小有什么解决办法? deep learning is a data hungry problem 数据集太小,数据样本不足时,深度学习相对其它机 ...

  6. 亚马逊专家揭秘:如何建立自动检测乳腺癌的深度学习模型

    安妮 编译自 Insight Data Science 量子位出品 | 公众号 QbitAI 本文作者Sheng Weng,现亚马逊Alexa项目组数据专家,莱斯大学应用物理专业已毕业博士生,主要研究 ...

  7. 除了网络搜索(NAS),AutoML对深度学习模型优化还有哪些贡献?

    文/编辑 | 言有三 自从Google提出AutoML技术以来,已经过去了好几年了,如今在学术界和工业界都是热点.AutoML在网络结构的搜索上已经取得了非常多的突破,相关的文章,技术博客都已经广为流 ...

  8. 实战 | 深度学习轻松学:如何用可视化界面来部署深度学习模型 转载 2017年12月27日 00:00:00 109 翻译 | AI科技大本营 参与 | 王赫 上个月,我有幸结识了 DeepCogn

    实战 | 深度学习轻松学:如何用可视化界面来部署深度学习模型 转载 2017年12月27日 00:00:00 标签: 109 编辑 删除 翻译 | AI科技大本营 参与 | 王赫 上个月,我有幸结识了 ...

  9. 【小结】除了网络搜索(NAS),AutoML对深度学习模型优化还有哪些贡献?

    文/编辑 | 言有三 自从Google提出AutoML技术以来,已经过去了好几年了,如今在学术界和工业界都是热点.AutoML在网络结构的搜索上已经取得了非常多的突破,相关的文章,技术博客都已经广为流 ...

最新文章

  1. java获取接口数据类型_java中调用第三方接口获取数据的方式
  2. 人这辈子没法做太多的事情
  3. innobackupex实现导出和导入单张表
  4. 深入理解JavaScript系列(1):编写高质量JavaScript代码的基本要点(转)
  5. 【演讲实录】银行PB级别海量非结构化数据管理实践
  6. python 配置文件对比_Python3实现配置文件差异对比脚本
  7. TiDB 源码阅读系列文章(九)Hash Join
  8. 用计算机知识写祝福,计算机课程设计心得体会
  9. 什么是网站的统计代码
  10. 查看Eclipse的工作路径
  11. 51单片机 WR RD的作用
  12. 自定义firefox背景色(豆绿色)
  13. 微信小程序:工具配置 project.config.json
  14. 【电信学】【2019.03】5G异构网络中的移动性管理
  15. MySQL SQL语句面试准备
  16. 道德沦丧的电商推广app开发①
  17. cocos creator 角色扮演RPG游戏 动态创建动画,附8方向设置
  18. sd卡照片清除用什么软件可以找回
  19. 我的UC/OS,我做主
  20. web通讯录之通讯录主界面

热门文章

  1. [STK] matlabSTK 安装
  2. android 课程表 拖拽,用自动排课表软件生成课程表 此后告别排课苦恼
  3. 线性代数之——克拉默法则、逆矩阵和体积
  4. cad连接不同线段的端点_cad里可不可以自动在多段线的端点上生成点?
  5. 解决网页篡改,修复系统bug神器
  6. NLP实战1--词典、停用词、问答对的准备
  7. python:求解一元二次方程
  8. 头歌平台Docker企业级实训 第2章 Docker进阶之镜像 镜像管理
  9. Access to the path '/Files/Images/' is denied. 如何处理此类问题
  10. java文本阅读器代码_java项目—文本阅读器