MedSegDiff: Medical Image Segmentation with Diffusion Probabilistic Model

摘要

  • 第一个基于DPM的通用医学图像分割任务模型
  • 为了提高医学图像分割中DPM的分步区域注意,提出了动态条件编码方法,为每一步采样建立状态自适应条件
  • 进一步提出了特征频率分析器(FF-Parser):消除高频噪声成分在此过程中的负面影响
  • 代码地址:https://github.com/WuJunde/MedSegDiff

引言

  • 扩散概率模型(DPM)作为生成模型能够生成具有高多样性和合成质量的图像
  • 最近的大型扩散模型:DALLE2、Imagen[,Stable diffusion
  • 本文将当前步分割掩码与先验图像在特征层上进行多尺度融合

方法

步长估计函数:

EIt是条件特征嵌入,本文中是原始图像嵌入,Ext是当前步骤的分割地图特征嵌入。这两个组件相加并发送到UNet解码器D进行重建。步长索引t与添加的嵌入和解码器特性集成在一起。在每一种方法中,都使用共享的学习查找表进行嵌入

动态条件编码

  • 将当前步分割信息xt转换为条件原始图像编码
  • 在Unet编码器中,利用当前步的编码特征增强了原始图像编码器的中间特征
  • 融合采用一种类似于注意力机制的实现
  • 两个特征映射首先进行层归一化,然后将相乘得到的结果与条件编码特征相乘以增强注意区域

FF-Parser

作用:约束xt特征中与噪声相关的分量
主要思想:学习应用于傅里叶空间特征的参数化注意(权重)映射
给定一个解码器特征映射m∈H×W ×C,沿着空间维度执行二维FFT(快速傅里叶变换),可以表示为:

然后,通过乘以一个参数化的注意映射来调制M的频谱:

最后,通过反FFT将m0逆回空间域

FF-Parser可以看作是频率滤波器的一个可学习版本
与空间注意不同,它对特定频率的分量进行全局调整。因此,可以学习约束高频分量进行自适应融合。

训练和结构

损失函数:Unet中恢复噪声/图像

细节:

  • 编码器由三个卷积阶段组成
  • 每个残差块由两个卷积块组成
  • 每个卷积块由组标准化和SiLU激活函数和一个卷积层组成

实验结果


主要对三个图像进行了测试

消融实验

验证所提出的动态调节和FF-Parser的有效性

MedSegDiff相关推荐

  1. MedSegDiff:基于 Diffusion Probabilistic Model 的医学图像分割

    目录 前言 MedSegDiff 动态条件编码 FF-Parser 实验 MedSegDiff-V2 概述 Anchor Condition with Gaussian Spatial Attenti ...

  2. 2022年11月100篇 diffusion models 扩散模型 汇总!

    在生成图像方面,自从NIPS 2014的一篇开山之作: Generative Adversarial Nets 论文:https://proceedings.neurips.cc/paper/2014 ...

  3. diffusion medical image segmentation

    1.Diffusion Models for Implicit Image Segmentation Ensembles code:https://github.com/JuliaWolleb/Dif ...

  4. 封门村,中国第一鬼村,最恐怖之地

    中国第一鬼村:封门村,一把诡异太师椅吓到一群人 去啊 07-09 11:05 中国第一"鬼村"封门村! 沁阳封门村号称中国最恐怖的村庄,特别是其中谣传的那张夺命太师椅,谁坐谁死. ...

  5. 井喷式爆发!2022年11月100篇 diffusion models 扩散模型 汇总!

    点击上方"摸鱼吧算法工程师"卡片,关注星标 获取有趣.好玩的前沿干货! 001  (2022-11-30) Maximum Likelihood Estimation for a ...

  6. 【医学图像】图像分割系列.2 (diffusion)

    介绍几篇使用diffusion来实现医学图像分割的论文:DARL(ICLR2023),MedSegDiff(MIDL2023)& MedSegDiff-V2(arXiv2023),ImgX-D ...

最新文章

  1. 【培训】 项目实训中遇到的问题 总结 跟解决方法
  2. Best open-source pedestrian detection library for commercial use?
  3. 用 Spring Boot 纯手工打造私人云网盘!!!
  4. 010 Android之逆向入门
  5. 【效率】又来一个Windows神器!!!
  6. AOJ GRL_1_C: All Pairs Shortest Path (Floyd-Warshall算法求任意两点间的最短路径)(Bellman-Ford算法判断负圈)
  7. 深度学习的实用层面 —— 1.12 梯度的数值逼近
  8. Token实现单点登陆
  9. 【读书笔记《Android游戏编程之从零开始》】12.游戏开发基础(Canvas 画布)
  10. 小米人APK改之理(APK IDE)
  11. UTF-8字符「EF BF BD」-备胎
  12. 台式电脑显示配置100%请勿关闭计算机,“准备配置windows 请勿关闭计算机”的解决方法...
  13. Android绘图(二)使用 Graphics2D 实现动态效果
  14. properties文件
  15. 显示器 如何切换输入源
  16. Python将乘法表写入Excel表
  17. Matlab使用libsvm-3.25 heart_scale数据集
  18. python哪里培训
  19. 储能系统下垂控制,输出电流按虚拟电阻比例分配,并补偿有下垂系数带来的母线压降
  20. log4j实现发送邮件功能

热门文章

  1. JS之前台参数提交到后台,双引号转义为quot;解决办法
  2. 学生选修课程系统(C语言/C++实现)
  3. 艾宾浩斯遗忘曲线PHP,【干货】~~~艾宾浩斯遗忘曲线~~~
  4. php 判断来源 微信客户端_判断访问来源(PC/H5/微信)
  5. MATLAB中多层网络的net.lw{i,j}和net.b{k}的含义
  6. 谈谈个人博客的盈利技巧
  7. Eric6使用介绍(详细)
  8. 「服务端」阿里云https如何免费申请
  9. mysql share nothing_分布式数据库的Share Nothing / Share Disk / Share Storage
  10. 信息系统安全导论第七章信息安全工程与信息安全审计