<font color="red">GAN生成对抗网络:</font>由两个子网络组成,generator和discriminator,在训练过程中,这两个子网络进行着最小最大值机制,generator用随机向量输出一个目标数据分布的样例,discriminator从目标样例中区分出生成器生成的样例。generator通过后向传播混淆discriminator,依此generator生成与目标样例相似的样例。

<font color="red">这篇论文中,</font>将generator换成一个分割网络(可以是任意形式的分割网络,如:FCN,DeepLab,DilatedNet……,输入是H*W*3,依次是长宽,通道数,输出概率图为H*W*C,其中C是语义种类数),这个网络对输入的图片分割输出一个概率图,使得输出的概率图尽可能的接近ground truth。其中discriminator采用了全卷积网络(输入为generator或ground truth得到的概率图,输出位空间概率图H*W*1,其中其中像素点p代表这个来自gournd truth(p=1)还是generator(p=0))。

训练中,用半监督机制,一部分是注解数据,一部分是无注解数据。 **当用有注解数据时,**分割网络由基于ground truth的标准交叉熵损失和基于鉴别器的对抗损失共同监督。注意,训练discriminator只用标记数据。

**当用无注解数据时,**用半监督方法训练分割网络,在从分割网络中获取未标记图像的初始分割预测后,通过判别网络对分割预测进行传递,得到一个置信图。我们反过来将这个置信图作为监督信号,使用一个自学机制来训练带masked交叉熵损失的分割网络。置信图表示了预测分割的质量。

对抗网络的半监督训练

输入图像$x_n$大小为HW3, 分割网络表示为$s(·)$,预测概率图为$s(x_n)$大小为HWC。全卷积discriminator表示为$D(·)$,其输入有两种形式:分割预测$s(x_n)$和one-hot编码的gournd truth $Y_n$.

训练discriminator网络:

最小化空间交叉熵损失$L_D$,其表示为: $$L_D=-\sum_{h,w} (1-y_n)log(1-(s(x_n))^{(h,w)})+y_nlog(D(Y_n)^{(h,w)})$$ 当输入来自分割网络时$y_n=0$,若来自ground truth则为$y_n=1$. 为了将ground truth转换为C通道的概率图,我们用one-hot机制进行编码,即如果像素$x_n^{(h,w)}$输入类C,则取1,否则为0.

训练分割网络:

这里使用的损失是多任务损失: $$L_seg=L_{ce}+λ_{adv}L_{adv}+λ_{semi}L_{semi}$$ 其中$L_{ce}$,$L_{adv}$和$L_{semi}$分别代表 multi-class cross entropy loss, the adversarial loss,和the semi-supervised loss,这里的$λ_{adv}$和$λ_{semi}$. 这里先考虑用有注解的数据,则: $$L_{ce}=-\sum_{h,w}\sum_{c\epsilon{C}}Y_n^{(h,w,c)}log(s(x_n)^{(h,w,c)})$$ $L_{adv}$表示为: $$L_{adv}=-\sum_{h,w}log(D(S(X_N))^{(h,w)})$$

用无标签数据训练

由于没有ground truth,因此这里不能使用$L_{ce}$,这里提出了用自学机制在无注解数据中利用被训练的discriminator,大意是被训练的discriminator可以生成一个置信图,即$D(S(X_n))^{(h,w)}$,这个公式用来推断预测结构足够接近gournd truth的区域。这里用一个阈值来二值化置信图,$\hat{Y}=argmax(s(x_n))$,使用二值化置信图,半监督损失可以定义为: $$L_{semi}=-\sum_{h,w}\sum_{c\epsilon{C}}I(D(S(x_n))^{(h,w)}>T_{semi)}\bullet\hat{Y}n^{(h,w,c)}log(s(x_n)^{(h,w,c)})$$ 其中$I(\bullet)$是指示函数,$T{semi}$是阈值,注意在训练期间,自学目标值$\hat{Y}_n$和指示函数的值为常量,因此上式可以简单看做空间交叉熵损失。

转载于:https://my.oschina.net/u/3837179/blog/1921107

对抗学习的半监督语义分割相关推荐

  1. 用于半监督语义分割的基于掩码的数据增强

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 小白导读 论文是学术研究的精华和未来发展的明灯.小白决心每天为大家 ...

  2. CVPR 2022 | 商汤/上交/港中文提出U2PL:使用不可靠伪标签的半监督语义分割

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 作者:Pascal  |  已授权转载(源:知乎)编辑:CVer https://zhuanlan.zhih ...

  3. Semi-supervised Semantic Segmentation with Error Localization Network(基于误差定位网络的半监督语义分割 )

    Semi-supervised Semantic Segmentation with Error Localization Network(基于误差定位网络的半监督语义分割 ) Abstract 本文 ...

  4. CVPR 2021 | 北大MSRA提出CPS:基于交叉伪监督的半监督语义分割

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 作者:Charles  |  源:知乎 https://zhuanlan.zhihu.com/p/37812 ...

  5. 【文献阅读】用对比学习做弱监督语义分割(Sung-Hoon Yoon等人,ArXiv,2021)

    一.背景 文章题目:<Exploring Pixel-level Self-supervision for Weakly Supervised Semantic Segmentation> ...

  6. CVPR 2022|U2PL:使用不可靠伪标签的半监督语义分割

    本文转自商汤学术 导读 半监督任务的关键在于充分利用无标签数据,商汤科技联合上海交通大学.香港中文大学,基于「 Every Pixel Matters」的理念,有效利用了包括不可靠样本在内的全部无标签 ...

  7. 半监督语义分割_paper reading part2

    03 SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers Time:2021.05 我 ...

  8. 深度学习(9)——无监督语义分割之全卷积域适应网络(译文)

    无监督语义分割之全卷积域适应网络 Fully Convolutional Adaptation Networks for Semantic Segmentation 摘要 深度神经网络的最新进展令人信 ...

  9. 深度学习应用篇-计算机视觉-语义分割综述[5]:FCN、SegNet、Deeplab等分割算法、常用二维三维半立体数据集汇总、前景展望等

    [深度学习入门到进阶]必看系列,含激活函数.优化策略.损失函数.模型调优.归一化算法.卷积模型.序列模型.预训练模型.对抗神经网络等 专栏详细介绍:[深度学习入门到进阶]必看系列,含激活函数.优化策略 ...

最新文章

  1. 如何在notebook中的markdown中插入截取的图片_96编辑器教你如何在文章中插入图片、视频、音频!...
  2. Winform中实现ZedGraph滚轮缩放后自动重新加载数据
  3. java 如何把源码导出为jar包,以及如何使用导出的jar包
  4. 触摸旋转 Android,Opengl es Android 3D 手指触控旋转object
  5. AngularJS(1)——入门学习
  6. 【计算机网络】为什么一个路由器会有两个wifi信号
  7. 【openMV】霍夫变换---直线提取
  8. 10.08-vscode-plantuml建模
  9. PHP不仅仅是PHP
  10. BeautifulSoup4 搜索文档树Day3-8
  11. junit4同一时候測试多个測试类
  12. 驱动调试(六)利用中断打印
  13. 原生 遍历_ECMAScript 6 入门教程—异步遍历器
  14. Keras版GCN源码解析
  15. 【转载】用CAM350制作CAM资料的基本步骤
  16. GPGGA \ GPRMC 格式解析
  17. 贪婪模式与正则匹配过程
  18. pytorch安装(离线包)
  19. 带节点的曲线,可以鼠标拖动节点,类似PS
  20. win10 机械硬盘 开机速度缓慢的原因排查与优化

热门文章

  1. 讲讲项目中你是如何处理高并发的?
  2. 切换慢镜头tween.js的使用
  3. 如何优化产品标题和要点
  4. 加密的m3u8视频下载支持本地m3u8
  5. 关于模块化薪资系统设计方案的讨论
  6. 动漫自我介绍思维导图模板,免费在线制作
  7. 极客星球 | 机器学习赋能商业地产决策进阶
  8. Java进阶(5)——调用方法的三种方式
  9. python nlp 句子提取_python nlp 句子提取_《用Python进行自然语言处理》第7章 从文本提取信息...
  10. Python函数: time.strftime()、time.localtime()、time.time()