论文:A brief introduction to weakly supervised learning / 对弱监督学习的简要介绍
作者:Zhi-Hua Zhou / 周志华
发表刊物:National Science Review
发表年度:2018
下载地址:https://academic.oup.com/nsr/article/5/1/44/4093912

Abstract / 摘要

   监督学习旨在通过从大量训练样本中学习来构建预测模型,其中每个训练样本都有标示其真实输出的标签。虽然如今监督学习技术取得了巨大成功,但值得注意的是,由于数据标注过程成本较高,在许多任务中,我们很难获取到像全部训练数据的真实标签这样的强监督信息。因此我们需要能够在弱监督信息下工作的机器学习模型。本文关注弱监督学习的一些研究进展,主要聚焦在三种弱监督类型不完全监督——只有一部分训练数据有标签、不确切监督——训练数据只有粗粒度的标签和不准确监督——给定的训练样本标签不一定正确。

Introduction / 引言

  机器学习在各种任务中都取得了巨大成功,尤其是像分类和回归这样的监督学习技术。一般地,监督学习从包含大量训练样本的训练集中学习预测模型,训练样本由两部分组成:用于描述对象的特征向量和用于标示输出的标签。在分类中,标签表明样本所属类别;在回归中,标签表明样本对应的实值。许多成功的技术都依赖于大量带有真实标签的训练数据,然而,获取到这些强监督信息的成本是比较高的。因此,需要能够在弱监督信息下工作的机器学习模型。
  弱监督学习分为三种类型:一、不完全监督——只有一部分训练数据有标签,比如在执行图片分类任务时,图片的标签往往是由人工标注员标注的,当从网上获得大量图片后,由于成本的关系,我们只能标注其中的一小部分数据;二、不确切监督——训练数据只有粗粒度的标签,比如在进行图片分类任务时,我们希望把图片中的每个对象都标出来,但我们往往只进行图片级的标注而不考虑对象级的标注;三、不准确监督——给定的训练样本标签不一定正确,比如在图像分类任务中,当标注员粗心或疲惫,又或者图像难以识别的时候,标注员可能会出错。
  弱监督学习是一个概括性术语,涵盖了各种尝试在弱监督信息下构建预测模型的研究。本文将对以上三种弱监督学习类型进行介绍,但值得一提的是,在真实场景下,这三种类型的弱监督信息往往同时存在。为了简化,本文仅考虑二分类任务。三种类型的弱监督学习示意图如图1所示。

图1 三种类型的弱监督学习示意图

Incomplete Supervision / 不完全监督

  不完全监督涉及只有小部分训练数据有标签,其余大部分数据无标签的场景。解决不完全监督学习问题的两种主要技术分别是主动学习和半监督学习。主动学习假设有人类专家,可以咨询专家来获得无标签样本的真实标签。半监督学习尝试在没有人工干预的情况下,自动利用有标记数据和无标记数据来提高学习性能。有一类特殊的半监督学习叫直推式学习,它与纯半监督学习的区别在于它们对测试数据的假设不同,即用训练好的模型预测的数据不同。直推式学习有一个“封闭世界”假设,即预先给定测试数据,目标是优化在测试数据上的性能,换言之,无标签的数据就是测试数据;纯半监督学习持有“开放世界”假设,即测试数据是未知的,且无标签数据不一定是测试数据。图2展示了主动学习、纯半监督学习和直推式学习的概念示意图。

图2 主动学习、纯半监督学习和直推式学习的概念示意图

有人类干预

  在主动学习中,为了简化,假设数据标注成本只取决于要标注的样本的数量,因此,主动学习的目标可以定义为最小化需要标注的样本的数量从而使得训练一个好模型的标注成本最小。
  给定一小部分有标签的样本和大量无标签的样本,主动学习尝试选择最有价值的无标签样本提交给专家进行标注。一般有类样本选择标准:信息性标准和代表性标准。信息性测度一个无标签样本能够在多大程度上减少统计模型的不确定性;代表性衡量的是一个样本能够在多大程度上代表输入数据的结构。不确定性采样和委员会选择是两种典型的基于信息性标准的样本选择方法,基于代表性标准的样本选择方法一般是使用聚类算法探索无标签样本的类簇结构。基于信息性标准的样本选择方法的主要缺点是它们严重依赖于有标签样本构建初始的无标签样本选择模型,且该方法在只有少量有标签样本可用时性能通常不稳定;基于代表性标准的样本选择方法的主要缺点是其性能严重依赖于以无标签样本为主的数据的聚类结果。因此,最近关于主动学习的研究尝试同时利用样本的信息性和代表性。

无人类干预

  尽管无标签样本不携带显式的标签信息,但是它们隐式地传达了一些关于数据分布的信息,这些信息能够有助于构建模型。在半监督学习中有两类基本假设:聚类假设和流形假设,这两个假设都是关于数据分布的,前者假设数据具有固定的集群结构,落入同一集群的样本具有相同的类标签;后者假设数据位于一个流形上,因此临近的样本具有类似的预测结果。这两个假设的立足点在于相似的样本点应当具有相似的输出,无标签样本有助于揭示哪些样本是相似的。当前有四种半监督学习方法:基于生成的方法、基于图的方法、基于低密度隔离的方法和基于不一致性的方法。

  • 基于生成的方法:假设所有的有标签、无标签样本都是从同一个分布生成的,可以认为缺失了部分标签,可以用EM算法估计;
  • 基于图的方法:将样本作为点、样本之间的关系作为边,标签根据某种规则在图上传播;
  • 基于低密度隔离的方法:分类边界位于样本空间中较为稀疏的区域;
  • 基于不一致性的方法:多个学习器合作利用未标注数据。

Inexact Supervision / 不确切监督

  不确切监督对应标签粒度较粗且与待解决任务不完全一致的场景,关键在于如何使标签为目标任务提供监督信息。如今,不确切监督一般指多实例学习:训练数据中没有每一个实例的标签,只知道一组样本的标签,认为是预测一组新的实例的标签。多实例学习被成功应用到图片分类/检索/标注、文本分类等多个领域中。

Inaccurate Supervision / 不准确监督

  图3为不准确监督的解决思路示意图。

图3 不准确学习的概念示意图

Conclusion / 结论

  弱监督学习正变得越来越重要

论文阅读笔记:A brief introduction to weakly supervised learning相关推荐

  1. A brief introduction to weakly supervised learning(简要介绍弱监督学习)

    文章转载自http://www.cnblogs.com/ariel-dreamland/p/8566348.html A brief introduction to weakly supervised ...

  2. 关于弱监督学习的详细介绍——A Brief Introduction to Weakly Supervised Learning

    目录 介绍 主动学习 半监督学习 多实例学习 带噪学习 Snorkel 框架介绍 参考 介绍 在机器学习领域,学习任务可大致划分为两类,一种是监督学习,另一种是非监督学习.通常,两者都需要从包含大量训 ...

  3. 【论文阅读】Online Attention Accumulation for Weakly Supervised Semantic Segmentation

    一篇弱监督分割领域的论文,其会议版本为: (ICCV2019)Integral Object Mining via Online Attention Accumulation 论文标题: Online ...

  4. 【论文阅读笔记】FLAME: Taming Backdoors in Federated Learning

    个人阅读笔记,若有错误欢迎指正 会议: USENIX Security Symposium 2022  论文地址:[2101.02281] FLAME: Taming Backdoors in Fed ...

  5. 论文阅读:Attention-based Dropout Layer for Weakly Supervised Object Localization

    Attention-based Dropout Layer for Weakly Supervised Object Localization 作者贡献 ADL: Attention-based Dr ...

  6. 论文阅读笔记(1):Multi-Task Feature Learning for Knowledge Graph Enhanced Recommendation

    Multi-Task Feature Learning for Knowledge Graph Enhanced Recommendation 原文链接:https://arxiv.org/pdf/1 ...

  7. 【论文阅读--WSOL】Spatial-Aware Token for Weakly Supervised Object Localization

    文章目录 方法 实验 Limitation 论文:https://arxiv.org/abs/2303.10438 代码:https://github.com/wpy1999/SAT/blob/mai ...

  8. 论文阅读笔记(二)【ACL2021】知识抽取NER

    学习内容 由于刚刚进入知识图谱领域,对该领域的研究热点不是很了解,所以本文直接翻译ACL2021中关于知识抽取NER中各个论文的摘要和共享: 并且适时在最后写出自己的理解: 同时自己也会在了解完全部后 ...

  9. 弱监督学习 weakly supervised learning 笔记

    周志华 A Brief Introduction to Weakly Supervised Learning 2018 引言 在机器学习领域,学习任务可以划分为监督学习.非监督学习.通常,两者都需要从 ...

  10. DnCNN论文阅读笔记【MATLAB】

    DnCNN论文阅读笔记 论文信息: 论文代码:https://github.com/cszn/DnCNN Abstract 提出网络:DnCNNs 关键技术: Residual learning an ...

最新文章

  1. 招募 | 《大数据实践课》课程实践企业合作项目
  2. sqlserver 类似oracle的rownum功能: row_number
  3. Primality Test 素数,打表
  4. 解决方案仅用于执行startup.bat启动时乱码解决
  5. websocket + node.js聊天系统
  6. redis 类型、方法
  7. iOS10 Safari不识别viewport禁用缩放的暴力解决方案
  8. 网址URL特殊字符编码
  9. iOS 代码命名规范 及Android 代码命名规范(1)iOS
  10. atlas 力矩计算_Atlas 2.1.0 实践(2)—— 安装Atlas
  11. 【3D相册】零基础完成3D相册并配上背景音乐
  12. 红番茄(VS2017)两个注意点
  13. 基于单片机的红外检测及语音响应系统
  14. 动图gif怎么制作?制作方法你学会了吗?
  15. Centos下查看和修改网卡Mac地址
  16. 创建个人网站(一) 如何申请一个网站
  17. Jib使用小结(Maven插件版)
  18. Python之ffmpeg:利用python编程基于ffmpeg将m4a格式音频文件转为mp3格式文件
  19. oracle中创建复合索引方法
  20. 素数个数求解与素数的判定

热门文章

  1. 大数据是什么?与云计算有什么关系?
  2. uploadify onSelect
  3. ourdev 学习arm先看看,工具和软件分析
  4. 两阶段最小二乘法原理_什么是两阶段最小二乘法(2sls)?
  5. Java——自定义图片和居中
  6. Mybatis事务原理
  7. matlab textscan读结构化.txt文件
  8. git 内网搭建_Gitlab搭建内网服务器
  9. Markdown基础语法详细版
  10. 南大计算机软件所,2020考研南京大学计算机软件研究所推免夏令营通知_南大软件所20推免_聚创南大考研网...