点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入!

当训练数据集有标签噪声时,我们通常用噪声转移矩阵来刻画一个训练数据点被错误标注的概率。准确地估计该矩阵对于带噪学习具有重要意义。传统的估计方法大多依赖于模型的预测值,从而找到一些模型能够以高置信度预测的样本,进而估计噪声转移矩阵。然而,寻找足够多的符合条件的样本是一件困难的事情。为了摆脱对模型预测的依赖,我们从表征(representation) 的角度出发,提出了一种基于表征的噪声转移矩阵估计方法。该方法的基本思想是:具有相似表征的数据点应该属于同一类别,即相同真实标签。标签噪声的存在使得我们观测到的相似表征的噪声标签可能不一致,而标签的一致性蕴含了噪声转移矩阵的信息。我们证明:仅比较至多三个相似表征的标签一致性就可以得到噪声转移矩阵的唯一真实解。该方法为噪声转移矩阵的估计提供了一个全新的视角,并有潜力与自监督等表征学习方法相结合。

本期AI TIME PhD直播间我们邀请到加州大学圣克鲁兹分校博士生——朱兆伟,为我们带来报告分享《基于表征的噪声转移矩阵估计方法》。

朱兆伟:

加州大学圣克鲁兹分校博士三年级学生。研究兴趣集中在弱监督学习、机器学习公平性、联邦学习等领域相关的理论及应用,比如,训练标签带有人为标注噪声时如何设计损失函数去抵消噪声影响,如何处理联邦学习中低质量、有系统误差的本地训练集。目前在ICML,ICLR,NeurIPS,ACM Sigmetrics,CVPR等会议,IEEE TWC,IEEE TPDS等期刊上发表多篇一作论文。

01

 背  景 

(1) 什么是噪声转移矩阵?

在深度学习的模型训练中,我们使用的数据集理想情况下它的标签是完全正确的,但是实际情况下,特别是人工标注过程中无法保证百分百准确性,因此很多情况下,实际的数据集标注是带噪的。

根据下图具体介绍一下噪声转移矩阵,噪声转移矩阵可以用来刻画噪声的性质,下图中矩阵中的元素描述了由干净标签i转移到噪声标签j的概率。下图展示了5张来源于CIFAR-10数据集的猫的样例图片以及人为标注的标签,第一张图被错误标注为了狗,第五张被错误标注为了船,这就是标签噪声。假设猫的标签是1,狗的标签是2,船的标签是3,就表示真实标签为猫并且被标记为猫的概率,5张图中3张被标记为猫,因此T11=0.6。

(2) 如何估计噪声转移矩阵

噪声转移矩阵可以帮助我们学习到对噪声有抵抗能力的分类器,然而目前的工作都局限于下面这个通用的流程。

首先利用一个神经网络拟合数据分布,然后我们的模型就可以进行类别预测,根据模型预测的类别概率,利用某些方法就可以得到噪声转移矩阵。

鉴于上面比较局限的噪声转移矩阵估计流程,我们想要不训练神经网络,直接估计噪声转移矩阵T。

02

 方  法 

本文提出了High-Order Consensuses (HOC)方法来实现估计噪声转移矩阵。

假如我们有Y1,Y2,Y3三个噪声标签,根据全概率公式,将它们与噪声转移矩阵以及干净标签概率Y之间的关系表示如下:其中Y1,Y2,Y3三个噪声标签需要对应相同的干净标签,即在同一个标签空间下,Y1,Y2,Y3属于同一个类别。

我们知道在CIFAR-10数据集中,每张图片值对应一个标签,那如何获得这些高阶的数据量呢?有一个思路是具有相似特征的图片其标注标签相同。根据数据集中标注的噪声标签,我们就可以获得Y1,Y2,Y3等高阶数据样本。

以2-NN label clusterability为例,随机选取一个样本点以及它的两个最邻近的样本点作为一个类,我们要求这三个样本点的标注标签是一样的。

我们使用KNN label clusterability方法(文中Definition 1)来获取每个表征的相似表征,除了2-NN之外,我们还可以获取3个、4个等等最相近的样本点,但是获取的难度会增加,我们通过实验发现2-NN已经足够了(如下表)。我们使用clean CIFAR-10、clean CIFAR-100来训练一个模型,比如resnet,采用最后一层卷积层作为特征提取层,使用2-NN进行相似表征匹配。

此外,需要注意的是,在进行最近邻选择相似表征时,局部的簇群标签虽然都是猫,但这些局部簇群可能离得比较远,因为猫的种类不同,其图片表征也不同。

我们利用2-NN label clusterability将最邻近的三个表征归属为同一个标签类,这个条件可以帮助我们选取合适的噪声标签Y1,Y2,Y3,这些标签可以帮助我们列出最初提到的那些方程。我们的做法就是判断每个元组中噪声标签是否一致,比如对于每个pattern中某个标签出现的次数。下图中左边的绿圈是一个二阶的consensus pattern,橙色圆圈是噪声标签1,蓝色方块是噪声标签2,同样地,我们还有可能观测到两个方块,两个圆圈这样的二阶pattern。通过统计这些pattern在数据集上出现的频率就可以得到一些估计值。

现在我们以一般形式给出了K类分类问题中估计噪声转移矩阵T和干净标签预测概率p的一致性方程组如下,我们将这些公式代码实现为一个Solver,在本文项目的github中可以直接调用。如果与本文的表征类似,那就可以将噪声转移矩阵估计出来。

下面我们通过一个一阶的例子来说明如何计算干净标签的概率p。噪声转移矩阵T在右上角已经标出,猫的标签是1,狗的标签是2。e1表示真实标签是猫,但被标记为狗的概率。e2表示真实标签是狗但被标记为猫的概率。所以观测到一只猫的概率就是真实标签是猫的概率p乘上真实是猫标记为猫的概率(1-e1)与真实标签不是猫的概率(1-p)乘上真实是狗标记为猫的概率e2之和。

03

 实  验 

(1) 噪声转移矩阵估计实验

我们与T-Revision方法在CIFAR-10上进行了对比,本文的HOC方法的估计误差较小,表现优秀。更重要的是,T-Revision需要训练一个神经网络,但是本文方法可以直接使用,因此本文方法更容易与其他方法结合使用。

(2) 分类准确性实验

除了Clothing1M数据集之外,我们自己收集了human-level的关于CIFAR-10的噪声标签(详见http://noisylabels.com/),因此实验更能贴近真实情况。

在这两个数据集上,本文方法都可以达到最优的性能。

论文链接:https://arxiv.org/pdf/2102.05291v1.pdf

项目代码:https://github.com/UCSC-REAL

CIFAR-10/100噪声标签(最新版):http://noisylabels.com/

点击“阅读原文”,即可观看本场回放

整理:爱 国

审核:朱兆伟

AI TIME欢迎AI领域学者投稿,期待大家剖析学科历史发展和前沿技术。针对热门话题,我们将邀请专家一起论道。同时,我们也长期招募优质的撰稿人,顶级的平台需要顶级的你!

请将简历等信息发至min.gao@aminer.cn!

微信联系:AITIME_HY

AI TIME是清华大学计算机系一群关注人工智能发展,并有思想情怀的青年学者们创办的圈子,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索,加强思想碰撞,打造一个知识分享的聚集地。

更多资讯请扫码关注

我知道你在看

点击“阅读原文”查看精彩回放

干货!基于表征的噪声转移矩阵估计方法相关推荐

  1. 论文精读-基于双目图像的视差估计方法研究以及实现

    基于双目图像的视差估计方法研究及实现 第一章 绪论 1.1 课题的研究背景与意义 1.2 双目视差估计的研究现状 1.2.1 传统立体匹配方法研究现状 1.2.2 统计学习方法研究现状 1.2.3 深 ...

  2. 基于图像的摄像机姿态估计方法评析

    作者丨黄浴@知乎 来源丨https://zhuanlan.zhihu.com/p/467776433 编辑丨3D视觉工坊 arXiv在2022年1月15日上传论文"A Critical An ...

  3. 基于训练符号的频偏估计方法 (SC-FDE/OFDM)

    1.设置归一化频偏 时域(使用l两段完全一样的chu序列,这里设置每一段长度为1024),基带传输 x(k)=x(k+N),k=1,2,...,1024x(k )=x(k+N),k=1,2,...,1 ...

  4. 基于深度学习的位姿估计方法

    A Multi-task Learning Convolutional Neural Network for Object Pose Estimation (Proceeding of the IEE ...

  5. 一种高效的基于邻域空间聚合的点云语义分割不确定性估计方法(ICRA2021)

    Neighborhood Spatial Aggregation based Efficient Uncertainty Estimation for Point Cloud Semantic Seg ...

  6. 蒙特卡洛梯度估计方法(MCGE)简述

    动机 机器学习中最常见的优化算法是基于梯度的优化方法,当目标函数是一个类似如下结构的随机函数 F(θ) 时: 优化该类目标函数,最核心的计算问题是对随机函数 F(θ) 的梯度进行估计,即: 随机函数梯 ...

  7. 深度学习和目标检测系列教程 22-300:关于人体姿态常见的估计方法

    @Author:Runsen 姿态估计是计算机视觉中的一项流行任务,比如真实的场景如何进行人体跌倒检测,如何对手语进行交流. 作为人工智能(AI)的一个领域,计算机视觉使机器能够以模仿人类视觉为目的来 ...

  8. AdaFit:一种对基于学习的点云法线估计方法的新思考(ICCV2021)

    AdaFit: Rethinking Learning-based Normal Estimation on Point Clouds (2021-ICCV) 代码地址:https://github. ...

  9. CVPR 2021 | 国防科大:基于几何稳定性分析的物体位姿估计方法

    作者|机器之心编辑部 来源|机器之心 物体 6D 姿态估计是机器人抓取.虚拟现实等任务中的核心研究问题.近些年来,随着深度学习技术和图像卷积神经网络的快速发展,在提取物体的几何特征方面出现了许多需要改 ...

最新文章

  1. [微信小程序]this.setData , that.setData , this.data.val三者之间的区别和作用
  2. pandas groupby
  3. spring boot 不连接数据库启动
  4. 三维重建缺数据集?来看看Facebook最新发布的CO3D
  5. GT Transceiver的复位与初始化(4)RX初始化和复位流程
  6. 北京市计算机专修学院,北京计算机专修学院:三大热门专业
  7. java ee8 mvc1_JavaEE——SpringMVC(1)--@RequestMapping
  8. 多语言 获取当前语言
  9. oracle 索引 序列,【Oracle】表、视图、序列、索引
  10. GoLand 快速入门教程
  11. 深入浅出讲解LDA主题模型(一)
  12. 5种方法,加密你的Python代码 !
  13. 实数系的基本定理_11、实数的连续性(1)
  14. 尝鲜体验win11,附赠win11镜像下载地址
  15. 如何在工作中提升自己
  16. python播放mp3文件
  17. 1210: OY问题 [搜索]
  18. 关于手机的挑选的精品帖子
  19. 物联网技术与应用【第一章测验答案】
  20. 一文了解27市5G建设最新进展与规划

热门文章

  1. 计算机如何锁定桌面壁纸,误操作怎么办?壁纸锁定的4种方法来了
  2. 微信小程序-贪吃蛇开发8 贪吃蛇绘制
  3. Win11系统无法创建pin密码的解决方法教学
  4. VISA (传款易 paydollar ) 支付
  5. 辐射能量降低裂变效应工程第二期
  6. 用时两周微信小程序电商小程序
  7. 职场里如何做好自我介绍?这5大回复方式很有用
  8. 魔百盒配置服务器信息,中国移动魔百盒网络连接图文教程
  9. 永磁同步电机 SVPWM 原理
  10. 什么是误差图?今天带你了解可视化误差图,让数据一目了然