Center Invariant Loss
- 《Deep Face Recognition with Center Invariant Loss》
2017,Yue Wu et al. Center Invariant Loss
引言:
在大多数人脸数据集中,大部分人脸图像很少,只有少数人经常出现更多的面部图像。人脸图像越多,对特征学习的影响就越大。这种不均衡的分布导致很难训练一个CNN模型来表示每个人的特征,而不是主要针对拥有大量人脸图像的人。
为了解决这一挑战,我们提出了一个center invariant loss,它使每个人的中心对齐,以强制学习到的特征具有针对所有人的一般表示。center invariant loss惩罚每个类中心之间的差异。利用center invariant loss,我们可以训练一个鲁棒的CNN,它平等地对待每个类,而不管类样本的数量如何。大量实验证明了该方法的有效性。并在LFW和YTF数据集上取得了最先进的结果。
下图为:训练数据的长尾分布(long-tail):
(a)为CASIA-WebFace数据的分布情况
(b)在训练数据较为平衡的情况下,分类器学习的决策边界
©在训练数据不平衡的情况下,分类器学习的决策边界
中心不变损失:惩罚每个类中心的L2范数和所有中心的平均L2范数之间的差。
本文的主要贡献:
1.本文提出了一种新的损失函数,即中心不变损失函数(center invariant loss),通过惩罚大类与小类之间的差异来提高深层学习特征的泛化能力。
2.我们验证中心不变性损失可以帮助深度学习的特征在训练数据极不平衡的情况下对所有类别均等地分离特征空间,提高分类性能。
3.我们的结果表明,用CASIAWebFace训练的单个模型达到最新的性能,LFW达到99.12%,YTF达到93.88%。
Imbalanced Data Phenomenon:
首先证明了训练样本多的类别,Softmax训练后特征区域会更大,这就是训练集类别不均衡导致的分类倾向问题。
center invariant loss:
式中,m代表类别数;k表示第k个类别(1⩽k⩽m1\leqslant k\leqslant m1⩽k⩽m),nkn_{k}nk代表样本数;xix_{i}xi表示第i类的特征。
则,第k类的特征中心为ckc_{k}ck:
标签为y的第i个样本的Center invariant loss为:
这个公式惩罚了每个类中心之间的差异。中心在特征空间中的不同位置分布。中心不变损失的目的是使这些中心具有相同的欧氏范数。
中心不变损失的2D图解:
Softmax loss和center invariant loss的联合表示为:
softmax loss产生鉴别特征,center invariant loss迫使特征空间统一分离,具有良好的泛化能力。
Center Loss和center invariant loss的联合表示为:
除了Center loss每个类都拉向类别中心,额外约束每个类的类别中心都拉向一个固定半径的超球上,这个半径是所有类别中心的模均值,减轻类别不均衡带来的特征区域差异。
实验结果:
1.在MNIST数据集
Center Invariant Loss训练后的特征分布情况:
减轻类别不均衡带来的特征区域差异
2.在LFW 和YTF 数据集
baseline A :仅使用softmax loss
baseline B :使用softmax loss+center loss 联合约束
总结:
本文首先证明了训练样本多的类别,Softmax训练后特征区域会更大,这就是训练集类别不均衡导致的分类倾向问题,并提出了Center invariant loss,来联合Softmax + Center loss一起使用,减轻类别不均衡带来的特征区域差异。
注:博众家之所长,集群英之荟萃。
Center Invariant Loss相关推荐
- face recognition[翻译][深度人脸识别:综述]
这里翻译下<Deep face recognition: a survey v4>. 1 引言 由于它的非侵入性和自然特征,人脸识别已经成为身份识别中重要的生物认证技术,也已经应用到许多领 ...
- Unified Batch All Triplet Loss for Visible-Infrared Person Re-identification
论文:https://arxiv.org/pdf/2103.04607.pdf 问题 对于跨膜态难样本三元组损失, 在一批中选择P个身份ID,对每个ID随机选择K张可见图像和K张红外图像.这样的采样策 ...
- 【庖丁解牛】从零实现FCOS(二):ground truth分配与loss计算
文章目录 Anchor free?Anchor base? FCOS的ground truth分配 loss计算 完整loss代码 所有代码已上传到本人github repository:https: ...
- 【损失函数】Keras Loss Function
文章目录 Referance SNR (Signal-to-Noise Ratio) Si-SNR (Scale invariant Signal-to-Noise Ratio) PIT (Permu ...
- 2020年 ICLR 国际会议最终接受论文(poster-paper)列表(一)
来源:AINLPer微信公众号(点击了解一下吧) 编辑: ShuYini 校稿: ShuYini 时间: 2020-01-22 2020年的ICLR会议将于今年的4月26日-4月30日在Mil ...
- CVPR 2021 | 中科大联合快手,提出人脸伪造检测新方法
视学算法发布 机器之心编辑部 来自中科大.快手的研究者针对人脸伪造,提出了基于单中心损失监督的频率感知鉴别特征学习框架,将度量学习和自适应频率特征学习应用于人脸伪造检测,实现SOTA性能. 一:背景和 ...
- Pytorch中图像预处理相关函数
这篇分类总结比较完整 数据处理是模型训练之前的必备的一步,在Pytorch的TORCHVISION.TRANSFORMS.TRANSFORMS包含下面一下图像处理的函数(transform中的函数主要 ...
- [paper reading] CenterNet (Triplets)
[paper reading] CenterNet (Triplets) GitHub:Notes of Classic Detection Papers 2020.11.09更新:更新了Use Yo ...
- TransCenter: Transformers with Dense Queries for Multiple-Object Tracking
TransCenter: Transformers with Dense Queries for Multiple-Object Tracking 近期几篇利用transformer进行多目标跟踪的论 ...
最新文章
- IOS问题汇总:2012-12-18 UIAlertView+UIActionSheet
- 实操教程|详细记录solov2的ncnn实现和优化
- 编译包含Google Play服务App的SDK版本问题
- Redis安装配置和介绍
- 一颗强健的“心脏”,让海银的业务系统更高效、更安全!
- SAP Fiori Launchpad tile instance creation
- 关键词热度分析工具_谷歌SEO推广排名的关键要素(一)利用谷歌关键词分析工具分析关键词...
- (二)Python 装饰器
- 32、多租户(multi-tenancy)
- R语言---Ubuntu中R语言更新至R4.2.1和R包devtools下载
- 【最优化方法】K-Means聚类实验:Python实现手写数字图像MNIST分类
- Git!从零开始用连接远程仓库!![全平台]
- TIA博途中如何使用符号方式按位,字节,字访问非结构数据类型
- 【Python】批量修改照片文件名为拍摄日期
- 一键创建多个文件夹?快速批量建立文件夹并命名?
- SAS学习8、9(方差分析、anova过程、相关分析和回归分析、corr过程、reg过程、多元线性回归、stepwise)
- linux常用的指令
- 优质软件、网站等推荐(持续更新)
- PDF 原理及 Python 调用
- Android学习笔记 75. 单元测试
热门文章
- c语言指针与数组的深入理解
- Missing required prop: “value” 报错的解决办法
- 中学生怎样才能合理使用计算机,运用计算机技术提高中学生学习效率的精编.doc...
- 【python+SQLAlchemy】
- oracle dbsat数据库安全评估工具的使用
- android 爬虫 协议分析,安卓逆向:分析抖音登录协议
- 《期权、期货及其他衍生产品》读书笔记(第一章:导论)
- vostro3070装win7_戴尔Vostro 成就3070台式机怎么装win10系统?
- 怎么用计算机玩超级玛丽,玩家在《超级马里奥制造2》里做出了计算器 计算过程太神奇...
- 使用 Detectron2 中的 mask-RCNN 检测建筑物轮廓