论文链接:Additive Margin Softmax for Face Verification
-------------------------------------------------------------------
2019.1.24:注:腾讯AI Lab的 CosFace: Large Margin Cosine Loss for Deep Face Recognition和本文算法基本一致,工作也几乎是同时完成,两篇论文也都各自中了不同的会议。
-------------------------------------------------------------------

AMSoftmax

Softmax

ASoftmax


这是在SphereFace中提出来的损失函数

AMSoftmax
这就是本文新提出的损失函数了。其变化就在于修改了Cos(mθ)为一个新函数:

与ASoftmax中定的的类似,可以达到减小对应标签项的概率,增大损失的效果,因此对同一类的聚合更有帮助

然后根据Normface,对f进行归一化,乘上缩放系数s,最终的损失函数变为:

这样做的好处在于ASoftmax的倍角计算是要通过倍角公式,反向传播时不方便求导,而只减m反向传播时导数不用变化

角度距离与余弦距离

作者认为,Asoftmax是用m乘以θ,而AMSoftmax是用cosθ减去m,这是两者的最大不同之处:一个是角度距离,一个是余弦距离

使用传统的Softmax的时候,角度距离和余弦距离是等价的,即

但是当我们试图要推动决策边界的时候,角度距离和余弦距离就有所不同了。

最终的决策边界是和余弦相关的,根据cos的性质,优化角度距离比优化余弦距离更有效果,因为余弦距离相对更密集

之所以选择cosθ-m而不是cos(θ-m),这是因为我们从网络中得到的是W和f的内积,如果要优化cos(θ-m)那么会涉及到arccos操作,计算量过大。

特征归一化

这里提到了一个归一化特征的重要目的:

高质量的图片提取出来的特征范数大,低质量的图片提取出来的特征范数小,如图:

这是因为Softmax的目标是尽可能最大化正确分类的概率,它会忽略掉一些比较难分辨的图片:也就是低质量的图片,而优先拟合高质量的图片
因此把特征强行归一化会使得低范数的图片变得高范数,也会获得更多的网络的注意力。

(这和tripletloss刻意去挖掘难以识别的图片的最终结果是一样的,方法不一样而已)


这张图说明的是特征归一化之后,原来范数比较小的特征会获得更大的梯度,对应于normface中的求导式:

实验

网络

20层Resnet

参数

We set the weight decay parameter to be 5e.4. The batch size is 256
and the learning rate begins with 0.1 and is divided by 10 at the 16K, 24K and 28K iterations

训练集

CASIA-Webface

验证方式

图片与其镜像图片提取出来的特征对应相加,比较余弦距离

结果

不使用特征归一化,在高质量图片集(LFW)上结果更好

使用特征归一化,在具有很多低质量的图片集(MegaFace)上结果更好。

人脸识别系列(十六):AMSoftmax相关推荐

  1. 人脸识别系列(六):FaceNet

    原文链接:FaceNet:A Unified Embedding for Face Recognition and Clustering 首先可以看一下最终的效果,数字表示两张图片经过Facenet提 ...

  2. 人脸识别系列(七):百度的人脸识别

    原文链接:Targeting Ultimate Accuracy: Face Recognition via Deep Embedding 网络结构: 输入的是对齐好了的人脸图像,将人脸图像通过面部标 ...

  3. 人脸识别系列(十五):COCO Loss

    论文链接:Rethinking Feature Discrimination and Polymerization for Large-scale Recognition 这篇文章其实和NormFac ...

  4. 人脸识别系列(十七):ArcFace/Insight Face

    论文链接:ArcFace: Additive Angular Margin Loss for Deep Face Recognition 作者开源代码:https://github.com/deepi ...

  5. 人脸识别(7)---国内人脸识别技术 十大算法公司排名

    国内人脸识别技术 十大算法公司排名 科技特讯11月18日讯:1.云从科技 背靠"计算机视觉之父",中科院实验室创业团队创立云从科技 云从科技团队成员除了来自中科大的校友外,还来自中 ...

  6. S3C2416裸机开发系列十六_sd卡驱动实现

    S3C2416裸机开发系列十六 sd卡驱动实现 象棋小子    1048272975 SD卡(Secure Digital Memory Card)具有体积小.容量大.数据传输快.可插拔.安全性好等优 ...

  7. 深度学习之视频人脸识别系列一:介绍

    作者 | 东田应子 [导读]本文是深度学习之视频人脸识别系列的第一篇文章,介绍了人脸识别领域的一些基本概念,分析了深度学习在人脸识别的基本流程,并总结了近年来科研领域的研究进展,最后分析了静态数据与视 ...

  8. 深度学习之视频人脸识别系列(一):简介

    阅读时间约4分钟 [介绍]本文是深度学习之视频人脸识别系列的第一篇文章,介绍了人脸识别领域的一些基本概念,分析了深度学习在人脸识别的基本流程,并总结了近年来科研领域的研究进展,最后分析了静态数据与视频 ...

  9. 深度学习之视频人脸识别系列二:人脸检测与对齐

    作者 | 东田应子 [磐创AI导读]本文是深度学习之视频人脸识别系列的第二篇文章,介绍人脸检测与对齐的相关算法.欢迎大家关注我们的公众号:磐创AI. 一.人脸检测与关键点检测 问题描述: 人脸检测解决 ...

  10. 来自极客标签10款最新设计素材-系列十六

    本周我们推荐来自极客标签社区带来的10款免费设计素材,大家可以在这里免费下载你需要的内容.如果你也有更好的作品,欢迎分享到社区中来,在得到帮助的同时,也能与更多人分享来自你的作品. 免费图标:扁平风格 ...

最新文章

  1. Redis附加功能之键过期功能
  2. Excel 下来公式 内容却一样
  3. SpringMVC Spring Mybatis Druid SpringSession集成例子
  4. php:兄弟连之面向对象版图形计算器1
  5. Quartz表达式介绍及简单使用
  6. Oblog4.5跨站漏洞
  7. pr基本图形模板无法使用_Pr基本图形板块教程 Premiere Pro CC Essential Graphics
  8. 【亲测好用】一站式视频录制编辑软件:Filmage Screen mac中文版
  9. Animator is not playing an AnimatorController
  10. redis--客户端
  11. Kubeconfig 切换上下文
  12. 【信息系统项目管理师】第十五章 知识产权与法律法规(考点汇总篇)
  13. python五种基本数据类型_五大Python基础数据类型
  14. 获取CARLA插件SCENARIO RUNNER
  15. 联想LJ2655DN激光打印机清零方法
  16. 数据库设计很棒的参考CDM-PDM-LDM-PowerDesigner
  17. 计算机网络的super super easy 教程 | IP协议 及 arp协议
  18. [论文翻译]Scene text recognition from two-dimensional perspective
  19. 2022-2028年中国扫描电镜行业市场运行格局及发展策略分析报告
  20. linux篇【9】:进程间通信(共享内存)——<后序>

热门文章

  1. 异业联盟的案例分析,引流成功的方案
  2. Excel中方格打对号
  3. 2013腾讯编程马拉松复赛第二场部分题解
  4. java uniqueresult_Hibernate之Query接口的uniqueResult()方法详解
  5. Python中range与xrange的区别
  6. linux中MySQL忘记密码怎么办
  7. (转)为什么八位二进制数表示范围为-128~+127?
  8. matplotlib 绘图颜色自动选择
  9. 阿里巴巴代码规约检测Java 代码规约扫描 | 云效
  10. 收益率曲线matlab,收益率曲线拟合技术解读.ppt