来自韩国Kakao公司的研究人员,在论文 GroupFace: Learning Latent Groups and Constructing Group-based Representations for Face Recognition 提出一种新的概念:人脸的组感知表示,通过在网络中学习人脸的隐藏组表示,并与实例级人脸表示结合,实现了更高精度的人脸识别。

在人脸识别常用的 9 大数据集(LFW, YTF, CALFW, CPLFW,CFP, AgeDB-30, MegaFace, IJB-B, IJB-C)上,该算法表现出了一致性的精度提高,虽然代码没开源,结果非常吸引人。

什么是组(Group)?组表示?

作者文中所指的组,可以认为就是一类含有特定可见或非可见特征的人脸,也可认为就是聚类的类别,比如有胡须的人组成的组,有眼镜的人组成的组。

组表示,意指一张特定图片在经过各个组的网络后都有对应的特征向量,根据此图片归属于某一组的概率,将所有特征向量加权生成的特征向量。

作者认为如果在训练的时候能够给出每张图片所属组(或者说类别)的标签,训练得到的特征天然的具有缩小人脸搜索范围的性质,使人脸识别更精准。

但现实情况是并不会有足够的人脸分组标签,所以作者希望在训练中自发式聚类,以实现自动化的提取组表示。

下图为 GroupFace 示例:

直接从Robert Downey人脸提取的特征,作者称之为实例级特征。而相应的网络自动将其分到“棕胡子”人脸组,实例级和组表示特征共同构建最终的特征。

网络架构

如果使用组表示能够改进人脸识别这样的假设有道理,那问题的难点就是如何实现样本自动分组?

请看 GroupFace 的网络结构(点击查看大图):

人脸图像经过骨干网生成4096维特征向量,其继续经过多个全连接层形成实例级表示(Instance-based Representation)和多个组感知的表示(Group-aware Representations)。

从实例级表示后引出组决策网络(Group Decision Network),其内部通过多层感知机+全连接层+Softmax生成样本属于某个组的概率(Group Probability ),不同组的表示和相应的概率加权即形成了加权组表示(这一步也可以使用最大概率的组感知表示来直接替代,但作者发现组表示加权更好),其再与实例级表示结合生成最终的人脸表示。

流程如此,但关键是训练时组决策网络(Group Decision Network)如何自发的对样本生成不同组的概率。这个过程其实是网络在聚类(把样本归到某一类),作者基于一种简单的假设,即认为当有大量样本时,样本应该总体呈均匀分布,所以每个类的样本个数应该尽量平衡。

所以作者使用期望归一化(Expectation-Normalized Probability)技术对softmax后得到的大量样本的组概率进一步处理,使得各个类别尽量样本平衡。

期望归一化示例如下:

事实上,作者使用了 8 卡同步训练,每卡mini-batch大小为128,而概率期望归一化时不仅考虑当前的8x128个样本,还考虑前32到128个batch的样本,所以每次归一化最小样本数8x128x32 = 32768个样本,这的确够大了。

其实透过上面的分析可知,使用作者的方法很难学到作者假设的那种语义分组,但在实验中发现,网络自动分组对人脸识别来说仍然有好处的。

实验结果

除了使用GroupFace网络结构,作者还使用arcface loss损失函数,在 9 个常用的1:1人脸验证和1:N人脸识别数据集中的实验,均得到了显著的精度提升。

可见,组感知特征表示的确是有效的。

比较有意思的是,作者把网络自动分组的部分结果可视化了,请看下图:

可见,很难总结出每一组对应的人脸属于一个特定的语义,Group 1 看起来大部分是右侧脸,Group 29 则看起来是笑的人脸。Group 5 可能代表男性组,因为作者随机选择其100个样本中95个是男性,Group 20 可能代表秃头男性,因为作者随机选择100个样本中94个是秃头男性。(没想到秃头男性在机器眼中也如此显眼

结论

作者提出使用组感知表示的概念是不错的方向,实验证明了其设计的算法也的确有效,但其中最重要的问题是如何自发给样本分组,还有没有更好的给样本分组的方法?这就是非常值得进一步研究的了。

虽然作者称GroupFace是一种人脸识别专用算法,但其实这种思想在所有表示学习、度量学习领域都值得尝试,比如ReID。

论文地址:

https://arxiv.org/pdf/2005.10497.pdf

(目前还未发现有开源代码)

END

备注:人脸

人脸技术交流群

人脸检测、识别、对齐、重建、表情识别、表情迁移等技术,

若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到  

重磅!GroupFace 人脸识别,刷新 9 个数据集SOTA相关推荐

  1. 人脸识别:insightface自定义数据集制作 | 附练手数据集

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 转自|小白玩转python 01 人脸识别简介 简单来讲,人脸识别 ...

  2. 【人脸识别】基于笑脸数据集Genki4k实现笑脸识别

    目录 一.数据集准备 二.基于卷积神经网络训练模型 1. 构建模型 2. 图像数据预处理 3. 训练 4. 绘制模型的损失图和准确性图像 5. 使用该模型进行微笑识别 三.使用OpenCV自带的微笑识 ...

  3. python3 tensorflow 人脸识别_tensorflow人脸识别(自己的数据集)

    可以在云盘下载打包文件包括API,数据 把原有的文件夹下面的object_detection删掉,这里面的(__init____.py)文件百度云盘上传不了,全都没成功,所以在把文件下来之后objec ...

  4. 南京大学发布WebCaricature漫画人脸识别数据集

    近日,南京大学推理与学习研究组(R&L Group)发布了一个新的漫画人脸识别数据集 WebCaricature.该数据集包含了 252 个名人的 6042 幅漫画图像以及 5974 幅人脸图 ...

  5. IBM发布人脸识别最强工具,多样性数据集,100万张人脸图像!

    https://www.toutiao.com/a6652185404856336908/ 2019-01-30 15:16:49 为了改善既有AI人脸识别存在的偏见问题,IBM发布脸部多样性数据集D ...

  6. 无约束低分辨率人脸识别综述一:用于低分辨率人脸识别的数据集

    目前,监控场景下的极低分辨率人脸识别是一个非常小的研究领域,可用的数据集非常有限.其中SCface.Point and Shot.IJB-S.UCCSface.QMUL Survface和QMUL T ...

  7. 标识别,人脸识别等常用数据集

    参考博客: https://www.cnblogs.com/weiyinfu/p/8016405.html#32 常用数据集 一.Cifar数据集 Hinton参与收集 彩色图像(RGB) 图像尺寸相 ...

  8. 人脸识别数据集整理以及下载

    人脸识别数据集整理 下方是整理的人脸识别数据集列表,有需要的小伙伴下载获取,仅限学习交流,不能用作他处,感谢理解. 下载链接:https://download.csdn.net/download/m0 ...

  9. 上交AI研究院副院长马利庄:基于大数据的人脸识别技术进展与展望

    文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 转自 | 中国人工智能学会 本篇大家整理的是来自上海交通大学人工智能研究院副院长.华东师范大学特聘教授 ...

最新文章

  1. r语言remarkdown展示图_使用R语言包circlize可视化展示blast双序列比对结果
  2. Android strings.xml中定义字符串显示空格
  3. python开发工具管理系统_Python开发桌面软件文档及网址管理工具,强迫症的福音...
  4. PHP令人困惑的strtotime
  5. opencv打开双目,采集标定双目的图片
  6. Mac Book Pro Catalina不能打开软件,提示检查为恶意软件
  7. Revit导入CAD翻模丨CAD图层管理控制显示隐藏图层
  8. GooFlow入门级使用
  9. LeaRun快速开发平台:企业供应链管理系统解决方案
  10. unity 导入STL格式模型(STL二进制格式文件)
  11. 利用矩阵的逆(伪逆)与除法求解
  12. C语言中变长数组的陷阱
  13. harmonyos2.0手机,华为HarmonyOS 2.0将于6月2日发布,华为手机可一键升级
  14. python一元线性回归算法,代码及参数更新动图展示
  15. canvas教程1-canvas的基本使用
  16. 2022江苏最新八大员之(安全员)模拟考试试题及答案
  17. iOS开发实战之手机号、座机号正则验证
  18. html转pdf页面缩小,缩小HTML页面并转换为A4尺寸pdf
  19. 机器学习中的特征空间
  20. 如何在中国更容易走向成功,成为二八定律中的二?

热门文章

  1. css 对话框阴影,科技常识:css实现不规则图形的阴影(如对话框)
  2. .net core 调用c dll_C++ 调用C封装DLL库的两种方式
  3. sysctl mysql_Sysctl
  4. 四核处理器_2020年高通骁龙处理器排行榜
  5. php获取sessionstorage,关于PHP session 存储方式的详细介绍
  6. linux 文件查找_Linux文件查找
  7. python图形化编程实例,python交互式图形编程实例(三)
  8. 学mysql需要学python吗_python 学习 第六篇 mysql
  9. ansible免密登录和账号登录方式
  10. 两个空间点直接距离投影公式_HBAO(屏幕空间的环境光遮蔽)