时间: 2014/9/25 17:00 文章:《 Learning Deep Face Representation

还没发表~

人脸的表示,易于实施,叫做Pyramid CNN,采用了greedy-filter-and-down-sample的操作,使得训练非常快,而且高效,并且PyramidCNN可以和多尺度人脸特征结合。97.3%LFW

传统的人脸表示特征方法:

而文章中,作者采用深度神经网络,DCNN来提取特征,其网络结构图:

注意文章的基本的网络结构不是传统上的CNN结构,而是“Siamese”网络【2005 Lecun 组的一篇文章。】,它的特点是它接收两个图片作为输入,而不是一张图片作为输入。

网络的主要特点:它们是由多个金字塔组成,分为不同个level级别的特征,每一个level的网络由两部分组成,一部分是共享的层,它由它的前一个level的网络层组成;另一部分是一个非共享层,在每一层中训练只需要训练非共享层就可以,而共享层是由前一个level的的网络层共享过来,每一个神经网络中,非共享层用来进行数据的预处理,比如卷积下采样等。(由于网络的共享层,使得每一个level的训练速度不会随着网络层数的增多而急剧提高的训练时间,说白了也就是说每次只需要训练网络的最后一层就可以了,前面的层可以保持固定。)

采用金字塔的原因在于:1.加快网络的训练速度;2.可以提取多尺度人脸结构特征;

注意每一个level有多个神经网络,分别对应于每个输入图像的patch。每个网络的训练目标函数都是下面的损失函数;

网络训练的损失函数表示为
 

其表示的意思就是同一个人的距离要相互接近,而非同一个人的表示要相互远离。利用这个损失函数来进行网络的训练。

训练方法:

最终的特征:它由所有的level所有的patch特征级联而成,而patch的选择则依赖于人脸特征点的检测和aligment。最终形成的特征其实是过完全的,也就是说有很多的冗余,但是很多文章都表明这种冗余性对于识别来说具有重要性。应该来说每一个level的所有的patch特征连接起来之后的向量就是一个人脸在这个level的特征了,多个level的特征再连接起来就形成了多尺度的特征表示。

文章还说了,PyramidCNN方法提取的特征可以很稀疏,最少可以在8d,而在这么低纬度的特征下,其识别率还不低。通过相同的维度特征的情况下进行识别率比较:其中LBP特征是通过了PCA降维到相对应的维度。

可以看出,PyramidCNN提取的特征,在维度低的情况下的识别率明显好于LBP,并且随着维度的降低它的识别率也不会像LBP那样子明显的下降。

新的评判标准:因为在LFW数据库上面的识别率已经达到了99%以上了,所以作者他自己提出了一个新的评判标准,在人脸verification中,正确的匹配可能会比错误的匹配少(在安全接入方面,希望falsepositive要尽可能的小,已防止非法进入)。新的评判标准就是在固定一个错误的接受率(false positive rate FPR)阈值下,评判各个算法的性能,如识别率等。

【论文笔记】Learning Deep Face Representation相关推荐

  1. 论文笔记 | Learning Deep Features for Discriminative Localization

    作者 Bolei Zhou, Aditya Khosla, Agata Lapedriza, Aude Oliva, Antonio Torralba Bolei Zhou Abstract 受到NI ...

  2. 论文笔记-DEC (Deep Embedded Clustering)

    论文笔记-DEC (Deep Embedded Clustering) 知识点1.将聚类的度量参考T-SNE中的t-分布,将聚类的度量转换成一个概率值(软分配,qij 表示将样本 i 分配给 j 簇的 ...

  3. T-PAMI-2021论文Semi-Supervised Multi-View Deep Discriminant Representation Learning阅读笔记

    提示:文 0.论文信息 题目:Semi-Supervised Multi-View Deep Discriminant Representation Learning 期刊: IEEE Transac ...

  4. 图像隐写术分析论文笔记:Deep learning for steganalysis via convolutional neural networks

    好久没有写论文笔记了,这里开始一个新任务,即图像的steganalysis任务的深度网络模型.现在是论文阅读阶段,会陆续分享一些相关论文,以及基础知识,以及传统方法的思路,以资借鉴. 这一篇是Medi ...

  5. [人脸活体检测] 论文: Learning Deep Models for Face Anti-Spoofing: Binary or Auxiliary Supervision

    Learning Deep Models for Face Anti-Spoofing: Binary or Auxiliary Supervision 论文简介 与人脸生理相关的rppG信号被研究者 ...

  6. 【论文笔记】DEEP FEATURE SELECTION-AND-FUSION FOR RGB-D SEMANTIC SEGMENTATION

    论文 题目:DEEP FEATURE SELECTION-AND-FUSION FOR RGB-D SEMANTIC SEGMENTATION 收录于:ICME 2021 论文:Deep Featur ...

  7. 论文阅读-Learning Deep CNN Denoiser Prior for Image Restoration

    Zhang K, Zuo W, Gu S, et al. Learning Deep CNN Denoiser Prior for Image Restoration[J]. 2017. 1.引言 图 ...

  8. 论文笔记:Deep Residual Learning

    之前提到,深度神经网络在训练中容易遇到梯度消失/爆炸的问题,这个问题产生的根源详见之前的读书笔记.在 Batch Normalization 中,我们将输入数据由激活函数的收敛区调整到梯度较大的区域, ...

  9. 论文笔记:Deep Learning [nature review by Lecun, Bengio, Hinton]

    如今,机器学习的技术在我们的生活中扮演着越来越重要的角色.从搜索引擎到推荐系统,从图像识别到语音识别.而这些应用都开始逐渐使用一类叫做深度学习(Deep Learning)的技术. 传统机器学习算法的 ...

  10. 论文解读|2020TPAMI|Deep High-Resolution Representation Learning for Visual Recognition

    用于视觉识别的深度高分辨率表征学习 github:https://github.com/HRNet 论文地址:https://arxiv.org/pdf/1908.07919 摘要 高分辨率表示对于位 ...

最新文章

  1. 关于Redis缓存,这3个问题一定要知道!
  2. 求教大牛!关于后缀树
  3. Netty学习笔记(一)
  4. 领域模型命名规约【PO,VO,POJO,BO,DTO,DO,JavaBean】
  5. 你不可不看的 Oracle RAC 日常基本维护命令
  6. java连接sqlserver非默认实例连接字符串设置
  7. 天池NLP文本分类比赛如何轻松轻松获得Top K的秘诀!
  8. 3.7 钱包、帐户、token、智能合约、action、权限、权重和阀值之间关系
  9. 从头开始聊P问题、NP问题与NPC问题
  10. 世界所有国家国际域名英文缩写总结(转)
  11. vue之ele中的table组件(复选框的回显和重置)
  12. MySQL的核心日志
  13. 高校实验室预约系统功能简介及解决方案
  14. androidStudio分包引起的系统崩溃,报错ClassNotFoundException: Didn‘t find class “XXXView“ on path: DexPath../.apk
  15. Dagger2实际应用篇
  16. 民事诉讼和刑事诉讼法知识点整理(1)
  17. php7能用phpexcel吗,PHPExcel 在 PHP7.0 以上版本报错
  18. 使用sharemouse在多台设备间共享鼠标
  19. chrome插件使用整理
  20. 【PCIe】PCIe Flow Control 释疑

热门文章

  1. 进阶运维:SSH无缝切换远程加密
  2. 2017-9-19Linux基础知识(2)
  3. Android开发里的自定义View的实现
  4. python--简易员工信息系统编写
  5. Object-C 语法 字符串 数组 字典 和常用函数 学习笔记
  6. 谈谈HtmlControl与WebControl的区别与用途
  7. 孙鑫VC学习笔记:第十一讲 (二) 图形的保存与重绘方法一
  8. cout和printf的区别
  9. java给方法参数赋值_java方法参数的赋值问题实例源码介绍
  10. 拓端tecdat:R语言GARCH建模常用软件包比较、拟合标准普尔SP 500指数波动率时间序列和预测可视化