数据集介绍-Labeled Faces in the Wild(LFW)

数据集官网

lfw是UMass Vision发布的无约束自然场景人脸识别数据集, 包含了来源于互联网的13233张来自5749个人的人脸图片,其中有1680个人至少有2张图片。这些人脸都是用Viola-Jones face detector检测出来的,具体可以看他们的技术报告

这是个比较早期的数据集,适合入门处理。(UMass Vision后来还推出了Face Detection Data set and Benchmark (FDDB))

like this

根据其官方声明,lfw有如下缺点

许多群体在其中没有得到良好体现,如:其中,80岁以上的老人和儿童数量很少,没有婴儿,女性比例较低,且有许多种族的样本稀有或没有。

lfw数据量不够大。

lfw是’in the wild’的,所以有许多不理想的因素,如照明条件差、姿势极端、遮挡严重、分辨率低等。

数据集结构

人脸数据

All images as gzipped tar file

(173MB, md5sum a17d05bd522c52d84eca14327a23d494)

解压后,得到的文件结构如下,每个文件夹对应一个人,即这若干张人脸的标签

每个文件夹下有若干图片

每个图片都是250*250的彩色jpg图像

标签

原始数据是这些,如果自己生成标签的话也可以,比如N张图的2-组合就有$\binom{N}{2}$个,但是这样一来会导致标签非常庞大,二来标签属性不平衡。

假设共有50个人,每个人有2张图片,组合会有$\binom{100}{2}=4950$个,其中正标签(两张图是同一个人)的只有50对,4900:50将会极不平衡。

lfw提供了官方的一种推荐划分

以pairsDevTrain.txt为例

文件的前三行是这样的

1100

Aaron_Peirsol 1 2

Aaron_Peirsol 3 4

其中1100表示接下来的1100行是正例,第二行就是一个正例pair,Aaron_Peirsol这个人的第一张和第二张是一个pair

从1002行开始,结构变成了这样的

AJ_Cook 1 Marsha_Thomason 1

Aaron_Sorkin 2 Frank_Solich 5

Abdel_Nasser_Assidi 2 Hilary_McKay 1

表示接下来的行是反例,AJ_Cook的第一张和Marsha_Thomason的第一张是一个pair

10-fold cross validation

类似的,官网提供了10-fold的版本。

Explore the sets: 1 2 3 4 5 6 7 8 9 10

Download the sets: pairs.txt, people.txt

一些bug

数据集中存在一些错误,具体可以看官网的Errata部分。

lfw2019_Labeled Faces in the Wild(LFW)相关推荐

  1. Labeled Faces in the Wild

    原文: Labeled Faces in the Wild Labeled Faces in the Wild is a public benchmark for face verification, ...

  2. 遮挡人脸检测--Detecting Masked Faces in the Wild with LLE-CNNs

    Detecting Masked Faces in the Wild with LLE-CNNs CVPR2017 本文针对遮挡人脸检测问题,首先建立了一个新的数据库:MAFA, with 30,81 ...

  3. Labeled Faces in the Wild: Updates and New Reporting Procedures

    LFW:更新和新的报告程序 摘要 ​ 自然条件下标记的人脸(LFW)数据库在无约束人脸验证等相关问题上的研究具有重要意义.虽然在描述数据库的原始技术报告中制定了谨慎的使用指南,但也出现了一些无法预料的 ...

  4. [王晓刚]深度学习在图像识别中的研究进展与展望(转发)

    [王晓刚]深度学习在图像识别中的研究进展与展望(转发) (2015-06-04 08:27:56) 转载▼     深度学习是近十年来人工智能领域取得的最重要的突破之一.它在语音识别.自然语言处理.计 ...

  5. Arcface v1 论文翻译与解读

    神罗Noctis 2019-10-13 16:14:39  543  收藏 4 展开 论文地址:http://arxiv.org/pdf/1801.07698v1.pdf 最新版本v3的论文翻译:Ar ...

  6. 图像识别中的深度学习【香港中文大学王晓刚】

    深度学习发展历史 深度学习是近十年来人工智能领域取得的重要突破.它在语音识别.自然语言处理.计算机视觉.图像与视频分析.多媒体等诸多领域的应用取得了巨大成功.现有的深度学习模型属于神经网络.神经网络的 ...

  7. 论文笔记:Git Loss

    原文:Git Loss for Deep Face Recognition Git Loss 1.四个问题 要解决什么问题? 诸如人脸识别.指纹识别等的识别任务,测试集不确定或类别较多而样本较少的情况 ...

  8. OpenCV-Python实战(14)——人脸检测详解(仅需6行代码学会4种人脸检测方法)

    OpenCV-Python实战(14)--人脸检测详解(仅需6行代码学会4种人脸检测方法) 0. 前言 1. 人脸处理简介 2. 安装人脸处理相关库 2.1 安装 dlib 2.2 安装 face_r ...

  9. 论文研读 —— 5. FaceNet A Unified Embedding for Face Recognition and Clustering (2/3)

    文章目录 3. Method 3.1. Triplet Loss 3.2. Triplet Selection 3.3. Deep Convolutional Networks 4. Datasets ...

最新文章

  1. postgresql数据库的备份与恢复
  2. PHP 5.4中的traits特性
  3. miniconda的安装与配置_Miniconda安装及使用--小白上路
  4. 如何直接强制客户端刷新.js文件
  5. 文件服务器映驱动,映射驱动程序文件 - Windows drivers | Microsoft Docs
  6. Python面试准备
  7. python自学-Python 应该怎么学?
  8. 碰到一个摄像头预览画面跳帧的安卓设备
  9. python输出个数、给定一个n*n的矩阵m_简述Numpy
  10. 北京交通大学离散数学 谓词逻辑_【精选】离散数学习题解答-第3章谓词逻辑.pdf...
  11. eclipse+lomboz*tomcat简单配置
  12. 用Python搭建http文件下载服务器
  13. Rust中国大会议程介绍:分会场 下
  14. Node.js Kubernetes Graceful Shutdown
  15. 快捷方式查看系统的配置信息 使用dxdiag
  16. Linux上github提示Permission denied (publickey),如何才能解决?
  17. 行业分析| 视频监控——AI自动巡检
  18. 一起来看流星雨剧情简介/剧情介绍/剧情分集介绍第二十一集
  19. scp 命令私钥下载
  20. 维峰电子通过注册:年营收4亿 李文化家族色彩浓厚

热门文章

  1. Docker容器内中文乱码
  2. linux awk 设置换行符,shell – awk / sed替换换行符
  3. antd源码-Affix固钉解析
  4. VUE 实现公众号网页微信授权登录
  5. Json解析开源框架--Gson 的基本使用
  6. P1379-八数码难题(BFS+A*)(代码带详细注释)
  7. 【KNN以及KD树】
  8. notepad++ 文件太大,打不开
  9. OnlineJudge平台(负载均衡)
  10. 软件性能常用三大指标