lfw2019_Labeled Faces in the Wild(LFW)

数据集介绍-Labeled Faces in the Wild(LFW)

数据集官网

lfw是UMass Vision发布的无约束自然场景人脸识别数据集, 包含了来源于互联网的13233张来自5749个人的人脸图片，其中有1680个人至少有2张图片。这些人脸都是用Viola-Jones face detector检测出来的，具体可以看他们的技术报告

这是个比较早期的数据集，适合入门处理。(UMass Vision后来还推出了Face Detection Data set and Benchmark (FDDB))

like this

根据其官方声明，lfw有如下缺点

许多群体在其中没有得到良好体现，如：其中，80岁以上的老人和儿童数量很少，没有婴儿，女性比例较低，且有许多种族的样本稀有或没有。

lfw数据量不够大。

lfw是’in the wild’的，所以有许多不理想的因素，如照明条件差、姿势极端、遮挡严重、分辨率低等。

数据集结构

人脸数据

All images as gzipped tar file

(173MB, md5sum a17d05bd522c52d84eca14327a23d494)

解压后，得到的文件结构如下，每个文件夹对应一个人，即这若干张人脸的标签

每个文件夹下有若干图片

每个图片都是250*250的彩色jpg图像

标签

原始数据是这些，如果自己生成标签的话也可以，比如N张图的2-组合就有$\binom{N}{2}$个，但是这样一来会导致标签非常庞大，二来标签属性不平衡。

假设共有50个人，每个人有2张图片，组合会有$\binom{100}{2}=4950$个，其中正标签(两张图是同一个人)的只有50对，4900:50将会极不平衡。

lfw提供了官方的一种推荐划分

以pairsDevTrain.txt为例

文件的前三行是这样的

1100

Aaron_Peirsol 1 2

Aaron_Peirsol 3 4

其中1100表示接下来的1100行是正例，第二行就是一个正例pair，Aaron_Peirsol这个人的第一张和第二张是一个pair

从1002行开始，结构变成了这样的

AJ_Cook 1 Marsha_Thomason 1

Aaron_Sorkin 2 Frank_Solich 5

Abdel_Nasser_Assidi 2 Hilary_McKay 1

表示接下来的行是反例，AJ_Cook的第一张和Marsha_Thomason的第一张是一个pair

10-fold cross validation

类似的，官网提供了10-fold的版本。

Explore the sets: 1 2 3 4 5 6 7 8 9 10

Download the sets: pairs.txt, people.txt

一些bug

数据集中存在一些错误，具体可以看官网的Errata部分。

lfw2019_Labeled Faces in the Wild(LFW)相关推荐

Labeled Faces in the Wild
原文: Labeled Faces in the Wild Labeled Faces in the Wild is a public benchmark for face verification, ...
遮挡人脸检测--Detecting Masked Faces in the Wild with LLE-CNNs
Detecting Masked Faces in the Wild with LLE-CNNs CVPR2017 本文针对遮挡人脸检测问题,首先建立了一个新的数据库:MAFA, with 30,81 ...
Labeled Faces in the Wild: Updates and New Reporting Procedures
LFW:更新和新的报告程序摘要自然条件下标记的人脸(LFW)数据库在无约束人脸验证等相关问题上的研究具有重要意义.虽然在描述数据库的原始技术报告中制定了谨慎的使用指南,但也出现了一些无法预料的 ...
[王晓刚]深度学习在图像识别中的研究进展与展望(转发）
[王晓刚]深度学习在图像识别中的研究进展与展望(转发) (2015-06-04 08:27:56) 转载▼ 深度学习是近十年来人工智能领域取得的最重要的突破之一.它在语音识别.自然语言处理.计 ...
Arcface v1 论文翻译与解读
神罗Noctis 2019-10-13 16:14:39 543 收藏 4 展开论文地址:http://arxiv.org/pdf/1801.07698v1.pdf 最新版本v3的论文翻译:Ar ...
图像识别中的深度学习【香港中文大学王晓刚】
深度学习发展历史深度学习是近十年来人工智能领域取得的重要突破.它在语音识别.自然语言处理.计算机视觉.图像与视频分析.多媒体等诸多领域的应用取得了巨大成功.现有的深度学习模型属于神经网络.神经网络的 ...
论文笔记：Git Loss
原文:Git Loss for Deep Face Recognition Git Loss 1.四个问题要解决什么问题? 诸如人脸识别.指纹识别等的识别任务,测试集不确定或类别较多而样本较少的情况 ...
OpenCV-Python实战（14）——人脸检测详解（仅需6行代码学会4种人脸检测方法）
OpenCV-Python实战(14)--人脸检测详解(仅需6行代码学会4种人脸检测方法) 0. 前言 1. 人脸处理简介 2. 安装人脸处理相关库 2.1 安装 dlib 2.2 安装 face_r ...
论文研读 —— 5. FaceNet A Unified Embedding for Face Recognition and Clustering (2/3)
文章目录 3. Method 3.1. Triplet Loss 3.2. Triplet Selection 3.3. Deep Convolutional Networks 4. Datasets ...

lfw2019_Labeled Faces in the Wild(LFW)

lfw2019_Labeled Faces in the Wild(LFW)相关推荐

最新文章

热门文章