作者:宋志龙

来源:Datawhale

人脸识别已经成为生活中越来越常见的技术,其中最关键的问题就是安全,而活体检测技术又是保证人脸识别安全性的一个重要手段,本文将向大家简单介绍活体检测,并动手完成一个活体检测模型的训练,最终实现对摄像头或者视频中的活体进行识别。

我们可以达成的效果

01

人脸识别的技术关键——活体检测

一般提到人脸识别技术,即指人脸比对或人脸匹配,即将待识别的人脸和系统中已经提前录入的人脸信息(如身份证照片)进行特征的比对,而在使用神经网络提取特征进行比对之前,需要首先对识别到的人脸进行活体检测,以确定摄像头前的人是个活人。因此整个人脸识别过程一般为(并非一定要这样):人脸检测 -> 关键点检测 -> 人脸对齐 -> 活体检测 -> 人脸特征提取 -> 人脸比对。

模型简介

本项目使用基于resnet18的二分类模型对RGB图像进行活体、非活体的分类识别, 网络结构如图所示,有关于resnet的知识可自行查阅。

数据集简介

本项目数据集使用中科院大型人脸活体检测数据库CASIA-SURF,这是一个包含大量不同年龄段人的多模态(RGB, Depth,IR)的数据集,其中包含大量真实活体人脸样本,也包含了对应的攻击样本(数据集已上传至开源数据平台Graviti)。

如图所示,图例中的攻击样本是以打印出来的人脸作为攻击样本,或者露出五官中的部分结合打印人脸一起作为攻击样本,当然还有别的攻击样本制作的形式。因此模型训练的目标就是要在遇到这些攻击样本的时候能够正确识别出它不是一个活体。

其中,RGB表示RGB图片,Depth表示深度图,IR表示近红外图。三个模态的数据可以都用来训练,以使模型适应不同图像采集设备的需求。为了简单,本项目仅使用RGB图像训练。

数据集目录结构如图所示:

Training中为训练集图片,Val为验证集图片,train_list.txt为训练集各个样本的路径及标签,val_private_list.txt为验证集各个样本的路径及标签,val_public_list.txt本项目暂时不用

代码简介

项目环境:python 3.7.4 、pytorch 1.4.0、其余的opencv、numpy啥的看缺啥装啥吧。。。

项目代码目录如图所示(代码地址见文末):

其中,alive_detect为自定义的文件夹,里面存放了一些测试视频,人脸检测模型权重等等文件。

loss文件夹内存放了一些损失函数的实现 model文件夹内存放了一些模型的实现

models文件夹是模型训练过程中权重的保存路径 process文件夹内存放了一些关于数据处理相关的代码

metric.py实现了一些指标的计算

utils.py实现了一些训练或测试用到的小功能函数

train_CyclicLR.py是训练代码,执行这个代码即可启动训练

train_Fusion_CyclicLR.py是多模态数据的训练代码。即同时使用上述数据集中的三种模态的数据进行训练

face_recognize.py是使用训练好的模型进行活体检测测试的代码

项目代码中给出了训练好的模型权重示例,models/baseline_color_32/checkpoint/global_min_acer_model.pth。

执行脚本face_recognize.py,即可调用训练好的模型完成活体检测。

02

训练过程示例

以resnet18模型为例,使用数据集中的RGB图片进行训练,输入模型尺寸大小为32。

开始训练:

cd alive_recognize_project#开启训练
#--model baseline , 以resnet18为例,可选其他模型,自行探索
#--image_size 32 , 输入活体检测模型的人脸图像大小为32
#--cycle_num 5,训练5个cycle周期
#--cycle_inter 50, 每个cycle周期内训练50个epoch
#--mode train , 开启训练模型
python train_CyclicLR.py --model baseline --image_mode color --image_size 32 --cycle_num 5 --cycle_inter 50 --mode train

对cycle_num和cycle_inter参数的说明,本项目学习率衰减策略采用周期性余弦衰减,cycle_num表示周期数,cycle_inter表示一个周期内训练的epoch数,即每经过cycle_inter个epoch,学习率从初始值下降到最低值,如下图所示。

然后就开始训练了,期间会打印出一些训练过程中的loss、acc、acer等信息,如需要别的日志信息可自行修改。

训练完成后的模型保存在路径models/baseline_color_32/checkpoint下,默认保存每个周期内最低acer模型、最后一个epoch训练结束的模型和全局最低acer模型,如下图所示。

在验证集上测试模型

python train_CyclicLR.py --mode infer_test --model baseline --image_mode color --image_size 32 --batch_size 8

验证集上结果,ACER=0.0358

模型效果测试

调用训练好的模型,对视频中的人脸进行活体检测。(也可以检测摄像头前的自己,本项目以视频文件为例)

测试脚本face_recognize.py参数:

--alive_detect_model:活体检测模型权重

--key_point_detect_model:关键点检测模型,路径为alive_detect/shape_predictor_68_face_landmarks.dat

--detect_vidio:待检测的视频片段存放路径

--detect_res:视频片段的检测结果存放路径

测试代码示例:

python face_recognize.py
--alive_detect_model models/baseline_color_32/checkpoint/global_min_acer_model.pth
--key_point_detect_model alive_detect/shape_predictor_68_face_landmarks.dat
--detect_vidio alive_detect/video_demo.mov
--detect_res alive_detect/res_video_demo.avi

注:--detect_res保存的视频文件默认avi格式,若需要保存其他格式可以自行修改代码。

测试结果示例:

扩展

关于模型训练,可继续调参以期在验证集获得更好的效果。关于数据集,可以使用全部三种模态的数据,使用FaceBagNet模型进行多模态人脸活体检测模型的训练。已经给出相关代码,可自行查看。

数据集获取:https://gas.graviti.cn/dataset/datawhale/CASIA-SURF

代码地址:

https://github.com/ZJUTSong/Alive_Detect

资讯

OpenAI以10亿美元出售「灵魂」

简历

海量秋招面试资料等你来拿!

资讯

英伟达用 AI 给自家纪录片配音

转载

用Python快速制作海报级地图

分享

点收藏

点点赞

点在看

人脸识别模型的动手实践!相关推荐

  1. 【深度学习】人脸识别模型的动手实践!

    作者:宋志龙,算法工程师,Datawhale成员 人脸识别已经成为生活中越来越常见的技术,其中最关键的问题就是安全,而活体检测技术又是保证人脸识别安全性的一个重要手段,本文将向大家简单介绍活体检测,并 ...

  2. 产品经理也能动手实践的AI(四)- 多标签识别,图像分割

    上一篇讲了产品经理也能动手实践的AI(三)- 深入图像识别,在线辨猫,形象的说明了SGD的原理,就是如何将一个线性函数你和到我们预设的散点图上.今天主要讲2个案例,1个核心模块,分别是卫星图像的多标签 ...

  3. guice google_与Google Guice的动手实践

    guice google by Sankalp Bhatia 通过Sankalp Bhatia 与Google Guice的动手实践 (A hands-on session with Google G ...

  4. 我的XGBoost学习经历及动手实践

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:李祖贤  深圳大学,Datawhale高校群成员 知乎地址:htt ...

  5. 两个月入门深度学习,全靠动手实践!一位前端小哥的经验分享

    两个月入门深度学习,全靠动手实践!一位前端小哥的经验分享   在当前社会,技术日新月异,一个全栈工程师不及时学习新知识,掌握AI技能,再过两年就算不上"全栈"了. 产品发烧友.前端 ...

  6. 产品经理也能动手实践的AI(二)- 做个识别宠物的AI

    https://www.toutiao.com/a6673604688056680972/ 上一篇产品经理也能动手实践的AI(一)- FastAI介绍,介绍了为什么选择FastAI,为什么适合产品经理 ...

  7. 产品经理也能动手实践的AI(一)- FastAI介绍

    https://www.toutiao.com/a6671600787744883213/ 如果你还不了解AI的准确含义,请查看我之前的文章: 人人都能搞懂的AI(一) 人人都能搞懂的AI(二)- A ...

  8. 《Hadoop与大数据挖掘》一2.3.5 动手实践:运行MapReduce任务

    本节书摘来华章计算机<Hadoop与大数据挖掘>一书中的第2章 ,第2.3.5节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区"华章计 ...

  9. 【原创 HadoopSpark 动手实践 6】Spark 编程实例与案例演示

     [原创 Hadoop&Spark 动手实践 6]Spark 编程实例与案例演示 Spark 编程实例和简易电影分析系统的编写 目标: 1. 掌握理论:了解Spark编程的理论基础 2. 搭建 ...

最新文章

  1. 在虚幻引擎5中重塑火箭联盟——口袋联盟
  2. Rethinking场景分析中的空间池化 | Strip Pooling(CVPR2020,何凯明)
  3. 简单的5*5,五子棋小游戏
  4. Android adb你真的会用吗?
  5. SAP 电商云 Spartacus UI 路由事件监控
  6. 转json_Java对象转JSON时如何动态的增删改查属性
  7. C++课程上 有关“指针” 的小结
  8. 文法G[E]分析表分析字符串(i+)-编译原理
  9. VSCode内npm run build编译打包时候报错:code ELIFECYCLE - (已解决)
  10. JMETER 第一个实践例子
  11. HCNA培训常见问题001-HCNA AI学习什么内容?
  12. 计算机信息工程专业工资,2020年工科类专业薪资最新排名,计算机很吃香,工资水平最高...
  13. 什么是TPS,什么是QPS?
  14. RK3288开发板GPIO介绍
  15. 微信公众号网页授权--前端获取code及用户信息(vue)
  16. 电脑显示服务器不稳定怎么办,网速不稳定怎么办? 网速不稳定的原因与解决办法-电脑教程...
  17. Android 关闭USB充电
  18. 西门子S7200/300/400以太网通讯处理器选型
  19. docker需要多大内存_畅玩吃鸡需要多大内存 固态硬盘作用介绍【详解】
  20. Typecho——简介及安装

热门文章

  1. leetcode--买股票的最佳时机II--python
  2. 《复联4》的这波操作,其实是在灭 bug
  3. Luogu P1082 同余方程(NOIP 2012) 题解报告
  4. Custom Client Side Drag and Drop Behavior in ASP.NET AJAX
  5. Gradle入门系列(4):创建二进制发布版本
  6. MySQL的log_bin和sql_log_bin 到底有什么区别?
  7. wxWidgets刚開始学习的人导引(3)——wxWidgets应用程序初体验
  8. 功能演示:戴尔PowerConnect 8024交换机VLAN的创建与删除
  9. 基于svnserve的SVN服务器(windows下安装与配置)
  10. windows 安装MySQL服务 zip解压程序