文献精读笔记

标题

3-微表情识别系统上的OFF-ApexNet

作者

Sze-Teng Lionga , Y.S. Ganb, , Wei-Chuen Yauc , Yen-Chang Huangd , Tan Lit Ken

期刊

SCI

发表时间

2019.5

具体研究内容

使用卷积神经网络 (CNN) 架构解决微表情识别任务,该架构很好地集成了从每个视频中提取的特征。引入了一个新的特征描述符,来自 Apex 框架网络 (OFF-ApexNet) 的光流特征。该特征描述符将光流引导上下文与 CNN 相结合。三正交平面上的局部二元模式(LBP-TOP)[31] 它能够捕获局部时空运动信息(即像素、区域和体积级别)。此外,它对由缩放、旋转或平移引起的几何变化具有鲁棒性。

研究方法/思路

使用D&C-RoIs 方法首先从每个图像的三个面部子区域(即“左眼+眉毛”、“右眼+眉毛”和“嘴巴”)计算 LBP 特征。然后,采用相关系数原理来获取LBP特征在设置帧与其余帧之间差异的变化。最后,对特征差异率采用分治策略来搜索顶点帧,从而指示局部最大值的帧索引。在将原始起始图像和顶点图像传递给 CNN 架构之前获得光流特征。光流能够指示帧之间明显的面部运动变化。它是基于两个图像之间的局部导数的图像模式的近似。具体来说,它旨在生成一个二维向量场;对于起始帧和顶点帧之间足够小的间隔时间(即小于 0.2 秒),假设表面斑块的亮度保持恒定。因此,最优表达流特征 pi,α 可以得到;最后,形成从两帧(即起始和顶点)计算的光流图来表示整个视频;提出了一种新的 2D-CNN 架构来执行特征学习任务。ApexNet(来自 Apex 框架网络的光流特征)架构的概念可视化。光流的水平和垂直分量被用作 CNN 的输入数据。两个独立训练的 CNN 模型(即分别训练 u 和 v)将被合并以在全连接层形成合成特征向量。然后将归一化的数据与卷积核相乘,在接下来的卷积层中形成特征图;然后将归一化的数据与卷积核相乘,在接下来的卷积层中形成特征图;下一层是池化层。它被用作子采样算子,以逐渐减小特征图表示的空间大小。因此,它可以有效地最小化 CNN 架构的计算复杂度。CNN 架构中的每一层(即卷积层和池化层)都刻意学习并将光流特征转换为其他子序列层中的更高级别的特征。然后,从输入数据导出的高级推理特征(即 Outu 和 Outv)在传递到下一个全连接层之前被展平和合并。接下来,来自全连接层的变换特征被传递到输出层。为了解决这个问题,使用 softmax 回归作为激活函数。可以使用(19)计算误差梯度。然后,通过使用随机 Adam 梯度下降更新网络的权重,预计来自多个输入的误差总和将最小化。因此,通过将所有三个数据集作为一个整体来考虑,它可以导致构建一个良好的预测模型。

研究创新点

1. 仅采用每个视频中的两个帧(即起始帧和顶点帧)来更好地表示重要的表达细节,并应用光流引导技术对运动进行编码流量特征。2. 提出一种新颖的特征提取器,它结合了手工(即光流)和数据驱动(即 CNN)特征。3. 实现一种新颖的 CNN 架构,能够突出有价值的输入特征并改进情绪状态预测。4. 对最近三个自发微表情数据库的提议方法进行综合评估,以验证其一致性和有效性。

研究结论

简而言之,引入了一种新颖的特征提取方法,即来自 Apex 框架网络 (OFF ApexNet) 的光流特征来识别微表情。顾名思义,它结合了手工制作的特征(即光流衍生组件)和完全数据驱动的架构(即卷积神经网络)。首先,从起始帧和顶点帧计算水平和垂直光流特征。然后,将这些特征输入到神经网络中,以进一步突出重要的表达信息。手工和数据驱动功能的利用能够在三个最近的最先进数据库(即 SMIC、CASME II 和 SAMM)上取得可喜的性能结果。请注意,这是在该领域的三个数据库上进行跨数据集验证的第一次尝试。结果,当将三个数据库作为一个整体考虑时,其 F 度量为 0.71,实现了 74.60% 的最高三类分类准确度。

研究不足与展望

这项工作的贡献指出了进一步研究的一些途径。例如,可以应用其他特征提取器(即 LBP、HOG、SIFT 等)来更好地表示运动细节,而不是利用光流特征。因此,有价值的输入数据将被传递给卷积神经网络架构进行特征丰富和选择,从而提高分类性能。此外,可以专注于处理这些数据库中数据不平衡的问题,以便所提出的方法可以在所有表​​达式中产生一致的良好识别结果。

引用内容

参考文献【22】所提出的16个ROI能够加速特征提取和过程分类,但是16个ROI的形状和大小并不灵活,因为他们严重的依赖检测器监测到的的特征坐标。还有【23】提出的把ROI数量减为三个区域,虽然这次设置的三个ROI大小和位置不同,但他们取决于坐标的位置。【25、26】则提出通过减少冗余帧,提高特征向量的辨别能力。【28、29】中仅使用顶点帧;因此,提出了几种 LBP 变体,其中一些变体在微表达分析中进行了检查,例如具有六个交点的局部二进制模式 (LBP-SIP) [32]、具有积分投影的时空局部二进制模式(STLBP-IP)[33],完成的局部量化模式(STCLQP)[34]。作为光流的扩展,[40]推导出了更高阶的精确微分近似,即光应变。与光流相比,光应变在确定运动变化方面具有更好的性能,因为它能够保留相对有意义的面部肌肉运动 [41, 42]。

借鉴价值

引入了一种新颖的特征提取方法,即来自 Apex 框架网络 (OFF ApexNet) 的光流特征来识别微表情。顾名思义,它结合了手工制作的特征(即光流衍生组件)和完全数据驱动的架构(即卷积神经网络)。首先,从起始帧和顶点帧计算水平和垂直光流特征。然后,将这些特征输入到神经网络中,以进一步突出重要的表达信息。手工和数据驱动功能的利用能够在三个最近的最先进数据库(即 SMIC、CASME II 和 SAMM)上取得可喜的性能结果。请注意,这是在该领域的三个数据库上进行跨数据集验证的第一次尝试。

阅读“微表情识别系统上的OFF-ApexNet”相关推荐

  1. 【表情识别】基于Gabor特征实现微表情识别系统含Matlab源码

    1 简介 表情识别的研究目标是让计算机能够自动识别出人的表情信息,从而更进一步地增强人机交互的友好性及智能性.但是由于人脸表情识别涉及图像处理,计算机视觉,应用数学等学科的融合,正是由于这种多学科交叉 ...

  2. 36thCSIG云上微表情:微表情识别训练系统

    36thCSIG云上微表情:微表情识别训练系统

  3. 微表情如何用计算机分析计算,基于微表情识别的学生课堂专注度分析系统研究...

    摘要: 在课堂教学中,教师关注每个学生的情绪变化和学习状态来调节教学有效提升教学质量.然而,目前的课堂存在教师精力不足,教学反馈延迟等问题,在一定程度上,影响教学质量的提升,阻碍学生的发展.近年来,随 ...

  4. Micro-expression recognition with supervised contrastive learning基于对比监督学习的微表情识别

    Micro-expression recognition with supervised contrastive learning基于对比监督学习的微表情识别--2022 PRL 文章链接:https ...

  5. 学习笔记之范海鹰微表情识别

    微表情识别 1. 微表情由来 1.1 基本情绪和次级情绪 1.2 保罗·埃克罗的贡献 2. 微表情意义 2.1 微表情产生原理 2.2 微表情的形态意义 2.3 微表情的读心内涵 2.4 微表情的应用 ...

  6. 【计算机科学】mini-AORCNN:一种基于Bottleneck Transformer的轻量级微表情识别架构——CCF T2

    mini-AORCNN:一种基于Bottleneck Transformer的轻量级微表情识别架构 摘要 微表情是一种能够体现人真实情感的自发面部动作,其持续时间较短,动作幅度轻微,识别难度较大,但是 ...

  7. 毕业设计-人脸表情识别系统、人工智能

    人脸表情识别系统 1. 前言 在这个人工智能成为超级大热门的时代,人脸表情识别已成为其中的一项研究热点,而卷积神经网络.深度信念网络和多层感知器等相关算法在人脸面部表情识别领域的运用最为广泛.面部的表 ...

  8. android人脸情绪识别器,基于Android平台的人脸表情识别系统的设计与实现

    摘要: 随着目前移动设备硬件技术的不断发展,其性能与PC的差距越来越小,这使得在嵌入式平台上进行图像处理成为了可能.目前使用最广泛的是基于Android系统的嵌入式平台,与之相关的图像类应用需求也渐渐 ...

  9. 微表情如何用计算机分析计算,面部微表情识别若干关键技术之计算机研究

    面部微表情识别若干关键技术之计算机研究 论文价格:免费 论文用途:其他 编辑:vicky 点击次数:188 论文字数:31584 论文编号:sb2019053109223726543 日期:2019- ...

最新文章

  1. 2021年春季学期-信号与系统-第二次作业参考答案-第四小题
  2. SpringBoot(1.5.6.RELEASE)源码解析(一)
  3. 十七、二叉树的建立与基本操作
  4. dz论坛ucenter打不开mysql_Discuz论坛搬家 ucenter info:can not connect to MySQL server解决办法...
  5. PyQ4标准输入框——QInputDialog(一)
  6. 【NLP】文本预处理:删除单词停用词
  7. 深入分析Flex [Bindable] (总结)
  8. 白领必看的十种职场致命毒药
  9. android 垂直的开关_安卓布局:如何让这两个按钮水平垂直居中
  10. 单链表插入元素 注释 c语言,数据结构之无头单链表的相关练习题——C语言实现(详细注释)...
  11. 单选按钮 RadioButton 与 pannel控件
  12. PointConv论文阅读笔记
  13. python中的模块_python3.0中重载模块
  14. 递归打印目录层次(java版)
  15. iso安装器_mac怎么装双系统|mac电脑安装双系统教程
  16. 原生Js汉语拼音首字母匹配城市名
  17. 10个英文手写字体下载
  18. python去除视频水印接口_使用ffmpeg去除视频水印【ffmpeg】
  19. 准确率、精确率、召回率、F值
  20. vue 点击按钮筛选功能_vue实现前端列表多条件筛选

热门文章

  1. 社群助手应该具备那些功能
  2. win10 python3 install mkdocs
  3. matplotlib之堆积柱状图及百分比柱状图
  4. PHP与西门子PLC,GE 与 西门子 PLC 编程 中 变量 区别
  5. 为svn添加hook脚本
  6. STMARL:用于合作交通灯控制的时空多智能体强化学习方法
  7. 零基础学习R-苹果系统存储路径怎么写Desktop/matrix1_1.RData
  8. ftp服务器的地址是哪个文件夹,ftp服务器的地址是哪个
  9. IE盒模型和标准盒模型的区别
  10. 供水管网水力模型技术应用