一、提出问题

本文主要针对行人重识别过程中的身体部位错位匹配导致识别精度有限的问题进行研究。

由图1-1可以看出行人姿势多变,人体空间分布鲁棒性低,而且现有空间分割算法建立在人体空间分布大致相同的假设下,但这种假设并不总符合实际情况。

图1-1 身体部位对齐的必要性

二、论文贡献

  • 提出了一种深度神经网络方法,它联合身体部位特征提取和特征计算,无需标记有关人体部位的信息,而是通过端到端方式最大化重识别精度用以学习模型的参数。与空间划分相比,本文的方法采取人体部分划分,因此对于人体姿势变化和边界框中的各种人体空间分布更加鲁棒。
  • 实证结果表明,本文的方法在标准数据集Market -1501,CUHK03,CUHK01和VIPeR上有着优越的表现。
  • 模型结构

设训练数据为,构造一个三元组是正样本对(同一个人的图像),是负样本对(不同人的图像)。三元组的损失函数如下:

m是负样本对之间的距离大于正样本对之间距离的余量,本文将m设置为0.2。是欧几里德距离,是折页损失函数(hinge loss)。 h(I)是图像I提取出来的特征,因此整个损失函数如下:

3.1 人体部位对齐表示

  • 输入:行人图像I
  • 模型:全卷积神经网络(FCN)+部位网络(part net)
  • 输出:行人的各部位的联合特征f

部位网络(part net)

  • 输入:经过全卷积网络输出的行人特征图
  • 中间层:K个分支,每个分支包括一个部位图检测器(类似卷积)、全局池化层、降维层,K个分支生成的部位特征连接成一个特征向量,经过L2正则化得到最终行人表示
  • 输出:行人特征表示h(I)

设三维张量T表示从FCN输出的图像特征图,因此表示位置(x,y)上的第c个响应。部位特征图检测器可以估计2维特征图Mk,其中mk(x,y)从图像特征图T的指示位置(x,y)位于第k区域中的程度:

通过加权策略计算第k个区域的部分特征映射Tk为:

接着是平均池化算子,f(¯)k= AvePooling(Tk),其中。 后面连接一个线性降维层(由全连接层实现),将f(¯)k降低到维度特征向量。最后,将所有部位特征连接起来:

最后,进行L2归一化,输出行人表示h(I)。

3.2 优化器

通过最小化公式2中的三元组损失函数的和来优化网络参数,参数用θ表示。梯度计算如下:

因此,梯度函数可以转化为:

其中αn是取决于当前网络参数的权重向量,并计算如下:

公式7表明三元组损失的梯度计算与一元分类损失的梯度一样。因此,在SGD(随机梯度下降)的每次迭代中,选择一小批(M个)样本而不是对三元组的子集进行采样:前向传播的一次通过以计算每个样本的表示h(In),计算 在小批量上的权重αn,计算梯度,最后在聚合小批量样本的梯度。 直接选择一个三元组通常会导致包含更多(超过M个)样本,因此计算量比小批量采样更大。

四、实验结果

在各个数据集上选择8通道

Deeply-Learned Part-Aligned Representations for Person Re-Identification 论文笔记相关推荐

  1. Exploiting Shared Representations for Personalized Federated Learning 论文笔记+代码解读

    论文地址点这里 一. 介绍 联邦学习中由于各个客户端上数据异构问题,导致全局训练模型无法适应每一个客户端的要求.作者通过利用客户端之间的共同代表来解决这个问题.具体来说,将数据异构的联邦学习问题视为并 ...

  2. 人群场景的属性--Deeply Learned Attributes for Crowded Scene Understandin

    Deeply Learned Attributes for Crowded Scene Understanding CVPR2015 http://www.ee.cuhk.edu.hk/~jshao/ ...

  3. DeepID2+:Deeply Learned Attributes for Crowded Scene Understanding

    参考文献:<DeepID2+:Deeply Learned Attributes for Crowded Scene Understanding> 1 网络结构 2 特征提取 3 人脸验证

  4. Visual Question Answering with Textual Representations for Images 论文笔记

    Visual Question Answering with Textual Representations for Images 论文笔记 一.Abstract 二.引言 三.方法 3.1 Lang ...

  5. 论文笔记--Deep contextualized word representations

    论文笔记--Deep contextualized word representations 1. 文章简介 2. 文章概括 3 文章重点技术 3.1 BiLM(Bidirectional Langu ...

  6. 论文笔记:Deeply-Learned Part-Aligned Representations for Person Re-Identification

    论文笔记:Deeply-Learned Part-Aligned Representations for Person Re-Identification 简介 这是ICCV2017的一篇person ...

  7. 论文笔记:Decoding Brain Representations by Multimodal Learning of Neural Activity and Visual Features

    论文笔记:Decoding Brain Representations by Multimodal Learning of Neural Activity and Visual Features(通过 ...

  8. 论文笔记--Efficient Estimation of Word Representations in Vector Space

    论文笔记--Efficient Estimation of Word Representations in Vector Space 1. 文章简介 2. 文章概括 3 文章重点技术 3.1 NNLM ...

  9. Real-time Multiple People Tracking with Deeply Learned Candidate Selection and Person Re-Identificat

    文章地址:https://arxiv.org/abs/1809.04427 代码:https://github.com/longcw/MOTDT 0 摘要 在线多目标跟踪是实时视频分析应用中的基本问题 ...

  10. Deeply Learned Attributes for Crowded Scene Understanding

    CVPR2015 http://www.ee.cuhk.edu.hk/~jshao/WWWCrowdDataset.html 代码 https://github.com/amandajshao/www ...

最新文章

  1. P1155 双栈排序(二分图的染色判断+链式前向星)
  2. 常用小功能(打电话、发短信、发邮件)
  3. Spring Security 中使用Keycloak作为认证授权服务器
  4. LINGO 12安装教程
  5. python云计算面试题_云计算工程师面试问题及答案解析
  6. JAVA springboot ssm b2b2c多用户商城系统源码(三)SpringBoot用JdbcTemplates访问Mysql
  7. ajax communication failed,AJAX没有收到错误
  8. Play静态文件调用
  9. 语音合成论文和英伟达撞车,韩国小哥紧急放出全部草稿代码和样本 | 资源帖...
  10. ssm会员商城管理系统答辩PPT免费下载
  11. java thread 线程_Java Thread类简述
  12. 中国将在大连建立下一个硅谷
  13. MySQL(14) 数据库优化方案
  14. zepto获取html内容,基于Zepto的内容滑动插件:zepto.hwSlider.js
  15. SpringBoot2集成Quartz配置独立数据源
  16. 【蓝桥杯真题】走迷宫算法
  17. 如果再来一次,你还会选择互联网么?
  18. Excel 2003文档的密码忘了怎么办
  19. Mac 允许所有来源软件
  20. Python不换行输出

热门文章

  1. 2021年安徽省副高考试成绩查询,安徽人事考试网-2021年安徽事业单位成绩查询入口官网...
  2. graphpad细胞增殖曲线_GraphPad Prism绘制剂量反应曲线
  3. 豌豆荚应用市场上传时提示“抽取icon失败”解决方案
  4. 微服务之SpringCloud服务调用
  5. 北京某平台二手房分析
  6. 电子战技术基础知识简介
  7. 天才小毒妃 第958章 狄族,必反
  8. .net开发安卓入门 - Hello world!
  9. CAN通信——bdc文件解析
  10. lcms质谱仪_LCMS-8030三重四极杆质谱仪