Densely Semantically Aligned Person Re-Identification

Zhizheng Zhang,Cuiling Lan,Wenjun Zeng,Zhibo Chen 2018 CVPR

1. Motivation

提出了一个密集语义对比的行人reid方法,从根本上解决了由姿态/视点的变化、不完美的行人检测、遮挡等引起的body不对齐问题。通过利用对行人图像进行密集语义估计,本文构造了一组密集语义对齐的部分图像 (DSAP图像) ,其中不同图像的相同空间位置具有相同的语义。本文设计了一个双流网络,分别是完整图像的MF-Stream和密集语义对齐指导的DSAG-Stream,其中DSAG-Stream以DSAG图像作为输入,作为正则作用来引导(guide) MF-Stream 从原始图像中学习密集的语义对齐特征。在推理阶段,DSAG-Stream丢弃,只使用MF-Stream使得推理系统具有计算效率高、鲁棒性好等优点。本文是第一次利用细粒度语义来解决行人图像不对齐问题。

2. 介绍

ReID挑战:


3. 方法



图3说明了这一篇文章其实在每个stream中还是分global+local特征学习的两支路结构。而只不过下支路的学习不是之前的一些方法中用的直接暴力划分stripe,也不是检测part,而是一种密集语义对齐的任务,其目的是密集检测到行人part(更好的对齐),而得到不同的行人part,这些part可以用于行人局部特征或全局特征学习,而MB-Ns包含N条支路,分别对应N个区域的特征学习(文中N=8),得到的结果concat在一起,分global支路和local支路学习特征,即为下支路的情况。而推理时仅使用MF-Stream。损失就是图中的那几个损失,MF-Stream中的两个ID损失都是0.5的权重,而最后汇总处的两个ID损失是1.0权重,而两个Triplet损失是1.5权重,本质上还是三元组损失和交叉熵损失联调,而且设置让三元组损失更重要,最终汇总ID损失权重大于MF支路ID损失权重也就是为了让充分考虑到DSAG支路。

如上图,不是所有part都能检测到,因为有的图像捕捉时就没有这些区域(挡住了或错误检测)。

其中Dense Semantic Alignment模块是由DensePose在COCO-DesePose数据集上训练的结果,但没有做域适应,效果不是太好(因此作者使用的最终行人表示也只用MF分支)。

4. 实验

4.1 实验细节




4.2 和SOTA比


性能其实非常高。但本文其实是用了很多提点的tricks的,在2019年罗浩等人的strong baseline指出了能明显大幅提点的6个tricks,这里用了三个(实验细节中高亮部分),而这6个tricks加上就能到86%的mAP,其余3个tricks包括Label smoothing,center loss和BNNeck,其中前两者提点不大,但BNNeck能提点很多,没看到代码不清楚作者用了没有。

其实可以看到在这里(二三行),LS还是能提点不少的,而DSA在模型推理时,其实并没有贡献特征,因此相当于只是一个正则的作用,和LS作用类似。


模型整体性能还是相当高的。

Densely Semantically Aligned Person Re-Identification阅读笔记相关推荐

  1. 【ReID】Densely Semantically Aligned Person Re-Identification

    密集语义对齐的行人重识别(DSA-reID),2019 CVPR的一篇工作[1].DSA-reID在网络中包括全图像主流程main full image stream (MF-Stream),密集语义 ...

  2. Densely Semantically Aligned Person Re-Identification

    行人重识别之语义分割网络 Densely Semantically Aligned Person Re-Identification 原文链接:http://openaccess.thecvf.com ...

  3. Densely Connected Convolutional Networks(文献阅读笔记)

    摘要 最近的研究表明,如果卷积网络在靠近输入的层和靠近输出的层之间包含较短的连接,那么它的训练就可以更深入.更准确.更有效 在本文中,我们相信这一观察,并引入了Dense Convolutional ...

  4. MicrosoftAsia-Semantics-Aligned Representation Learning for Person Re-identification---论文阅读笔记和工程实现总结

    给我一瓶酒,再给我一支烟,说code就code, 我没的是时间 各位看官老爷,欢迎就坐观看. 博主Github链接:https://github.com/wencoast 原理流程 摘要 就是去掉RE ...

  5. Learning Multiview 3D point Cloud Registration论文阅读笔记

    Learning multiview 3D point cloud registration Abstract 提出了一种全新的,端到端的,可学习的多视角三维点云配准算法. 多视角配准往往需要两个阶段 ...

  6. FCGF论文阅读笔记

    FCGF论文阅读笔记 0. Abstract 从三维点云或者扫描帧中提取出几何特征是许多任务例如配准,场景重建等的第一步.现有的领先的方法都是将low-level的特征作为输入,或者在有限的感受野上提 ...

  7. 深度学习超分辨率综述阅读笔记(翻译)

    深度学习超分辨率综述阅读笔记(翻译) https://arxiv.org/abs/1902.06068 摘要:图像超分辨率(SR)是计算机视觉中增强图像和视频分辨率的一类重要图像处理技术.近几年来,图 ...

  8. Sentiment Classification towards Question-Answering with Hierarchical Matching Network 论文阅读笔记

    Sentiment Classification towards Question-Answering with Hierarchical Matching Network 论文阅读笔记 这篇论文介绍 ...

  9. CYCADA: cycle-consistent adversaial domain adaption阅读笔记

    CYCADA: cycle-consistent adversaial domain adaption阅读笔记 目录 CYCADA: cycle-consistent adversaial domai ...

最新文章

  1. ThinkPHP5 (路径优化,路由)
  2. GNS3关联SecureCRT的配置。
  3. Oracle数据库中的违规策略规则的修正
  4. Theano2.1.1-基础知识之准备工作
  5. 关于Renderscript的理解
  6. Texture Inspection 纹理检验halcon算子,持续更新
  7. 斜线 背景_腊梅花开 摄影 | 斜线加中心构图
  8. Linux系统(六)用户权限相关命令
  9. 安卓手机上最好的3个小说阅读器
  10. 关闭cidaemon进程的方法
  11. 学安全测试需要考什么证书?
  12. 求解单位冲激响应的笔记
  13. 2021年度训练联盟热身训练赛第四场 I.Slot Machines【KMP】
  14. 解决vue项目在ie、360兼容模式下空白页面问题
  15. 《创意特训营——30天超级灵感唤醒术》—第1章1.4节增加创意的数量
  16. 现在不少别墅、村屋等自建房,屋主会尽量“扩大面积”,却违反了很多基本的风水原则
  17. tm32f429 pcb 原理图工程文件 OPENTX遥控器可用
  18. 计算机二级如何准备(附资料和题库)
  19. 全面启用黑暗模式的终极指南
  20. 实时频谱-2.1实时频谱分析仪的工作方式

热门文章

  1. PHP资产管理系统,适用于IT办公行业固定资产及设备管理源码
  2. 帷幄DAM - 内容合规审核平台 内容营销分发平台
  3. 2017 Redhat广东省信息安全竞赛 Writeup
  4. 【Robot】 信息安全自学教程汇总 转自【Eastmount 】
  5. AI产品经理从业指南
  6. 织梦php访问,织梦首页如何显示访问者ip地址
  7. 啊??解放?天性???
  8. git报错remote: HTTP Basic: Access denied
  9. sakai配置(中文版)(四)
  10. 利用计算机求该货车,吉林大学汽车理论第二次作业[7页].doc