Densely Semantically Aligned Person Re-Identification阅读笔记
Densely Semantically Aligned Person Re-Identification
Zhizheng Zhang,Cuiling Lan,Wenjun Zeng,Zhibo Chen 2018 CVPR
1. Motivation
提出了一个密集语义对比的行人reid方法,从根本上解决了由姿态/视点的变化、不完美的行人检测、遮挡等引起的body不对齐问题。通过利用对行人图像进行密集语义估计,本文构造了一组密集语义对齐的部分图像 (DSAP图像) ,其中不同图像的相同空间位置具有相同的语义。本文设计了一个双流网络,分别是完整图像的MF-Stream和密集语义对齐指导的DSAG-Stream,其中DSAG-Stream以DSAG图像作为输入,作为正则作用来引导(guide) MF-Stream 从原始图像中学习密集的语义对齐特征。在推理阶段,DSAG-Stream丢弃,只使用MF-Stream使得推理系统具有计算效率高、鲁棒性好等优点。本文是第一次利用细粒度语义来解决行人图像不对齐问题。
2. 介绍
ReID挑战:
3. 方法
图3说明了这一篇文章其实在每个stream中还是分global+local特征学习的两支路结构。而只不过下支路的学习不是之前的一些方法中用的直接暴力划分stripe,也不是检测part,而是一种密集语义对齐的任务,其目的是密集检测到行人part(更好的对齐),而得到不同的行人part,这些part可以用于行人局部特征或全局特征学习,而MB-Ns包含N条支路,分别对应N个区域的特征学习(文中N=8),得到的结果concat在一起,分global支路和local支路学习特征,即为下支路的情况。而推理时仅使用MF-Stream。损失就是图中的那几个损失,MF-Stream中的两个ID损失都是0.5的权重,而最后汇总处的两个ID损失是1.0权重,而两个Triplet损失是1.5权重,本质上还是三元组损失和交叉熵损失联调,而且设置让三元组损失更重要,最终汇总ID损失权重大于MF支路ID损失权重也就是为了让充分考虑到DSAG支路。
如上图,不是所有part都能检测到,因为有的图像捕捉时就没有这些区域(挡住了或错误检测)。
其中Dense Semantic Alignment模块是由DensePose在COCO-DesePose数据集上训练的结果,但没有做域适应,效果不是太好(因此作者使用的最终行人表示也只用MF分支)。
4. 实验
4.1 实验细节
4.2 和SOTA比
性能其实非常高。但本文其实是用了很多提点的tricks的,在2019年罗浩等人的strong baseline指出了能明显大幅提点的6个tricks,这里用了三个(实验细节中高亮部分),而这6个tricks加上就能到86%的mAP,其余3个tricks包括Label smoothing,center loss和BNNeck,其中前两者提点不大,但BNNeck能提点很多,没看到代码不清楚作者用了没有。
其实可以看到在这里(二三行),LS还是能提点不少的,而DSA在模型推理时,其实并没有贡献特征,因此相当于只是一个正则的作用,和LS作用类似。
模型整体性能还是相当高的。
Densely Semantically Aligned Person Re-Identification阅读笔记相关推荐
- 【ReID】Densely Semantically Aligned Person Re-Identification
密集语义对齐的行人重识别(DSA-reID),2019 CVPR的一篇工作[1].DSA-reID在网络中包括全图像主流程main full image stream (MF-Stream),密集语义 ...
- Densely Semantically Aligned Person Re-Identification
行人重识别之语义分割网络 Densely Semantically Aligned Person Re-Identification 原文链接:http://openaccess.thecvf.com ...
- Densely Connected Convolutional Networks(文献阅读笔记)
摘要 最近的研究表明,如果卷积网络在靠近输入的层和靠近输出的层之间包含较短的连接,那么它的训练就可以更深入.更准确.更有效 在本文中,我们相信这一观察,并引入了Dense Convolutional ...
- MicrosoftAsia-Semantics-Aligned Representation Learning for Person Re-identification---论文阅读笔记和工程实现总结
给我一瓶酒,再给我一支烟,说code就code, 我没的是时间 各位看官老爷,欢迎就坐观看. 博主Github链接:https://github.com/wencoast 原理流程 摘要 就是去掉RE ...
- Learning Multiview 3D point Cloud Registration论文阅读笔记
Learning multiview 3D point cloud registration Abstract 提出了一种全新的,端到端的,可学习的多视角三维点云配准算法. 多视角配准往往需要两个阶段 ...
- FCGF论文阅读笔记
FCGF论文阅读笔记 0. Abstract 从三维点云或者扫描帧中提取出几何特征是许多任务例如配准,场景重建等的第一步.现有的领先的方法都是将low-level的特征作为输入,或者在有限的感受野上提 ...
- 深度学习超分辨率综述阅读笔记(翻译)
深度学习超分辨率综述阅读笔记(翻译) https://arxiv.org/abs/1902.06068 摘要:图像超分辨率(SR)是计算机视觉中增强图像和视频分辨率的一类重要图像处理技术.近几年来,图 ...
- Sentiment Classification towards Question-Answering with Hierarchical Matching Network 论文阅读笔记
Sentiment Classification towards Question-Answering with Hierarchical Matching Network 论文阅读笔记 这篇论文介绍 ...
- CYCADA: cycle-consistent adversaial domain adaption阅读笔记
CYCADA: cycle-consistent adversaial domain adaption阅读笔记 目录 CYCADA: cycle-consistent adversaial domai ...
最新文章
- ThinkPHP5 (路径优化,路由)
- GNS3关联SecureCRT的配置。
- Oracle数据库中的违规策略规则的修正
- Theano2.1.1-基础知识之准备工作
- 关于Renderscript的理解
- Texture Inspection 纹理检验halcon算子,持续更新
- 斜线 背景_腊梅花开 摄影 | 斜线加中心构图
- Linux系统(六)用户权限相关命令
- 安卓手机上最好的3个小说阅读器
- 关闭cidaemon进程的方法
- 学安全测试需要考什么证书?
- 求解单位冲激响应的笔记
- 2021年度训练联盟热身训练赛第四场 I.Slot Machines【KMP】
- 解决vue项目在ie、360兼容模式下空白页面问题
- 《创意特训营——30天超级灵感唤醒术》—第1章1.4节增加创意的数量
- 现在不少别墅、村屋等自建房,屋主会尽量“扩大面积”,却违反了很多基本的风水原则
- tm32f429 pcb 原理图工程文件 OPENTX遥控器可用
- 计算机二级如何准备(附资料和题库)
- 全面启用黑暗模式的终极指南
- 实时频谱-2.1实时频谱分析仪的工作方式
热门文章
- PHP资产管理系统,适用于IT办公行业固定资产及设备管理源码
- 帷幄DAM - 内容合规审核平台 内容营销分发平台
- 2017 Redhat广东省信息安全竞赛 Writeup
- 【Robot】 信息安全自学教程汇总 转自【Eastmount 】
- AI产品经理从业指南
- 织梦php访问,织梦首页如何显示访问者ip地址
- 啊??解放?天性???
- git报错remote: HTTP Basic: Access denied
- sakai配置(中文版)(四)
- 利用计算机求该货车,吉林大学汽车理论第二次作业[7页].doc