Generalizing A Person Retrieval Model Hetero- and Homogeneously阅读总结
Generalizing A Person Retrieval Model Hetero- and Homogeneously
Zhun Zhong, Liang Zheng, Shaozi Li,Yi Yang 2018 ECCV
代码: https://github.com/zhunzhong07/HHL
1. 摘要
引入了一种Hetero(异质)-Homogeneous(同质) Learning (HHL) 学习方法,考虑两个属性:相机不变性,即一张图像迁移到其他相机后ID不变;源域和目标域ID不重叠,因此源域和目标域各选一张图像组成pair必定是负对。前者在目标域操作,为同质;而后者在源域和目标域操作,为异质。
2. 介绍
作者处理跨域问题的一贯风格是重点考虑域内变化,而不是像当下很多方法那样大费周章的去做域适应,其论文如CamStyle,HHL,ECN和8月份刚挂在arxiv上的ECN+GCN等都是在考虑域内变化问题,而且其结果显示这种方法很有效(几乎跨域每年提10个点)。本文的思想也是在处理跨域中的域内变化问题:
- 相机不变性
一张图像进行相机风格迁移后与原图像的ID应该是一样的。其是在目标域上进行,而目标域的相机ID很好获取,即一个相机上拍的所有视频都打同一个相机ID即可。然后,就是在做CamStyle的工作了。 - 域间连通性:源域目标域的ID肯定是不同的(开集),组成负对,而源域很容易选出一个正对,组成三元组进行训练
3. 方法
根据图就能很清楚的看出HHL的做法:
- 首先源域图像先训了基本的CNN ReID backbone,交叉熵损失监督LcrossL_crossLcross
- 接着目标域每张图像都进行相机风格迁移,过程中伴随有损失LCL_CLC
- 然后就是源域图像+目标域图像+目标域迁移后图像一起训练CNN,损失为LDL_DLD
*LCL_CLC和LDL_DLD都是基于下面的普通三元组损失:
只不过它们组成triplet的方式不一样,对于LCL_CLC,其triplet包含目标域的一张anchor图像,这张图像进行迁移后的图像作positive(ECN中的C),而目标域图像的每一张都认为是一个类别(ECN中的E),因此再随机选一张目标域图像作negative即可组成三元组,即:
而对于LDL_DLD,其triplet的组成就比较简单了,源域选一张做anchor,然后根据源域的标签选一个positive,再在目标域选一张即为negative,组成三元组,即:
最终:
总损失为:
注意几点: - CamStyle中用的是CycleGAN,而这里用的CamStyle将CycleGAN换成了StarGAN,原理不变,但原先迁移图像到其余C-1个相机下需要训练C-1个模型,但StarGAN只需要一个模型就可以搞定
参考笔记:知乎@酱油妹 https://zhuanlan.zhihu.com/p/31481483 - CamStyle带来的性能提升和其他数据扩增方法相比如下:
- 不同采样策略
** 随机采样:每个batch选择的图像都认为是不同的ID,按这种方式挑选负对组成三元组(最简单)
** 聚类采样:先将图像聚类为K类,然后视为K个ID,按这些ID仅采样图像以组成三元组
** 监督采样,目标域给真实标签,按标签进行采样组成三元组(现实中不可能,这里是探索性能对比)
性能如下:
不难看出,方案1最简单且最好。因为任取两张图像,是负对的概率>>是正对的概率。
相机迁移示例:
4. 实验
4.1 实验细节
4.2 参数分析
0.4~0.8最好
每个bacth中真图不能太少。
4.3 消融并和SOTA比
性能很高
Generalizing A Person Retrieval Model Hetero- and Homogeneously阅读总结相关推荐
- Generalizing A Person Retrieval Model Hetero- and Homogeneously
1.论文:Generalizing A Person Retrieval Model Hetero- and Homogeneously 2.代码:https://github.com/zhunzho ...
- 论文阅读Generalizing A Person Retrieval Model Hetero-and Homogeneously
论文阅读Generalizing A Person Retrieval Model Hetero-and Homogeneously 论文:Generalizing A Person Retrieva ...
- Joint Learning of Deep Retrieval Model and Product Quantization based Embedding Index
Joint Learning of Deep Retrieval Model and Product Quantization based Embedding Index 嵌入索引能够实现快速近似近邻 ...
- 信息检索实验2- Ranked retrieval model
目录 实验要求 实验内容 实验目的 实验环境 基本知识及实验原理详解 实验原理分析: 1.对tf-idf的详细理解 2.排序检索模型 3.相关示例 实验结果图 数据集处理 代码重要部分解释 相似度得分 ...
- ECCV2018_Generalizing A Person Retrieval Model Hetero- and Homogeneously
基本思路:利用source domain和target domain进行混合训练,以domain adaption a) Target domain利用camStyle进行各个摄像头的数据增强 ...
- ”AE-OT A NEW GENERATIVE MODEL BASED ON EXTENDED“阅读笔记
"AE-OT A NEW GENERATIVE MODEL BASED ON EXTENDED SEMI-DISCRETE OPTIMAL TRANSPORT"阅读笔记 来源:IC ...
- Face Swapping under Large Pose Variations: a 3D Model Based Approach论文阅读笔记
题目:Face Swapping under Large Pose Variations: a 3D Model Based Approach 翻译:大姿态变化下的人脸交换:一种基于三维模型的方法 摘 ...
- ECCV 2018 完整论文集 -- List 下载链接
下文列表为ECCV2018官网得到了今年接收论文列表,共779篇: 下文为ECCV2018的全部接收论文汇总 Oral: Convolutional Networks with Adaptive Co ...
- 《长安十二时辰》中的跨域行人重识别问题
点击我爱计算机视觉标星,更快获取CVML新技术 望楼武侯是怎么练成的! 天宝二年,吐蕃对大唐全面停止互市,并挑唆南诏叛唐,一时间局势骤然紧张起来.自古攘外必先安内,为了防止贼人趁机作乱,朝廷成立靖安司 ...
最新文章
- conda创建虚拟环境 和 用conda创建GPU的cuda、cudnn使用环境
- 第一篇T语言实例开发(版本5.3),带错误检测的加减乘除运算器
- 坐标上升算法(Coordinate Ascent)及C++编程实现
- Unity3d 下websocket的使用
- ubuntu16.04 Nvidia 显卡的风扇调速及startx的后果
- LeetCode 1147. 段式回文(贪心)
- 对于GetMemory()函数
- Coin98 Finance获Alameda Research 400万美元投资
- 在ubuntu 下 编译 在windows 下面使用的adb
- python中的字典和类的区别_Python中的 字典和字典数据类型
- UVA - 10534
- html js把json转化为excel,json转换Excel
- 74xx系列芯片类型及功能概览
- Tomcat9下载以及安装
- js日期格式化函数示例:将日期时间格式化成yyyy-mm-dd hh:ii:ss格式
- BOSS招聘网站数据分析岗位分析详情
- java单线程刷功德程序
- 记录一次飞猪杀熟的日常(买机票价格翻倍)
- texlive和texstudio安装及使用
- java 常用的加密算法及分类