Generalizing A Person Retrieval Model Hetero- and Homogeneously

Zhun Zhong, Liang Zheng, Shaozi Li,Yi Yang 2018 ECCV
代码: https://github.com/zhunzhong07/HHL

1. 摘要

引入了一种Hetero(异质)-Homogeneous(同质) Learning (HHL) 学习方法,考虑两个属性:相机不变性,即一张图像迁移到其他相机后ID不变;源域和目标域ID不重叠,因此源域和目标域各选一张图像组成pair必定是负对。前者在目标域操作,为同质;而后者在源域和目标域操作,为异质。

2. 介绍

作者处理跨域问题的一贯风格是重点考虑域内变化,而不是像当下很多方法那样大费周章的去做域适应,其论文如CamStyle,HHL,ECN和8月份刚挂在arxiv上的ECN+GCN等都是在考虑域内变化问题,而且其结果显示这种方法很有效(几乎跨域每年提10个点)。本文的思想也是在处理跨域中的域内变化问题:

  • 相机不变性
    一张图像进行相机风格迁移后与原图像的ID应该是一样的。其是在目标域上进行,而目标域的相机ID很好获取,即一个相机上拍的所有视频都打同一个相机ID即可。然后,就是在做CamStyle的工作了。
  • 域间连通性:源域目标域的ID肯定是不同的(开集),组成负对,而源域很容易选出一个正对,组成三元组进行训练

3. 方法


根据图就能很清楚的看出HHL的做法:

  • 首先源域图像先训了基本的CNN ReID backbone,交叉熵损失监督LcrossL_crossLc​ross
  • 接着目标域每张图像都进行相机风格迁移,过程中伴随有损失LCL_CLC​
  • 然后就是源域图像+目标域图像+目标域迁移后图像一起训练CNN,损失为LDL_DLD​
    *LCL_CLC​和LDL_DLD​都是基于下面的普通三元组损失:

    只不过它们组成triplet的方式不一样,对于LCL_CLC​,其triplet包含目标域的一张anchor图像,这张图像进行迁移后的图像作positive(ECN中的C),而目标域图像的每一张都认为是一个类别(ECN中的E),因此再随机选一张目标域图像作negative即可组成三元组,即:

    而对于LDL_DLD​,其triplet的组成就比较简单了,源域选一张做anchor,然后根据源域的标签选一个positive,再在目标域选一张即为negative,组成三元组,即:

    最终:

    总损失为:

    注意几点:
  • CamStyle中用的是CycleGAN,而这里用的CamStyle将CycleGAN换成了StarGAN,原理不变,但原先迁移图像到其余C-1个相机下需要训练C-1个模型,但StarGAN只需要一个模型就可以搞定
    参考笔记:知乎@酱油妹 https://zhuanlan.zhihu.com/p/31481483
  • CamStyle带来的性能提升和其他数据扩增方法相比如下:
  • 不同采样策略
    ** 随机采样:每个batch选择的图像都认为是不同的ID,按这种方式挑选负对组成三元组(最简单)
    ** 聚类采样:先将图像聚类为K类,然后视为K个ID,按这些ID仅采样图像以组成三元组
    ** 监督采样,目标域给真实标签,按标签进行采样组成三元组(现实中不可能,这里是探索性能对比)

性能如下:

不难看出,方案1最简单且最好。因为任取两张图像,是负对的概率>>是正对的概率。

相机迁移示例:

4. 实验

4.1 实验细节



4.2 参数分析


0.4~0.8最好

每个bacth中真图不能太少。

4.3 消融并和SOTA比





性能很高

Generalizing A Person Retrieval Model Hetero- and Homogeneously阅读总结相关推荐

  1. Generalizing A Person Retrieval Model Hetero- and Homogeneously

    1.论文:Generalizing A Person Retrieval Model Hetero- and Homogeneously 2.代码:https://github.com/zhunzho ...

  2. 论文阅读Generalizing A Person Retrieval Model Hetero-and Homogeneously

    论文阅读Generalizing A Person Retrieval Model Hetero-and Homogeneously 论文:Generalizing A Person Retrieva ...

  3. Joint Learning of Deep Retrieval Model and Product Quantization based Embedding Index

    Joint Learning of Deep Retrieval Model and Product Quantization based Embedding Index 嵌入索引能够实现快速近似近邻 ...

  4. 信息检索实验2- Ranked retrieval model

    目录 实验要求 实验内容 实验目的 实验环境 基本知识及实验原理详解 实验原理分析: 1.对tf-idf的详细理解 2.排序检索模型 3.相关示例 实验结果图 数据集处理 代码重要部分解释 相似度得分 ...

  5. ECCV2018_Generalizing A Person Retrieval Model Hetero- and Homogeneously

    基本思路:利用source domain和target domain进行混合训练,以domain adaption a)     Target domain利用camStyle进行各个摄像头的数据增强 ...

  6. ”AE-OT A NEW GENERATIVE MODEL BASED ON EXTENDED“阅读笔记

    "AE-OT A NEW GENERATIVE MODEL BASED ON EXTENDED SEMI-DISCRETE OPTIMAL TRANSPORT"阅读笔记 来源:IC ...

  7. Face Swapping under Large Pose Variations: a 3D Model Based Approach论文阅读笔记

    题目:Face Swapping under Large Pose Variations: a 3D Model Based Approach 翻译:大姿态变化下的人脸交换:一种基于三维模型的方法 摘 ...

  8. ECCV 2018 完整论文集 -- List 下载链接

    下文列表为ECCV2018官网得到了今年接收论文列表,共779篇: 下文为ECCV2018的全部接收论文汇总 Oral: Convolutional Networks with Adaptive Co ...

  9. 《长安十二时辰》中的跨域行人重识别问题

    点击我爱计算机视觉标星,更快获取CVML新技术 望楼武侯是怎么练成的! 天宝二年,吐蕃对大唐全面停止互市,并挑唆南诏叛唐,一时间局势骤然紧张起来.自古攘外必先安内,为了防止贼人趁机作乱,朝廷成立靖安司 ...

最新文章

  1. conda创建虚拟环境 和 用conda创建GPU的cuda、cudnn使用环境
  2. 第一篇T语言实例开发(版本5.3),带错误检测的加减乘除运算器
  3. 坐标上升算法(Coordinate Ascent)及C++编程实现
  4. Unity3d 下websocket的使用
  5. ubuntu16.04 Nvidia 显卡的风扇调速及startx的后果
  6. LeetCode 1147. 段式回文(贪心)
  7. 对于GetMemory()函数
  8. Coin98 Finance获Alameda Research 400万美元投资
  9. 在ubuntu 下 编译 在windows 下面使用的adb
  10. python中的字典和类的区别_Python中的 字典和字典数据类型
  11. UVA - 10534
  12. html js把json转化为excel,json转换Excel
  13. 74xx系列芯片类型及功能概览
  14. Tomcat9下载以及安装
  15. js日期格式化函数示例:将日期时间格式化成yyyy-mm-dd hh:ii:ss格式
  16. BOSS招聘网站数据分析岗位分析详情
  17. java单线程刷功德程序
  18. 记录一次飞猪杀熟的日常(买机票价格翻倍)
  19. texlive和texstudio安装及使用
  20. java 常用的加密算法及分类

热门文章

  1. c语言动态生成结构体结构,C语言实现动态结构体数组
  2. idea如何配置Mybatis简单易懂
  3. 响铃:厉害了中国古人!原来,我们3000年前就有了机器人
  4. xss-labs通关,xss漏洞详解
  5. Express Invoice Plus for Mac是什么软件?Mac发票管理软件推荐!
  6. 广东海洋大学微型计算机控制技术,电容式液位传感器的设计.pdf
  7. 测水位,六种传感器都知道,算你牛!
  8. 计算机毕业设计Java租车网站(源码+系统+mysql数据库+Lw文档)
  9. Starling开发微信打灰机(二)
  10. CVE10大漏洞总结【网络安全】