LCE:一个随意转换模型的通用框架

摘要:对于生产中的视觉检索系统,在推出新模型的时候能够和旧模型特征兼容可以很大的降低成本,甚至可以避免对现有图库图像重新提取特征。论文Learning Compatible Embeddings 提出了一个通用、可以适用于直接兼容、向旧模型兼容和向新模型兼容的方式跨模型兼容以及模型兼容训练的框架。LCE的兼容方法是通过一个转换来直接对齐模型之间的类中心,并对新模型限制了更紧凑的类内分布。作者在多种场景下做了实验,例如训练数据集、损失函数、网络架构以及特征维度的变化,并证明了LCE只损失了微小的精度就有效地实现了模型兼容。

论文地址:https://arxiv.org/abs/2108.01958

代码地址:https://github.com/IrvingMeng/LCE

01

.背景

我们发现的模型兼容的应用场景很广泛,从模型训练的角度,模型兼容分为跨模型兼容(cross model compatibility)和模型兼容训练(compatible training),跨模型兼容是要兼容两个已经训练完成的模型,模型兼容训练是在训练新模型过程中加入了模型兼容的约束,以确保两个模型处于同一个特征空间。从模型兼容的方向来说,跨模型兼容可以分为向新模型兼容(backward),向旧模型本兼容(forward),直接兼容(direct)或者同时兼容到一个新空间中(double forward)。最后一种方向会消耗大量的计算资源并且使用场景比较局限,所以我们没有考虑。

上图描述了probe和gallery之间的人脸比对过程,如果probe和gallery的feature来自同一个模型,两者可以很好的比对。但在工业界中,模型升级后,probe和gallery的feature会由不同模型产生,这样就难以有理想的比对效果。洗库 (backfilling) 是解决上述问题最直接方法,在这个过程中需要获取到gallery库中feature对应的所有图片,在有些公司,受隐私的限制,难以获取到历史全量图片。即使历史库已经就绪,也可能会受到计算资源和推理速度的限制。这时就需要一个模型兼容的解决方案,这样就可以避免洗库遇到的各种障碍。

0

2

.LCE框架

对其标准

之前在模型兼容方向已经有了一些的工作,之前的对其标注大都是基于点到点的,即要求新旧模型特征一一对应。在这样的约束下,兼容的性能会受到原本模型的限制,难以有性能上的提升。我们在保证类中心对齐的同时,放松了对点的约束,也就是论文中提出的点到集的约束。我们这样做既保证了兼容的效果,也给模型提供了一定的自由学习空间。

训练框架

上图是我们的LCE框架,model 1是个训练完成的老模型,model 2是个待训练或者就绪的新模型。T是转换器,用来结耦初始feature和转换后的feature。训练过程中,通过转换器我们把新老图片特征和类中心转换为对应空间上。在loss层面,我们的LCE loss是由三部分组成。Alingnment loss是用来约束两个模型的类中心,要求类别中心一致。boundary loss是让对齐后的类簇更紧凑, 对应我们新提出的点到集合的对齐标准,classification loss是用来监督学习过程,以便模型可以快速准确的收敛。

0

3

.实验

实验部分,我们首先对LCE的模块进行消融实验以探究不同模块的影响。然后我们在跨模型对齐(CMC)和对齐训练(CT)两个场景对齐。对CMC来说,我们的对比方法RBT是该场景下的sota。对CT,我们对比了l2 对齐,BCT对齐和我们的方法在不同情况下的性能比较。最终结果表明我们能够在不同对齐场景和训练场景都取得性能提升。

消融实验

首先我们进行了几项消融研究,以调查我们方法中不同成分的影响。我们采用resnet50网络结构,使用MS1Mv2数据集作为训练数据,使用NormFace Loss训练的模型模拟老模型,使用ArcFace Loss训练的模型作为新模型。实验表表明Transformation module 、alignment loss和boundary loass对兼容效果都有着积极的作用。

上图是我们对类簇抽样作图。可以发现同一个类中的来自同一张图片的新老模型的feature,并没有严格一一对应,同时新模型获得了更紧凑的类内分布。也证明了我们的方法是一种点到集合的约束,可以把新老模型的类中心对齐,并且对齐后的类中还具有更紧凑的类内分布。

CMC实验

在CMC实验中,我们采用的是由InsightFace提供的三种预训练模型(模型细节见上图左表)。对比方法我们用了sota的RBT,并选用NormFace损失函数和ArcFace损失函数作为跨模型兼容时的分类损失。在使用ArcFace损失函数的时候,两种方法获得比较接近的效果,但是在使用NormFace损失函数的时候,RBT模型的性能效果下降超过了1%,这表明我们模型对齐的鲁棒性。

CT实验

在CT实验中,我们对训练数据集、分类损失、网络结构以及特征维数进行了研究。我们选用了KD(L2)和BCT作为基准。上图左表表明了在更换训练集时, 通过我们的LCE的升级后的模型性能超过通过其它方法升级的性能65%。上图右表表明在更换分类损失函数时,我们的LCE升级后的模型性能也优于其方法。

上面两个表分别展现在网络结构和特征维度发生变换时,我们的模型都能很好的工作,通过我们的方法训练的模型在性能上远远超过其它方法。

0

4

.总结

LCE是针对模型兼容问题设计的一个通用框架。这个框架是通过点到集合的方法来兼容两个模型,并对新模型的类内分布做了更严格的限制。作为一个通用的框架,我们的LCE可以应用在多个方向的跨模型兼容训练以及模型兼容训练,能够解决实际场景中模型兼容的多样性和准确性问题,在AiBee的私有测试集上面相比sota得到了接近10个点的提升。公开数据集上,我们的实验也表明了LCE在多种兼容场景下仅有微小的精度损失,可以获得非常好的兼容效果。同时我们LCE也可以扩展到行人再识别, 车辆再识别以及图片检索等其它多个任务。

ICCV和CVPR 2021论文和代码下载后台回复:CVPR2021,即可下载CVPR 2021论文和代码开源的论文合集后台回复:ICCV2021,即可下载ICCV 2021论文和代码开源的论文合集后台回复:Transformer综述,即可下载最新的两篇Transformer综述PDF
CVer-Transformer交流群成立
扫码添加CVer助手,可申请加入CVer-Transformer 微信交流群,方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。
一定要备注:研究方向+地点+学校/公司+昵称(如Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群▲长按加小助手微信,进交流群
▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

ICCV 2021|Aibee提出LCE:一个随意转换模型的通用框架相关推荐

  1. 一个算法“拿下”两个榜单!爱奇艺ICCV 2021论文提出人手三维重建新方法

    2016年,Facebook正式发售Oculus Rift头戴式VR设备,大大革新了人们对于VR技术的认知,这一年也因此被称为VR元年.5年过去,现在VR技术发展到哪了?从原生VR游戏<半条命: ...

  2. ICCV 2021 | OPPO提出室内环境自监督深度估计算法,比肩“有监督”,泛化性能更佳!...

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 来源丨将门创投 室内环境的自监督深度估计向来比室外环境更具挑战性,OPPO提出了一种新颖的单目自监督深 ...

  3. (ICCV 2021) Hierarchical Aggregation for 3D Instance Segmentation

    Abstract 点云上的实例分割是3D场景感知中的一项基本任务.在这项工作中,我们提出了一个简洁的基于聚类的框架HAIS,它充分利用了点和点集的空间关系.考虑到基于聚类的方法可能导致过度分割或分割不 ...

  4. 【论文翻译】SHINE 一个用于特定领域实体与异构信息网络链接的通用框架

    SHINE 一个用于特定领域实体与异构信息网络链接的通用框架 摘要 由多种类型的互联对象组成的异构信息网络正变得越来越流行,例如社交媒体网络和书目网络.在异构信息网络中,将从非结构化文本中检测到的命名 ...

  5. CVPR 2019 | 旷视研究院提出极轻量级年龄估计模型C3AE

    全球计算机视觉三大顶级会议之一 CVPR 2019 将于当地时间 6 月 16-20 日在美国洛杉矶举办.届时,旷视研究院将带领团队远赴盛会,助力计算机视觉技术的交流与落地.在此之前,旷视每周会介绍一 ...

  6. CVPR 2019 | 旷视提出极轻量级年龄估计模型C3AE

    点击我爱计算机视觉标星,更快获取CVML新技术 旷视成都研究院提出一个极其简单但是高效.基于上下文信息的级联性年龄估计模型 --C3AE.  论文名称:C3AE: Exploring the Limi ...

  7. ICCV 2021 | 国科大提出首个CNN和Transformer双体主干网络!Conformer准确率高达84.1%!...

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 转载自:新智元 | 来源:arxiv 编辑:好困 Priscilla ...

  8. ICCV 2021 | 腾讯、华中科大提出QueryInst,开启基于Query的实例分割新思路

    ©作者 | 机器之心编辑部 来源 | 机器之心 实例分割(Instance Segmentation)任务有着广阔的应用和发展前景.来自腾讯 PCG 应用研究中心 (ARC) 和华中科技大学的研究者们 ...

  9. ICCV 2021 Oral | Transformer再下一城!百度南大提出神经绘画网络:Paint Transformer

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 杨净 发自 凹非寺 转载自:量子位(QbitAI) AI已经能教你画油画了. 随便给一张图,笔画序列秒秒钟呈 ...

最新文章

  1. 什么叫做坐标系的平移和旋转.
  2. mysql同一个表,两个数字取差值
  3. beanutil 批量copy_Apache Commons Beanutils对象属性批量复制(pseudo-singleton)
  4. 打家劫舍(首尾相连)Python解法
  5. 树莓派3B上部署运行.net core 2程序
  6. idea怎么把代码放到git_在IDEA中如何初始化Git,把项目推送到Git上
  7. 安装oracle时错误OUI-25031
  8. Service层抽象规范
  9. 华硕ProArt创16 2022:为创作而生
  10. springboot毕设项目流浪动物救助和领养平台e1yqy(java+VUE+Mybatis+Maven+Mysql)
  11. 计算图像中任意四个点连成的四边形面积与Ground truth的IOU(Python)
  12. android录制amr音频文件,android – 以AMR文件格式录制音频
  13. thinkpad触控笔怎么用_联想yoga720触控笔怎么用
  14. python入门论坛_PythonTab:Python中文开发者社区门户
  15. spring boot 集成 websocket 实现消息主动推送
  16. 24V行车记录仪4Ω抛负载的选型及测试
  17. emacs 使用汇总
  18. Elastic Search:(二)分词器
  19. 人生的一道窄门,教育
  20. 什么叫VI、及VI的设计规范

热门文章

  1. CSRF攻击原理以及防御方法
  2. 嵌入式开发第44天(GPIO的使用)
  3. 网速不稳定怎么办?快来看看
  4. Mybatis的一级缓存和二级缓存机制原理和区别
  5. [附源码]Java计算机毕业设计SSM大学生健康电子档案系统
  6. 完成一篇机器人领域期刊论文所需要的一些工具
  7. 我的MVVM开源项目《出行防疫App》已发布
  8. python 节气计算_Python可视化-二十四节气与生日间隔天数统计
  9. matlab陷波器函数,利用窗函数设计陷波器(matlab代码)
  10. java策略模式模板区别,策略模式与模板模式的区别