论文阅读13 | AGW: A New Baseline for Single-/Cross-Modality Re-ID
文章目录
- 1. AGW主要有以下三个主要的部分
- 2. Overall Framework
- 3. 实验结果
1. AGW主要有以下三个主要的部分
(1)Non-local Attention (Att) Block
我们采用强大的非局部注意块,来获得所有位置的特征的加权和。其中Wz是一个要学习的权值矩阵,φ(·)表示一个非局部操作,而+xi制定了一个残余学习策略。模块的输入输出维度相同。
(2)Generalized-mean (GeM) Pooling
作为一个细粒度的实例检索,广泛使用的最大池或平均池不能捕获特定于领域的鉴别特征。我们采用了一个可学习的池层,称为generalized-mean (GeM) pooling。其中pk是一个池化超参数,可以在反向传播过程中学习。上述操作近似于pk→∞时的最大池化,以及pk=1时的平均池化。用一句话说:在最低纬度上,对每个元素的p次方求均值,再开p次方。
(3)Weighted Regularization Triplet (WRT) loss
除了具有软最大交叉熵的baseline身份损失外,我们提出了加权正则化的三元组损失。其中(i、j、k)表示每个批次中三元组。P是相应的正集,N是负集。上述加权正则化方法继承了正负对之间的相对距离优化的优势 ,而且避免了引入任何额外的 margin 参数。
2. Overall Framework
在进行跨模态reid任务时,使用两分支的该网络提取特征。在两个分支中,第一层参数是不一样的,后四层参数共享,在后四层(blocks)中只在第二个和第三个block中加入non_local模块。具体的,resnet50的后四层中包含残差块的个数分别为[3, 4, 6, 3],在第二个block中的第3、4个残差块后嵌入non_local,在第三个block中的第4、5、6个残差块后嵌入non_local。因此,总共在后四层中嵌入了5个non_local模块。
3. 实验结果
服务器结果:
-----------------SYSU-MM01数据集---------------------------------all searchFC: Rank-1: 49.18% | Rank-5: 76.08% | Rank-10: 85.58%| Rank-20: 92.96%| mAP: 47.85%| mINP: 34.62%
POOL: Rank-1: 47.57% | Rank-5: 75.88% | Rank-10: 86.41%| Rank-20: 94.46%| mAP: 47.16%| mINP: 34.59%------indoor search训练的时候使用全部图像,应该是这样的,训练的时候都使用全部图像,只是测试的时候不同而已。
FC: Rank-1: 55.10% | Rank-5: 84.52% | Rank-10: 92.46%| Rank-20: 97.24%| mAP: 63.48%| mINP: 59.75%
POOL: Rank-1: 53.73% | Rank-5: 84.12% | Rank-10: 92.50%| Rank-20: 97.28%| mAP: 62.62%| mINP: 58.93%加入CAJ随即擦除和通道增强后
All Average:
FC: Rank-1: 67.65% | Rank-5: 90.09% | Rank-10: 95.48%| Rank-20: 98.55%| mAP: 64.51%| mINP: 50.86%
POOL: Rank-1: 60.87% | Rank-5: 87.74% | Rank-10: 94.49%| Rank-20: 98.48%| mAP: 60.80%| mINP: 49.05%-------------------------------错误操作-----------------------------
All Average:训练的时候只使用indoor图像(理解有误)
FC: Rank-1: 54.52% | Rank-5: 82.89% | Rank-10: 90.81%| Rank-20: 96.23%| mAP: 62.86%| mINP: 59.46%
POOL: Rank-1: 52.84% | Rank-5: 82.89% | Rank-10: 91.85%| Rank-20: 97.36%| mAP: 62.03%| mINP: 58.88%----------------RegDB数据集------------------
10次trial求平均。Test Trial: 0
FC: Rank-1: 70.83% | Rank-5: 81.89% | Rank-10: 86.55%| Rank-20: 92.23%| mAP: 64.19%| mINP: 50.03%
POOL: Rank-1: 68.79% | Rank-5: 78.45% | Rank-10: 83.74%| Rank-20: 89.71%| mAP: 62.84%| mINP: 48.71%
Test Trial: 1
FC: Rank-1: 76.17% | Rank-5: 85.39% | Rank-10: 88.69%| Rank-20: 93.35%| mAP: 66.97%| mINP: 49.97%
POOL: Rank-1: 75.15% | Rank-5: 86.65% | Rank-10: 91.17%| Rank-20: 94.85%| mAP: 68.40%| mINP: 52.46%
Test Trial: 2
FC: Rank-1: 72.43% | Rank-5: 82.77% | Rank-10: 87.67%| Rank-20: 91.75%| mAP: 66.61%| mINP: 52.20%
POOL: Rank-1: 72.14% | Rank-5: 81.21% | Rank-10: 86.65%| Rank-20: 91.60%| mAP: 66.63%| mINP: 53.06%
论文阅读13 | AGW: A New Baseline for Single-/Cross-Modality Re-ID相关推荐
- [论文阅读] (13)英文论文模型设计(Model Design)如何撰写及精句摘抄——以入侵检测系统(IDS)为例
<娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...
- 【论文阅读术语】benchmark、baseline、backbone、ground truth
[最基础术语一]benchmark.baseline.backbone.ground truth 1. benchmark benchmark是一种评价方式,其指的是一个过程.具体来说就是针对不同Mo ...
- 论文阅读13:ENHANCING COLLABORATIVE FILTERING MUSIC RECOMMENDATION BY BALANCING EXPLORATION AND EXPLOITAT
参考论文:ENHANCING COLLABORATIVE FILTERING MUSIC RECOMMENDATION BY BALANCING EXPLORATION AND EXPLOITATIO ...
- 论文阅读 A simple yet effective baseline for 3d human pose estimation
A simple yet effective baseline for 3d human pose estimation 一个简单有效的3d人体姿态估计基准 Abstract 继深层卷积网络的成功之后 ...
- 论文阅读:CVPR 2022 Object Localization under Single Coarse Point Supervision
任务:point-based object localization (POL) Motivation:具有相同语义信息的点具有不同的标签.而其他方法预先定义的关键点可能是不准确的.因此本文提出来基于 ...
- [论文阅读] (26) 基于Excel可视化分析的论文实验图表绘制总结——以电影市场为例
<娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...
- [论文阅读] (14)英文论文实验评估(Evaluation)如何撰写及精句摘抄(上)——以入侵检测系统(IDS)为例
<娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...
- [论文阅读] (18)英文论文Model Design和Overview如何撰写及精句摘抄——以系统AI安全顶会为例
<娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...
- [论文阅读] (17)CCS2019 针对PowerShell脚本的轻量级去混淆和语义感知攻击检测(经典)
<娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...
最新文章
- STM32F0使用LL库实现Modbus通讯
- tcp接口测试工具_【转载】接口测试和性能测试的区别
- Android通知点击事件传递参数
- python创建django项目_搭建Python-Django环境,创建第一个Django项目
- 数据库应用程序为什么不能脱离数据库管理系统独立运行
- Spring 静态代理+JDK动态代理和CGLIB动态代理
- 连接最大数 详解(C++)
- python-网易云音乐搜索下载脚本
- uni-app实现微信与支付宝的境外支付
- 开启binary log功能
- 论文阅读《Knowledge Graph Refinement: A Survey of Approaches and Evaluation Methods》
- 关于“微信公众平台测试号管理接口配置信息配置失败”的问题解决办法
- plc服务器作用,工业控制系统以及PLC的简单介绍
- 假如你来发明编程语言
- mysql卸载如何彻底删除6_如何彻底卸载删除MySQL
- HBuilder 真机调试提示:手机上没有信任本计算机的授权,请在手机上信任该授权
- html中只显示农历的完整代码,很全的显示阴历(农历)日期的js代码
- U3D的坑坑洼洼(1)
- 技术升级 | 戴着口罩也能识别人脸啦
- VS2005中文版下载地址和msdn_vs2005中文版