文章目录

  • 1. AGW主要有以下三个主要的部分
  • 2. Overall Framework
  • 3. 实验结果

1. AGW主要有以下三个主要的部分

(1)Non-local Attention (Att) Block

我们采用强大的非局部注意块,来获得所有位置的特征的加权和。其中Wz是一个要学习的权值矩阵,φ(·)表示一个非局部操作,而+xi制定了一个残余学习策略。模块的输入输出维度相同。

(2)Generalized-mean (GeM) Pooling

作为一个细粒度的实例检索,广泛使用的最大池或平均池不能捕获特定于领域的鉴别特征。我们采用了一个可学习的池层,称为generalized-mean (GeM) pooling。其中pk是一个池化超参数,可以在反向传播过程中学习。上述操作近似于pk→∞时的最大池化,以及pk=1时的平均池化。用一句话说:在最低纬度上,对每个元素的p次方求均值,再开p次方。

(3)Weighted Regularization Triplet (WRT) loss

除了具有软最大交叉熵的baseline身份损失外,我们提出了加权正则化的三元组损失。其中(i、j、k)表示每个批次中三元组。P是相应的正集,N是负集。上述加权正则化方法继承了正负对之间的相对距离优化的优势 ,而且避免了引入任何额外的 margin 参数。

2. Overall Framework


在进行跨模态reid任务时,使用两分支的该网络提取特征。在两个分支中,第一层参数是不一样的,后四层参数共享,在后四层(blocks)中只在第二个和第三个block中加入non_local模块。具体的,resnet50的后四层中包含残差块的个数分别为[3, 4, 6, 3],在第二个block中的第3、4个残差块后嵌入non_local,在第三个block中的第4、5、6个残差块后嵌入non_local。因此,总共在后四层中嵌入了5个non_local模块。

3. 实验结果

服务器结果:


-----------------SYSU-MM01数据集---------------------------------all searchFC:     Rank-1: 49.18% | Rank-5: 76.08% | Rank-10: 85.58%| Rank-20: 92.96%| mAP: 47.85%| mINP: 34.62%
POOL:   Rank-1: 47.57% | Rank-5: 75.88% | Rank-10: 86.41%| Rank-20: 94.46%| mAP: 47.16%| mINP: 34.59%------indoor search训练的时候使用全部图像,应该是这样的,训练的时候都使用全部图像,只是测试的时候不同而已。
FC:     Rank-1: 55.10% | Rank-5: 84.52% | Rank-10: 92.46%| Rank-20: 97.24%| mAP: 63.48%| mINP: 59.75%
POOL:   Rank-1: 53.73% | Rank-5: 84.12% | Rank-10: 92.50%| Rank-20: 97.28%| mAP: 62.62%| mINP: 58.93%加入CAJ随即擦除和通道增强后
All Average:
FC:     Rank-1: 67.65% | Rank-5: 90.09% | Rank-10: 95.48%| Rank-20: 98.55%| mAP: 64.51%| mINP: 50.86%
POOL:   Rank-1: 60.87% | Rank-5: 87.74% | Rank-10: 94.49%| Rank-20: 98.48%| mAP: 60.80%| mINP: 49.05%-------------------------------错误操作-----------------------------
All Average:训练的时候只使用indoor图像(理解有误)
FC:     Rank-1: 54.52% | Rank-5: 82.89% | Rank-10: 90.81%| Rank-20: 96.23%| mAP: 62.86%| mINP: 59.46%
POOL:   Rank-1: 52.84% | Rank-5: 82.89% | Rank-10: 91.85%| Rank-20: 97.36%| mAP: 62.03%| mINP: 58.88%----------------RegDB数据集------------------
10次trial求平均。Test Trial: 0
FC:     Rank-1: 70.83% | Rank-5: 81.89% | Rank-10: 86.55%| Rank-20: 92.23%| mAP: 64.19%| mINP: 50.03%
POOL:   Rank-1: 68.79% | Rank-5: 78.45% | Rank-10: 83.74%| Rank-20: 89.71%| mAP: 62.84%| mINP: 48.71%
Test Trial: 1
FC:     Rank-1: 76.17% | Rank-5: 85.39% | Rank-10: 88.69%| Rank-20: 93.35%| mAP: 66.97%| mINP: 49.97%
POOL:   Rank-1: 75.15% | Rank-5: 86.65% | Rank-10: 91.17%| Rank-20: 94.85%| mAP: 68.40%| mINP: 52.46%
Test Trial: 2
FC:     Rank-1: 72.43% | Rank-5: 82.77% | Rank-10: 87.67%| Rank-20: 91.75%| mAP: 66.61%| mINP: 52.20%
POOL:   Rank-1: 72.14% | Rank-5: 81.21% | Rank-10: 86.65%| Rank-20: 91.60%| mAP: 66.63%| mINP: 53.06%

论文阅读13 | AGW: A New Baseline for Single-/Cross-Modality Re-ID相关推荐

  1. [论文阅读] (13)英文论文模型设计(Model Design)如何撰写及精句摘抄——以入侵检测系统(IDS)为例

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  2. 【论文阅读术语】benchmark、baseline、backbone、ground truth

    [最基础术语一]benchmark.baseline.backbone.ground truth 1. benchmark benchmark是一种评价方式,其指的是一个过程.具体来说就是针对不同Mo ...

  3. 论文阅读13:ENHANCING COLLABORATIVE FILTERING MUSIC RECOMMENDATION BY BALANCING EXPLORATION AND EXPLOITAT

    参考论文:ENHANCING COLLABORATIVE FILTERING MUSIC RECOMMENDATION BY BALANCING EXPLORATION AND EXPLOITATIO ...

  4. 论文阅读 A simple yet effective baseline for 3d human pose estimation

    A simple yet effective baseline for 3d human pose estimation 一个简单有效的3d人体姿态估计基准 Abstract 继深层卷积网络的成功之后 ...

  5. 论文阅读:CVPR 2022 Object Localization under Single Coarse Point Supervision

    任务:point-based object localization (POL) Motivation:具有相同语义信息的点具有不同的标签.而其他方法预先定义的关键点可能是不准确的.因此本文提出来基于 ...

  6. [论文阅读] (26) 基于Excel可视化分析的论文实验图表绘制总结——以电影市场为例

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  7. [论文阅读] (14)英文论文实验评估(Evaluation)如何撰写及精句摘抄(上)——以入侵检测系统(IDS)为例

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  8. [论文阅读] (18)英文论文Model Design和Overview如何撰写及精句摘抄——以系统AI安全顶会为例

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  9. [论文阅读] (17)CCS2019 针对PowerShell脚本的轻量级去混淆和语义感知攻击检测(经典)

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

最新文章

  1. STM32F0使用LL库实现Modbus通讯
  2. tcp接口测试工具_【转载】接口测试和性能测试的区别
  3. Android通知点击事件传递参数
  4. python创建django项目_搭建Python-Django环境,创建第一个Django项目
  5. 数据库应用程序为什么不能脱离数据库管理系统独立运行
  6. Spring 静态代理+JDK动态代理和CGLIB动态代理
  7. 连接最大数 详解(C++)
  8. python-网易云音乐搜索下载脚本
  9. uni-app实现微信与支付宝的境外支付
  10. 开启binary log功能
  11. 论文阅读《Knowledge Graph Refinement: A Survey of Approaches and Evaluation Methods》
  12. 关于“微信公众平台测试号管理接口配置信息配置失败”的问题解决办法
  13. plc服务器作用,工业控制系统以及PLC的简单介绍
  14. 假如你来发明编程语言
  15. mysql卸载如何彻底删除6_如何彻底卸载删除MySQL
  16. HBuilder 真机调试提示:手机上没有信任本计算机的授权,请在手机上信任该授权
  17. html中只显示农历的完整代码,很全的显示阴历(农历)日期的js代码
  18. U3D的坑坑洼洼(1)
  19. 技术升级 | 戴着口罩也能识别人脸啦
  20. VS2005中文版下载地址和msdn_vs2005中文版

热门文章

  1. c语言c 哪个好,c语言与c++有什么区别 哪个更好学
  2. 眼光独到的他,加盟饰品店,实现了创业梦
  3. Windows Server 2012十佳功能排行
  4. Python---库的使用
  5. 产业互联网 控制入口即获得市场
  6. 设计模式 -- 单例模式
  7. 【设计模式】第6章·建造者模式
  8. 小程序主题随接口而变
  9. 前端页面宽度100%
  10. 2022年阿里云新春特惠活动怎么样?