CCTrans: Simplifying and Improving Crowd Counting with Transformer
提出问题:
CNN感受野有限无法对全局上下文进行建模,而Transformer可以。
解决方法:
1)基于 Vision Transformer 构建结构简单且高性能的人群计数网络。
2)针对性地设计了有效的特征聚合模块以及高效的多尺度感受野回归头。
3)优化了现有的强、弱监督损失函数,提升了模型鲁棒性。
4)在五个主流数据集上均有不错的表现,在线测试数据集 NWPU-Crowd 上目前排名第一。
提出了一种在弱监督和完全监督设置下进行人群计数的简单传输路径。该传输路径包含四个组件:
一个金字塔Vision Transformer,用于更好地捕捉全局上下文;
一个金字塔特征聚合(PFA)模块,结合低层和高层特征,充分利用从粗到细的信息;
多尺度扩展卷积(MDC)的高效回归头来用于提供多尺度感受野,预测密度图;
尾损失函数,用于稳定训练过程。
损失函数:
弱监督使用smooth加权损失,由计数损失、最优运输(OT)损失和总变化(TV)损失的加权总和表示。
完全监督损失函数使用smooth L1损失。
实验结果:
CCTrans: Simplifying and Improving Crowd Counting with Transformer相关推荐
- TransCrowd: Weakly-Supervised Crowd Counting with Transformer解读
论文:https://arxiv.org/abs/2104.09116 代码:GitHub - dk-liang/TransCrowd: TransCrowd: Weakly-Supervised C ...
- TransCrowd: Weakly-Supervised Crowd Counting with Transformer
提出问题: 当前弱监督计数方法采用CNN,而CNN感受野有限. 解决方法: 1)第一个纯基于Transformer的人群计数框架.从序列到计数的角度重新表述了计数问题,并提出了一种弱监督计数方法,该方 ...
- Crowd Counting论文小结(持续更新)
Crowd Counting论文小结(持续更新) CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly ...
- 论文介绍《CrowdFormer: An Overlap Patching Vision Transformer for Top-Down Crowd Counting 》
paper [ijcai2022] CrowdFormer: An Overlap Patching Vision Transformer for Top-Down Crowd Counting co ...
- 人群计数Crowd counting 和 Swin Transformer
文章题目:CCST: crowd counting with swin transformer 文章链接:https://link.springer.com/article/10.1007/s0037 ...
- 【MAFNet】 A Multi-Attention Fusion Networkfor RGB-T Crowd Counting解读
论文:https://arxiv.org/abs/2208.06761 二作是Junyu Gao,github上awesome-crowd-counting千星的作者.推荐一下他的github:Git ...
- 【论文汇总】RGB-T/D Crowd Counting论文汇总
[RGBT-CC] Cross-Modal Collaborative Representation Learning and a Large-Scale RGBT Benchmark for Cro ...
- 人群密度估计--Structured Inhomogeneous Density Map Learning for Crowd Counting
Structured Inhomogeneous Density Map Learning for Crowd Counting https://arxiv.org/abs/1801.06642 针对 ...
- 人群密度估计--Leveraging Unlabeled Data for Crowd Counting by Learning to Rank
Leveraging Unlabeled Data for Crowd Counting by Learning to Rank CVPR2018 https://github.com/xialeil ...
最新文章
- 谷歌、OpenAI等警告:BERT、GPT-3等大型语言模型都有一个重大缺陷,很危险...
- 谷歌大罢工组织者离职:自曝不得不走,“遭遇秋后算账”
- AGG第二十课 agg::ellipse 方法approximation_scale()
- 沽空机构两度狙击,波司登2018/19财年业绩显著,未来到底是否值得关注?
- 帝国cms php点击删除,帝国CMS删除内容非本站链接的方法(非插件)
- elasticsearch索引结构和配置优化
- CactiEZ V10.1 中文版 Cacti中文解决方案+使用教程(2)
- 相机视场角和焦距_镜头小讲堂(一)镜头的焦距
- 现代软件工程系列 结对编程 (II) 电梯调度程序新需求
- php网站导航-国际网址导航系统 v5.0源码
- Arc076_E Connected?
- MATLAB中按点运算“.* ./”和一般运算的区别
- (转)知乎:AssetMark,到底是做什么的?
- 【小白总结】NLP算法:文本研究领域与NLP文本标注工具(一)
- 解决request-html chromium下载失败原因
- 检查Telerik UI以使用UWP作为PVS-Studio的入门方法
- Android解决Could not find manifest-merger.jar问题
- OpenSSL生成.key、.crt、.pfx证书(Windows下)
- Endianness一点通
- android 模拟电脑按键精灵,Android 模拟点击 按键精灵 ADB方案
热门文章
- javascript 符号_掌握javascript es6符号
- Oracle-实现Boolean类型字段
- 微信JSSDK开发信息配置
- r,w,a 与 r+, w+, a+的区别(转)
- 从PCB的结构与工艺理解阻焊(Solder mask)与助焊(Paster Mask)
- mysql 多对多建表_mysql – 为什么在多对多关系中创建一个新表?
- 前端利器CodePen,了解一下吧
- 基于APS的供应链计划管理的类型阐述
- Django 六——自定义标签、图片验证码、发送邮件、评论树、组合搜索
- java lombok.getter_Lombok注解@Getter @Setter详解