#CVPR 2021##全景分割##开放集#

1、Exemplar-Based Open-Set Panoptic Segmentation Network

首尔大学&Adobe Research

先是定义开放集全景分割(OPS)任务,并通过深入分析其固有的挑战,利用合理的假设使其可行。通过重新格式化 COCO 构建一个全新的 OPS 基准,并作为 Panoptic FPN 的变种展示其基线的性能。EOPSN 是基于典范理论的开放集全景分割框架,在检测和分割未知类别的例子方面都是有效的。

已开源:https://github.com/jd730/EOPSN

论文:https://arxiv.org/abs/2105.08336

主页:https://cv.snu.ac.kr/research/EOPSN/

#人体姿势预测#

2、Human Motion Prediction Using Manifold-Aware Wasserstein GAN

Univ. Lille

Human motion prediction(人体姿势预测)当前的一些挑战有预测运动的不连续性和长期范围内的性能衰减。本次工作,作者通过使用人类运动的紧凑 manifold-valued 表示来进行解决。实验证明所提出方法在 CMU MoCap和 Human 3.6M 数据集上的表现优于最先进的方法。定性结果也展示了预测运动的平稳性。

已开源:https://drive.google.com/drive/folders/1pQkwtVDBeubW1oPwuXWFOOtftHabKaph

论文:https://arxiv.org/abs/2105.08715

#ICME 2021 oral##显著目标检测#

3、Exploring Driving-aware Salient Object Detection via Knowledge Transfer

北航&鹏城实验室&美团

构建一个全新的数据集:CitySaliency,用于特定任务(驾驶任务) SOD,可以促进 task-aware SOD 的发展。通过知识迁移卷积神经网络提出一个驾驶任务感知 SOD 的基线模型。在这个网络中,构建一个基于注意力的知识迁移模块来弥补知识差异。此外,还引入一个高效的边界感知特征解码模块,对复杂的特定任务场景中的目标进行细致的特征解码。整个网络以一种渐进的方式整合了知识迁移和特征解码模块。实验证明所提出方法在该数据集上的表现优于 12 种最先进的方法,促进了任务感知 SOD 的发展。

将开源:http://cvteam.net/papers.html

论文:https://arxiv.org/abs/2105.08286

#图像分割#

4、Finding an Unsupervised Image Segmenter in Each of Your Deep Generative Models

牛津大学学者开发一个自动程序用于寻找导致前景和背景分离的动向,并使用这些动向来训练图像分割模型,无需人工监督。该方法是 generator-agnostic(与生成器无关),在各种不同的 GAN 架构下都能产生强大的分割结果。此外,通过利用在 ImageNet 等大型数据集上预训练的 GANs,能够对一系列领域的图像进行分割,而无需进一步的训练或微调。在图像分割基准上对所提出方法进行评估,与之前的工作相比,既不需要人工监督,也不使用训练数据。总的来说,从预训练的深度生成模型中自动提取前景-背景结构可以作为人类监督的一个非常有效的替代。

将开源:https://github.com/lukemelas/unsupervised-image-segmentation

主页:https://lukemelas.github.io/unsupervised-image-segmentation/

论文:https://arxiv.org/abs/2105.08127

#视频#

5、VPN++: Rethinking Video-Pose embeddings for understanding Activities of Daily Living

石溪大学&Inria and Universite Cote d’Azur

Video-Pose Network(VPN),是姿势驱动的注意力机制的扩展,可用于对不同方向进行探索,一个是通过特征级蒸馏将 Pose knowledge 迁移到 RGB 中,一个是通过注意级蒸馏模仿姿势驱动的注意力。然后将它们整合为一个单一的模型:VPN++。实验验证 VPN++ 不仅有效,而且还提供了高速度和对噪声姿势的高弹性。无论有无 3D姿势,VPN++ 在 4 个公共数据集上的表现都优于代表性的基线。

已开源:https://github.com/srijandas07/vpnplusplus

论文:https://arxiv.org/abs/2105.08141

#ICDAR 2021##表单理解#

6、Visual FUDGE: Form Understanding via Dynamic Graph Editing

杨百翰大学&Adobe Research

FUDGE,是一种可视化的表单理解方法,通过结合文本片段(图形顶点)和以迭代的方式修剪边缘来编辑图形结构,以获得最终的文本实体和关系。可以应用于文本识别困难的表单(如降质的或历史表单),以及因为预训练一些语言模型是具有挑战性的资源匮乏的语言表单。FUDGE 在历史题材 NAF 数据集上是最先进的。

将开源:https://github.com/herobd/FUDGE

论文:https://arxiv.org/abs/2105.08194

【5月19日】 开源论文代码分享 分割、姿势预测,目标检测相关推荐

  1. 【历史上的今天】11 月 19 日:Microsoft Office 首次发布;谷歌开源 Chrome OS;Twitter 创始人出生

    整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来. 今天是 2021 年 11 月 19 日,在 5 年前的今天,世界首个光子神经网络诞生:来自普林斯顿大学的 Alexand ...

  2. 互联网晚报 | 3月19日 星期六 |​ 拼多多回应“六万人砍价不成功”;Netflix计划向分享账号的用户收费...

    拼多多回应"六万人砍价不成功":不实 未来将完善活动流程 新浪科技讯 3月19日下午消息,近日,主播直播间动员几万人参与拼多多砍一刀,称两小时内也没有成功.网友纷纷要官方给出一个回 ...

  3. 8月19日BBUG:电信技术开发经验分享与前景展望

    主题:电信技术开发经验分享与前景展望 时间:2006年8月19日星期六 1:30PM-5:30PM 地点:北京复兴门内大街51号 民族饭店11层东厅会议室 行车路线:乘坐地铁在复兴门或西单站下车,复兴 ...

  4. 分享Silverlight/WPF/Windows Phone一周学习导读(8月15日-8月19日)

    分享Silverlight/WPF/Windows Phone一周学习导读(8月15日-8月19日) 本周Silverlight学习资源更新: Silverlight Tools 4安装时的错误提示 ...

  5. 9 月 19 日,腾讯云安全中心监测到  Apache Tomcat 修复了2个严重级别的漏洞, 分别为: 信息泄露漏洞(CVE-2017-12616)、远程代码执行漏洞(CVE-2017-12615

    9 月 19 日,腾讯云安全中心监测到  Apache Tomcat 修复了2个严重级别的漏洞, 分别为: 信息泄露漏洞(CVE-2017-12616).远程代码执行漏洞(CVE-2017-12615 ...

  6. 高能预警:SFDC安全技术大会将于11月19日在北京举办,岂安科技CEO罗启武受邀演讲

    SegmentFault 面向全国开发者的技术大会--SegmentFault Developer Conference 2016(以下简称 SFDC), 将于 11.19 和 12.10 先后在北京 ...

  7. 豆瓣评分9.4!跟邱锡鹏教授一起学「神经网络与深度学习」,7月19日开课

    我们经常会在后台收到一些比较简要的技术咨询,描述了是什么任务,发现用BERT粗暴精调效果不好之后,问我们有什么办法可以提升.我们: 在面对第一把梭就失败时,我们通常是这么判断的: 1. 如果效果差的很 ...

  8. 【历史上的今天】2 月 20 日:Python 代码首次发布;Facebook 收购 WhatsApp;DEC 创始人出生

    整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来. 今天是 2023 年 2 月 20 日,在历史上的今天,吉多·范罗苏姆正式对外公布 Python 代码,版本为 0.9.0 ...

  9. 解密谷歌机器学习工程最佳实践——机器学习43条军规 翻译 2017年09月19日 10:54:58 98310 本文是对Rules of Machine Learning: Best Practice

    解密谷歌机器学习工程最佳实践--机器学习43条军规 翻译 2017年09月19日 10:54:58 983 1 0 本文是对Rules of Machine Learning: Best Practi ...

最新文章

  1. flink批流统一​(还没完成)
  2. TFS2017持续发布中调用PowerShell启停远程应用程序
  3. oracle大表复制加并行,GoldenGate复制单表开并行
  4. SQL SERVER占用CPU过高排查和优化
  5. Vs2012使用strcpy出错之解决方法
  6. 20155313 2016-2017-2 《Java程序设计》第十周学习总结
  7. 《缠中说禅108课》53:三类买卖点的再分辨
  8. 组装三代番木瓜基因组——by Serenity Fang
  9. 数据结构 c语言 试卷,数据结构(C语言)试卷(1)
  10. bootstrap怎么强制不换行_Bootstrap方法的软件实现
  11. Required request body is missing 报错解决
  12. 没有对公账户怎么开通认证微信公众号?
  13. mysql 二进制分发版_安置MySQL二进制代码分发
  14. matlab epics,基于EPICS/MATLAB图像处理的光束位置测量系统
  15. Linux 操作系统(二)搜索文件命令find、locate、which、whereis、grep、wc
  16. 手机已连接但无法访问互联网,碰到这个情况怎么破?想不到是这样
  17. 增值税发票二维码解码内容说明
  18. 2021-11-06 工作记录--LayUI-敲击键盘enter键,仍可以实现搜索
  19. Automation入门(一)
  20. 跟我一起玩编程Python

热门文章

  1. 读书笔记之《Windows内核原理与实现》
  2. 服务器怎么修复插件,如何修复服务器状态代码:302由SQL发现我注入了Firefox插件...
  3. 如何利用魔棒工具抠图_3秒搞定抠图!免费在线抠图工具
  4. 动态追踪技术思想及应用
  5. Linux内核网络丢包查看工具dropwatch的安装和使用
  6. java如何获得点的横纵坐标_横纵坐标怎么区分
  7. 北航计算机考博C语言真题_北京航空航天大学计算机考研:严厉的老父亲,教会你本事,本科非211以上就不要去了...
  8. 勤哲excel服务器虚拟化,虚拟仓库
  9. c++连接oracle数据库程序,无法从c++程序连接到我的oracle数据库
  10. HTML5怎么让图片和文字重叠,利用HTML5实现全屏图片文字过渡切换特效