NTU-RGBD CVPR2016

总共大约有56000个视频,60类动作,50类是单人动作,10类是双人交互动作。每个人捕捉了25个关节点。数据集有两种分割方式,cross subject 和cross view ,这也是目前最大最全的一个数据集。很多动作识别的论文都是以这个数据集作为检测标准。
包含四种类型的数据,RGB videos、 depth map sequences 、3D skeletal data、infrared videos

精度:

MSR-Action3D

20类动作,10个人,重复2到3次。总共有567个sequence,depth和skeleton 数据,没有RGB数据,其中有10个sequence有错误,skeleton丢失掉了,帧率15fps

SBU

共284个视频,8类动作,7个人,用5折交叉验证,最长46frame,本数据集的动作全是双人交互动作,有RGB、skeleton、depth图片。骨架关节点有15个
动作分类:靠近, 远离, 踢 ,推,握手,拥抱,递书本,拳击
x and y are normalized as [0,1] while z is normalized as [0,7.8125]

SYSU

kinect捕捉的数据集,包含12类动作,由40个人出演的。总共有480个sequence,每个人有20个关节点。40人,12个动作,480个video clip,6种object。手机,椅子,包,钱包,拖把,扫把。
0.9s-12s,但是背景非常杂乱。
这12个动作分别是:喝水,从一个杯子往另一个杯子倒水 ,打电话,玩手机,背书包,收拾书包,坐在椅子上,移动椅子,从口袋掏出钱包,从钱包里拿钱,拖地,扫地
1.拖把和扫把非常像
2.实验者40人远超于之前的人数
setting 1 :一半样本用来训练,一半用来测试
setting 2 :一般人物用来训练,一半人物用来测试

CMU dataset

总共有2235个sequence,其中subset有664个sequence
包括8个动作类别,在NTU-RGBD出现以前,这是最大的一个数据集,比较有挑战性,主要是因为1, 视频长度变化比较大,2,类内差距比较大,不同的人走路的姿势和速度都不同 3,包含了比较复杂的动作比如跳舞和瑜伽。
没有RGB视频

UTKinect

是由一个静止的kinect相机捕捉的,10个人物,10类动作
每个动作由同一个人表演两次。
10人,(每人做10个动作,这10个sequences 是连在一起的),每个人2个视频,总共20个sequence.
长度:5-120frames
本数据集有20个样本,所以要计算20次

HMDB05

2,337 skeleton sequences performed by 5 actors (184,046 frames after down-sampling
以下结果是2016年AAAI的一篇文章,结果比较老了

Berkeley MHAD

已经达到100%

参考文献

NTURGBD ,SBU 【Co-occurrence Feature Learning from Skeleton Data for Action Recognition and Detection with Hierarchical Aggregation】
SYSU 【View Adaptive Recurrent Neural Networks for High Performance Human Action Recognition from Skeleton Data】
CMU 【A New Representation of Skeleton Sequences for 3D Action Recognition】
HMDB05 【Co-Occurrence Feature Learning for Skeleton Based
Action Recognition Using Regularized Deep LSTM Networks】

[骨架动作识别]数据集相关推荐

  1. 骨骼的动作识别数据集_[骨架动作识别]数据集

    NTU-RGBD CVPR2016 总共大约有56000个视频,60类动作,50类是单人动作,10类是双人交互动作.每个人捕捉了25个关节点.数据集有两种分割方式,cross subject 和cro ...

  2. NTU RGB+D动作识别数据集

    GitHub:基于3D骨架数据的双流卷积网络动作识别算法 数据集下载:3D骨架数据(60+60)类 NTU RGB + D动作识别数据集由56,880个动作样本组成,包含每个样本的RGB视频,深度图序 ...

  3. 基于骨架动作识别的时空图卷积网络

    论文来自https://arxiv.org/abs/1801.07455 英语渣渣的阅读和翻译 基于骨架动作识别的时空图卷积网络 摘要:人体骨骼动力学为人类动作识别传达了重要信息.传统方法在骨骼建模上 ...

  4. 推荐一些动作识别数据集

    ↑↑↑↑↑点击上方蓝色字关注我们! 『运筹OR帷幄』原创 作者:周岩 编者按:动作识别的研究主要基于对视频数据的识别,其中主要包含动作识别(如手势识别,运动识别等),目标识别和姿态预测几个子方向.所有 ...

  5. 四个动作识别数据集的简介

    1.UT-Interaction数据集 包含6类人与人交互的视频:挥手,指向,拥抱,推,踢和用拳猛击.总共有20个视频序列的长度约为1分钟.每个视频每个交互至少包含一次执行,为每个视频平均提供8次人类 ...

  6. 人类动作识别数据集AVA

    原文地址:https://research.googleblog.com/2017/10/announcing-ava-finely-labeled-video.html 视频人类动作识别是计算机视觉 ...

  7. 谷歌发布人类动作识别数据集AVA,精确标注多人动作

    选自Google Research 机器之心编译 参与:路雪 视频人类动作识别是计算机视觉领域中的一个基础问题,但也具备较大的挑战性.现有的数据集不包含多人不同动作的复杂场景标注数据,今日谷歌发布了精 ...

  8. 骨骼的动作识别数据集_基于骨骼数据的人体行为识别

    基于骨骼数据的人体行为识别 摘要 人体动作姿态识别是计算机视觉研究领域中最具挑战的研究方向,是当前的研究热点. 对人体动作姿态进行自动识别将带来一种全新的交互方式, 通过身体语言即人体的姿态和动 作来 ...

  9. 基于动态骨骼的动作识别方法ST-GCN

    解读:基于动态骨骼的动作识别方法ST-GCN(时空图卷积网络模型) 2018年04月09日 01:14:14 我是婉君的 阅读数 16076更多 分类专栏: 计算机视觉 论文 版权声明:本文为博主原创 ...

最新文章

  1. Html_div圆角
  2. CommuntyServer架构分析
  3. 为什么写博客?如何在博客中更好的分享?
  4. Apache如何将HTTP重定向到HTTPS
  5. 用华为鸿蒙 OS 2.0 系统写出了HelloWorld!那些说鸿蒙是PPT的可以闭嘴了!
  6. 广州的11个辖区_避开人潮,广州7月展览指南,有11个免费
  7. js深入理解构造函数和原型对象
  8. 利用Android Camera2 的照相机api 实现 实时的图像采集与预览
  9. Android版哆啦A梦连连看游戏源码完整版
  10. 聚类、K-Means、例子、细节
  11. 爬取Github Web API 并存入Mysql数据库
  12. html之属性的应用
  13. JavaScript学习笔记(六)--数组
  14. 服务器上显示存储脱机,已解决: 如何清除windows2008服务器磁盘脱机显示 - Dell Community...
  15. [Flink] Not a valid protocol version This 1s not an HTTP port
  16. 复旦大学计算机学院官网,Computer and Information Science
  17. Spring如何引用properties文件里的配置
  18. Python把汉字转换成拼音
  19. springboot记录用户访问次数_SpringBoot中自定义注解实现控制器访问次数限制示例...
  20. 笔记本电脑计计算机硬盘分区,笔记本电脑如何分区,小编教你笔记本电脑如何分区...

热门文章

  1. java引用类型有几种,精心整理
  2. 基于Android实现日语学习app设计与实现演示【附项目源码+论文说明】
  3. 艾迪康通过上市聆讯:曾靠疫情检测两年赚20亿 凯雷为大股东
  4. 艾迪康申请在港上市:新冠贡献超20亿元收入,凯雷为控股股东
  5. csf计算机课程,来个操作系统的-[哈工大][操作系统][44讲][csf]
  6. cas 客户端一个IP对应多个域名
  7. /phpmyadmin/index.php,phpMyAdmin/index.php on line 8
  8. IA64与x86-64的区别
  9. 程序员应如何理解多态
  10. Apple Safari 16.3 - macOS 专属免费浏览器 (独立安装包免费下载)