前两天在微信上看到这条新闻 ,百度搞了一个数据集开源计划 Baidu Research Open-Access Dataset (BROAD),其网址为 Baidu Research Open-Access Dataset。首期开放了3个数据集,其中有一个数据集 称为 Video Highlights 。我发现这个数据集与我研究的temporal action detection 以及temporal action proposal 任务基本符合,感觉是个蛮有趣的数据集,所以在这篇笔记里对这个数据集进行简要的介绍与分析。

任务描述

该数据集(下文中简称为BROAD-VH数据集)在介绍中将其定义为视频精彩片段提取任务。具体而言,就是提取视频中可能包含精彩片段的时间区域,而不需要对精彩片段的类别进行分类。该任务实际上与我之前介绍过的temporal action proposal 任务(相关介绍和算法可以参考Temporal Action Detection (时序动作检测)方向2017年会议论文整理)是完全相同的。

视频及数据信息

BROAD-VH数据集主要来源于爱奇艺视频。视频类型为综艺节目,目前包括1500个长视频,视频总时长约1200小时。该数据集的视频时长分布图如下图所示(长度单位为帧)。按照总帧数和总时长的比例,估计采样的fps大概为1.5吧,算是比较低的采样频率了。

训练/验证/测试集的视频数量划分为1262/120/117。

该数据集通过爱奇艺网页link的方式提供了原始视频(即需要爬虫下载或手动下载),此外还提供了提取好的image feature和audio feature。这两种特征均在视频的每一帧上提取,维度均为2048。比如对于一个长度为1000帧的视频,image和audio特征矩阵的大小均为1000*2048。

标签信息及分布

该数据集中一共有18000个精彩片段的时序标注,平均一个视频有12个时序标注。这些精彩片段的总时长占1500个小时中的750个小时,即有一半左右的视频时长被标注为了精彩片段。

我对训练集的标签信息进行了分析,分析的主要内容为精彩片段时长的分布,分布直方图如下图所示。

可以看出,大部分精彩片段的长度都在30-300帧的范围。

测评方式

测评方式部分与通常temporal action proposal任务中不同,并没有使用average recall (平均召回率),而是同detection任务一样使用了mAP,此处将所有highlights片段都看作为了一个动作类别。比较有趣的是,BROAD-VH基本上直接使用了ActivityNet Challenge的detection任务测评代码(略有改动)。

简要分析

根据上面的介绍以及分析内容,可以对这个数据集进行一些简单的评价:

  • 单个视频的时长可能很长(小时级别),单个视频中包含的精彩片段也比较多,这点与THUMOS数据集很像,而与单个视频时长短且包含片段少的ActivityNet数据集差异大
  • 数据集标注的格式,测评代码等方面应该是直接参考的ActivityNet 数据集做的
  • 数据的规模还是比较大的,从时长方面看比ActivityNet要长(ActivityNet时长大约为700小时)
  • 视频的来源均为综艺视频,这点表明这个数据集的来源多样性比较单一
  • 提供特征,其目的应该是节省研究者的计算开销。估计1500小时的视频,提取一遍特需要很长的时间。。根本没法玩。所以有现成的特征挺不错的。

简单的尝试

下完数据集我就先跑了一个最简单的baseline方法,即activitynet challenge 2017 proposal task中的baseline:uniform random 方法。代码主要参考了activitynet官方提供的代码:activitynet/proposals

简单而言,就是在视频随机的位置产生随机长度的proposals,并给予随机的confidence score。在验证集中,对于每个视频我生成了200个proposals,得到的mAP大概在0.027 左右。

小结

总的来说,BROAD-VH算是一个比较有趣的数据集吧,专注于综艺视频中精彩片段提取这一问题。不过由于该数据集目前还没有放出相关的论文,所以还没啥人做,也就没法在这个数据集上比较算法效果。由于提供了提取好的特征,所以在该数据集上跑起实验来也还算比较方便。感兴趣的读者也可以跑实验玩玩看。

百度BROAD-Video Highlights视频精彩片段数据集简要介绍与分析相关推荐

  1. 单点登录简要介绍及分析

    摘要:单点登录(SSO)的技术被越来越广泛地运用到各个领域的软件系统当中.本文从业务的角度分析了单点登录的需求和应用领域:从技术本身的角度分析了单点登录技术的内部机制和实现手段,并且给出Web-SSO ...

  2. 视频精彩片段提取 - 调研

    思路1:从字幕或音轨中找到对话较多的部分 - 抽取音轨 ffmpeg -i a.mp4 -map 0:a:0 a.mp3 - 逐帧抽取RMS功率: ffmpeg -i in.mp3 -af astat ...

  3. Chromium视频标签video简要介绍和学习计划

    随着互联网的发展,在网页上观看视频变得越来越流行,尤其是泛娱乐(手机直播)大行其道的今天.在HTML5之前,在网页上播放视频需要插件支持,例如Flash插件.有了HTML5之后,标签<video ...

  4. Video Analysis 相关领域解读之Video Captioning(视频to文字描述)

    之前两次分别介绍了video analysis中的action recognition 以及 temporal action detection 这两个领域.这两个领域算是对视频mid-level的理 ...

  5. ICCV2021- 牛津大学新的预训练视频文本数据集WebVid-2M,设计用于端到端检索的联合视频和图像编码器!代码已开源!...

    关注公众号,发现CV技术之美 ▊ 写在前面 视频文本检索的挑战包括视觉网络结构的设计 和训练数据的性质 ,因为可用的大规模视频文本训练数据集 (例如HowTo100M) 是noisy的,因此只能通过大 ...

  6. 百度编辑器ueditor添加视频方法

    一种比较简单的方式,亲试有效 在手机上需要展示图文消息,其中包含一个视频,在cms中的百度编辑器里上传不了视频,最终解决方式是,直接在文本编辑器中添加一段代码,在前台页面显示时,对该文本内容做下htm ...

  7. 小程序 video 控制器外观调整_「小程序JAVA实战」小程序视频组件与api介绍(51)...

    这次说下,小程序的视频组件,之前在说小程序基础的时候视频组件没说,现在说下.从属性和api都说下.https://github.com/limingios/wxProgram.git 中No.15 视 ...

  8. 安卓微信下video退出视频全屏方法

    安卓微信下video退出视频全屏方法 在做h5项目的时候,安卓video全屏模式退出方案: <script>var video = document.getElementById('vid ...

  9. ios html5 自动全屏播放,禁止iPhone Safari video标签视频自动全屏的办法

    最近做一个移动端微信页面项目,在微信页面中有视频播放,但是需要禁止IOS的自动全屏播放(前提必须使用video标签). 如: 在iPhone safari 点击视频会弹出播放器进行全屏播放. 在网上看 ...

最新文章

  1. php5.3源码,php5.3介绍
  2. FPGA之道(40)HDL的语法结构
  3. 【轉】JAVA中isEmpty和null以及的区别
  4. unittest和另一个可用单元测试框架nosetest
  5. 政务大数据需要避免三个误区
  6. 逻辑斯蒂回归模型为什么用sigmoid函数
  7. 51单片机超声波测距和报警+Proteus仿真
  8. MAXDOS网刻教程~~(虚拟机与物理机 / 两台或者多台电脑之间)
  9. 贴片电容器容量怎么换算?
  10. oracle imp 版本错误,解决imp导入数据报IMP-00098错误
  11. 3dmax实例教程-使用3ds Max 创建一个完整的场景
  12. ZEMAX | 使用 ZPL 宏进行优化:ZPLM 操作数
  13. oracle if else怎么用,oracle if else语句使用介绍
  14. win10设置共享文件夹局域网访问
  15. modelsim 无objects窗口 的解决方法
  16. 抖音直播伴侣和快手直播伴侣如何实现无人直播还能防封号
  17. 【docker系列】docker API管理接口增加CA安全认证
  18. extjs 数字校园-云资源平台 2014.2.4-班级座位表
  19. 微信小程序界面设计入门课程-样式wxss中使用css课程-文本-direction 文本方向
  20. 学了HTML,快来试着做一份简历吧

热门文章

  1. 发明专利申请需要的材料
  2. 思科模拟器 --- 交换机端口安全配置
  3. Maxwell3D仿真[error] Current leak to the air.
  4. 单片机实例20——数字钟(硬件电路图+汇编程序+C语言程序)
  5. 场波知识整理——3.1几种介质中的传播规律
  6. java爬虫 模拟登录_java 基于Jsoup 对领英完成模拟登陆(Java爬虫)
  7. 多无人机通信-路由器实现
  8. Web系统中出现 localhost 将您重定向的次数过多问题
  9. PHP笔试题(六)_易可易
  10. pytorch 神经网络套路 实现一维输入特征的二分类