这次的UCF101视频数据预处理部分,我花了半个月学习了网上的方法和代码,在此真是万分感谢大佬们 !!!然后再和项目组组长讨论并修改了代码hhh,就基本完成任务辣~

今天心血来潮,立下从今天起坚持写代码笔记的flag。故用这篇博客开启我的程序媛笔记之旅hhh

这是数据预处理部分大概的总结:

一、首先,从官网上下载UCF101视频训练集和训练数据和测试数据的列表文件ucfTrainTestlist 。其次根据ucfTrainTestlist中的信息将UCF101训练集的视频分成train 和test 两部分,即将全部的视频对应地移到新建的train文件夹和test文件夹中。

二、下载安装ffmpeg工具,用ffmpeg 提取所有小视频的帧并存放在原相应小视频的目录下。同时,记录下每个小视频所提取的帧数,并按照train_or_test, classname, filename_no_ext, nb_frames 一行四列的格式存入与train文件夹和test文件夹同目录下的新建的名为data_file的csv文件中。

三、完成了上述视频转化为帧之后,接着就是对帧进行数据处理。

首先我们创建一个继承抽象类torch.utils.data.Dataset的子类UCF101。

我们对数据的处理有这四个函数:ClipSubstractMean()的作用是减去RGB的平均值;Rescale()的作用是重新调整图像大小;RandomCrop()的作用是裁剪图片, 随机从图像中截取一部分;ToTensor()的作用是将numpy类型表示的图像转换成torch表示的图像,即将图片转成Tensor,归一化至[0, 1]。我们将这四种处理图像的功能组合成transform。之后将transform=transforms.Compose([ClipSubstractMean(), Rescale(), RandomCrop(), ToTensor()])作为参数传入类UCF101,实例化一个类UCF101的对象myUCF101,再将myUCF101作为参数传入DataLoader,然后实例化一个DataLoader的对象dataloader。

大概的方法就酱~

基于深度学习(Pytorch)的视频识别项目 数据预处理部分的小总结相关推荐

  1. 基于深度学习的遥感影像语义分割数据预处理

    基于深度学习的遥感影像语义分割数据预处理 第一次处理数据,不熟练,仅供参考 数据预处理工具:Arcgis 第一步:下载遥感影像tif数据 根据实际需求选择感兴趣的遥感影像区域 数据来源:Google卫 ...

  2. 第四篇:基于深度学习的人脸特征点检测 - 数据预处理

    在上一篇博文中,我们整理了300-W.LFPW.HELEN.AFW.IBUG和300-VW这6个数据集,使用Python将特征点绘制在对应的图片上,人工验证了数据集的正确性,最终获得了223034个人 ...

  3. 一文掌握基于深度学习的人脸表情识别开发(基于PaddlePaddle)

    目录 一.概述 1.1 表情分类 1.2 表情识别方法 1.2.1 人工特征方法 1.2.2 神经网络方法 1.3 本文实现 二.环境准备 2.1 安装PaddlePaddle 2.2 安装Paddl ...

  4. Python基于深度学习yolov5的扑克牌识别

    Python基于深度学习yolov5的扑克牌识别(附带源码) 源程序来源于本人参与开发的一个网络扑克牌小游戏的图像识别.AI分析,AI出牌的小项目,做完后和大家分享一下扑克牌自动识别模块制作的过程. ...

  5. 毕业设计之 --- 基于深度学习的行人重识别(person reid)

    文章目录 0 前言 1 技术背景 2 技术介绍 3 重识别技术实现 3.1 数据集 3.2 行人检测 3.2 Person REID 3.2.1 算法原理 3.2.2 算法流程图 4 实现效果 5 部 ...

  6. 基于深度学习的人脸性别识别系统(含UI界面,Python代码)

    摘要:人脸性别识别是人脸识别领域的一个热门方向,本文详细介绍基于深度学习的人脸性别识别系统,在介绍算法原理的同时,给出Python的实现代码以及PyQt的UI界面.在界面中可以选择人脸图片.视频进行检 ...

  7. 基于深度学习的轴承故障识别

    毕设题目:基于深度学习的轴承故障识别.这个博客用来记录和整理毕设过程中遇到的一些问题,看的一些参考资料等. 目录 轴承故障识别_实验过程 深度学习相关笔记 Tensorflow学习笔记 无归类杂项 一 ...

  8. 基于深度学习的犬种识别软件(YOLOv5清新界面版,Python代码)

    摘要:基于深度学习的犬种识别软件用于识别常见多个犬品种,基于YOLOv5算法检测犬种,并通过界面显示记录和管理,智能辅助人们辨别犬种.本文详细介绍博主自主开发的犬种检测系统,在介绍算法原理的同时,给出 ...

  9. DeepEye:一个基于深度学习的程序化交易识别与分类方法

    DeepEye:一个基于深度学习的程序化交易识别与分类方法 徐广斌,张伟 上海证券交易所资本市场研究所,上海 200120  上海证券交易所产品创新中心,上海 200120    摘要:基于沪市A股交 ...

最新文章

  1. iOS开发UI篇—transframe属性(形变)
  2. Python学习总结18:函数 参数篇
  3. [RabbitMQ]创建Java开发环境_消费者_生产者
  4. c语言程序设计形考任务2答案(DOC),C语言程序设计形考任务2.doc
  5. Linux环境下的jdk安装(大数据环境)
  6. mysql使用join和不使用join_在SQL或MySQL中不使用JOIN关键字的联接有问题吗?
  7. 计算机opnet仿真实验心得,SIMULINK仿真实验心得体会
  8. MySql 数据类型 - 整型
  9. 怎么压缩图片文件大小?
  10. word删除空白页的6种方法和技巧
  11. 手机上使用油猴插件 Tampermonkey
  12. 安装的Mac Windows双系统,Mac分区的空间太小/太大了,有什么办法调整吗?
  13. 融创与泛海达成交易 获得京沪优质稀缺土地资源
  14. 词汇处理——词义辨析消歧(一)
  15. android写轮眼,打造iOS般流畅的安卓 神器写轮眼使用教程
  16. python微信公众号秒杀代码_微信跳一跳辅助python代码实现
  17. 正在通过app store进行鉴定解决方案
  18. 三星530换固态硬盘_imac换固态硬盘,提升运行速度
  19. 《论语》原文及其全文翻译 学而篇6
  20. ks 怎么抓salt值?api,did?

热门文章

  1. request的用法
  2. 介绍一下新产品「轻芒 APIs」
  3. 在Linux桌面条件下打开Terminal的快捷键
  4. 查询1inux系统中文件颜色分别代表什么?
  5. VMware中三种网络配置作用总结(桥接网络、NAT网络、仅主机模式)
  6. 这个阶段快递公司最重要的人物是CTO
  7. HTTPS和和HTTP的区别
  8. maven多模块项目报-BeanCreationException Error creating bean with name
  9. 耳朵小戴什么耳机合适,耳朵小佩戴都舒适的几款骨传导耳机分享
  10. 观察者网专访斗象科技CEO谢忱:网络安全发展需要内外兼修