在 GPU 上使用 Video Codec SDK,CV-CUDA 和 TensorRT 加速现代云上视频应用

  • 前言
  • 基于现代AI的视频流水线架构与运用场景
  • NVIDIA 视频处理的工具集
    • 1.视频编解码工具
    • 2.前后处理部分-CV-CUDA
    • 3.智能分析部分
    • 4.Decinfer
  • 全GPU视频加速流水线的最佳实践

本文视频来源为NVIDIA GTC大会详细链接如下:https://register.nvidia.cn/flow/nvidia/gtcspring2023/registrationcn/page/sessioncatalog/session/1666233352698001A01c

前言

人工智能技术广泛应用于云和 on-prem 数据中心的短视频和直播应用当中,覆盖了超分辨率,直播视频特效,旧视频修复,自动像素化,视频内容理解等。然而,当部署这些应用程序时,传统视频处理管线混合了 CPU 和 GPU 负载,其性能将受到以下因素的限制: 1) h2d 和 d2h 内存拷贝,2) CPU 上的前处理和后处理,3) CPU 上的视频编解码,4) 未充分优化的 AI 推理框架。

针对以上限制, NVIDIA 提供了丰富的视频处理相关的 SDK,例如用于视频编解码的 Video Codec SDK,用于图像前处理/后处理的 CV-CUDA,以及用于加速 DL 模型推理的 TensorRT。如何在实践中高效地在云上使用这些工具是搭建基于人工智能的新式视频处理管线的关键。

基于现代AI的视频流水线架构与运用场景

常用的视频处理流水线包括以下几个部分:1.视频编解码器
。2.图像前后处理。3.AI智能分析模块。如下图所示:
由于在此架构中存在GPU与CPU的数据拷贝以及没有使用加速会使流水线GPU的利用率不高

NVIDIA 视频处理的工具集

针对这个问题NVIDA提供了全流程的视频处理流水线工具集。

1.视频编解码工具


支持多种编码格式和色彩格式,应届编解码器与GPU上的CUDA Cores共享内存,减少大部分拷贝操作。与CUDA配合可以实现高效性能。并且支持Python API

2.前后处理部分-CV-CUDA

CV-CUDA是一个开源图像处理库,采用独立算子设置。
不仅支持相同分辨率的图像保存连续的显存,也可以支持,非连续显存保存不同分辨率的图像。与Python和C++,C的API,结果保证与OPencv对齐,也可以与Pytorch和TensorRT进行对接。
下面我们就来看一下CV-CUDA与Ope的对比效果:

可以看出Opencv无论是在CPU和GPU上性能都不及CV-CUDA

3.智能分析部分

NVIDAI提供了TensorRT

TensorRT推理引擎是目前在工业上应用最广泛的ai部署工具,支持多种训练框架训练的模型,并进行模型转化。在转化过程中TensorRT可以进行量化,算子融合,以及正对硬件自动优化,获得最佳精度性能和最少的精度衰减。

4.Decinfer

Decinfe可以最大化GPU利用率,充分利用GPU利用率.下图为Decinfer架构

全GPU视频加速流水线的最佳实践

使用Decinfe可以将所有的算子迁移到GPU上,充分利用了GPU硬件加速和解码功能,以及高性能处理框架。
以下是使用Decinfe的demo的效果图:

Decinfe采用多线程并行和异步流并行,最大化利用GPU的硬件资源。

在没有并行时候系统的优化空间
如下图所示:

TensorRT为橙色,通过图可以看出,优化空间就是图中的空洞。

Decinfe采用多线程来进行优化:

优化效果时间轴:

可以看出GPU占用率还有空闲
于是Decinfe采用异步流并行技术,详细如下图:

进过优化后的时序图:

可以看出CUDA已经全部占满,GPU也全部占满。性能比串行流水线高了1.2倍。

【分享NVIDIA GTC 23大会干货】在 GPU 上使用 Video Codec SDK,CV-CUDA 和 TensorRT 加速现代云上视频应用 [SE51229]相关推荐

  1. 【分享NVIDIA GTC 23大会干货】AI 初创企业在中国市场的发展和机会——探索中国 AI 初创力量

    [分享NVIDIA GTC 23大会干货]AI 初创企业在中国市场的发展和机会--探索中国 AI 初创力量 有幸聆听了GTC 23其中一个session:AI 初创企业在中国市场的发展和机会 --探索 ...

  2. 【分享NVIDIA GTC 23大会干货】加速生成式AI在生物学和医疗领域的应用

    [分享NVIDIA GTC 23大会干货]加速生成式AI在生物学和医疗领域的应用 1. NVIDIA医疗领域AI计算平台--NVIDIA CLARA 2. NVIDIA CLARA医学影像子平台--M ...

  3. NVIDIA VIDEO CODEC SDK开发资源下载

    NVIDIA VIDEO CODEC SDK开发资源下载 NVIDIA VIDEO CODEC SDK开发资源下载网址: https://developer.nvidia.com/nvidia-vid ...

  4. 【分享NVIDIA GTC大会干货】与Jetson嵌入式平台工程师的深度挖掘问答

    Connect with the Experts: A Deep-Dive Q&A with Jetson Embedded Platform Engineers [CWES52132] NV ...

  5. 【线上分享】探讨TensorRT加速AI模型的简易方案:以图像超分为例

    AI模型近年来广泛应用于图像.视频处理,在超分.降噪.插帧等应用中展现了良好效果.由于图像AI模型的计算量大,即便部署在GPU上,有时仍达不到理想的运行速度.为此,NVIDIA推出了TensorRT, ...

  6. GPU技术大会2020 NVIDIA GTC DLI 培训深度学习与人工智能大会

      NVIDIA GTC (GPU 技术大会) 2020 顶级 AI 盛会 NVIDIA GTC (GPU 技术大会) 是一系列全球盛会,广纳当今计算领域最热门话题的相关培训和见解,并为您创造与顶级专 ...

  7. NVIDIA GTC 明日如约举行,持续 15 天,三万人已报名

    By 超神经 内容概述:明天 NVIDIA 的技术大会 GTC 将于线上举行.作为行业内的顶级会议,虽然被迫移步到了线上,依然安排了干货满满的内容分享.本文将带你看一看,这场会持续半个月的大会,究竟有 ...

  8. 云重磅 | NVIDIA GTC 2019开幕;Caffe 创立者贾扬清加盟阿里;澳大利亚批准华为2亿美元大单...

    戳蓝字"CSDN云计算"关注我们哦! 嗨,大家好,重磅君带来的[云重磅]特别栏目,如期而至,每周二第一时间为大家带来重磅新闻.把握技术风向标,了解行业应用与实践,就交给我重磅君吧! ...

  9. NVIDIA GTC照片

    NVIDIA GTC照片 这次的NVIDIA GPU Technology Conference 2014在美国San Jose(就是俗称的硅谷了)举办. 去美国的飞机上10个小时反正是睡不着,电影还 ...

最新文章

  1. android 高德地图设置不能旋转_这个地图APP,专注于地图软件该做的事!
  2. scipy minimize当目标函数需要参数、当约束条件特别特别多时
  3. 程序员面试题精选100题(26)-和为n连续正数序列[算法]
  4. 为什么c语言写程序要挂起,我运行的C语言程序挂起了,应该怎么办?
  5. TCP拥塞状态机的实现(中)
  6. 内存泄漏(OOM)产生原因
  7. how to consume a webservice via ABAP proxy
  8. 计算机基础与组装,1.计算机基础与组装.pptx
  9. 动态获取textarea后面的p标签_HTML简单标签连起实现的小玩意:
  10. easyUI的combobox的实现
  11. 二维数组中最大连通子数组
  12. 特斯拉遭遇史上最大单季亏损,马斯克放言无人车3个月内横穿美国
  13. mybatis与Spring整合配置文件
  14. Python是编译运行的
  15. CSS揭秘读书笔记-第一章 引言
  16. java下载文件或文件夹
  17. 常用统计预测方法介绍
  18. 智慧环保 | 云计算护航环保行业未来可期
  19. 雨落江满泛涟漪 尘拂心海滤情音 相思入云寄清风
  20. 资深工程师专业评测--安卓免费的银行卡识别SDK,华为 HMS MLKit 和Card IO哪个好?

热门文章

  1. Could not fetch URL https://pypi.tuna.tsinghua.edu.cn/simple/pip/: There was a problem confirming th
  2. NFS(Autofs)挂载出现文件夹权限日期“?“问号
  3. 【OpenHarmony】LiteOS-A 源码目录
  4. Kubernetes 无状态服务和有状态服务
  5. Win11怎么把任务栏调到左边 Win11任务栏在下面怎么调到左边
  6. 里程碑4刷linux,里程碑3刷机包 里程碑4官方刷机包
  7. 不可不知的IEEE 802.15.4和ZigBee基础
  8. php教程适合高中生学吗,高中生请进 - 高一 - 简单学习网论坛_中高考学习交流论坛_中学生学习论坛 - Powered by phpwind...
  9. Cisco网站模块1-3基本网络连接和通信考试题目及答案
  10. 福布斯发布虚拟富豪榜唐老鸭荣登榜首