1 简介
TensorRT是一个高性能的深度学习推理(Inference)优化器,可以为深度学习应用提供低延迟、高吞吐率的部署推理。TensorRT可用于对超大规模数据中心、嵌入式平台或自动驾驶平台进行推理加速。TensorRT现已能支持TensorFlow、Caffe、Mxnet、Pytorch等几乎所有的深度学习框架,将TensorRT和NVIDIA的GPU结合起来,能在几乎所有的框架中进行快速和高效的部署推理。

TensorRT 是一个C++库,从 TensorRT 3 开始提供C++ API和Python API,主要用来针对 NVIDIA GPU进行 高性能推理(Inference)加速。

TensorRT 之前称为GIE。

关于推理(Inference):


由以上两张图可以很清楚的看出,训练(training)和 推理(inference)的区别:

训练(training)包含了前向传播和后向传播两个阶段,针对的是训练集。 训练时通过误差反向传播来不断修改网络权值(weights)。
推理(inference)只包含前向传播一个阶段,针对的是除了训练集之外的新数据。可以是测试集,但不完全是,更多的是整个数据集之外的数据。其实就是针对新数据进行预测,预测时,速度是一个很重要的因素。

一般的深度学习项目,训练时为了加快速度,会使用多GPU分布式训练。但在部署推理时,为了降低成本,往往使用单个GPU机器甚至嵌入式平台(比如 NVIDIA Jetson)进行部署,部署端也要有与训练时相同的深度学习环境,如caffe,TensorFlow等。

由于训练的网络模型可能会很大(比如,inception,resnet等),参数很多,而且部署端的机器性能存在差异,就会导致推理速度慢,延迟高。这对于那些高实时性的应用场合是致命的,比如自动驾驶要求实时目标检测,目标追踪等。

所以为了提高部署推理的速度,出现了很多轻量级神经网络,比如squeezenet,mobilenet,shufflenet等。基本做法都是基于现有的经典模型提出一种新的模型结构,然后用这些改造过的模型重新训练,再重新部署。

而tensorRT 则是对训练好的模型进行优化。 **tensorRT就只是 推理优化器。**当你的网络训练完之后,可以将训练模型文件直接丢进tensorRT中,而不再需要依赖深度学习框架(Caffe,TensorFlow等),如下


可以认为tensorRT是一个只有前向传播的深度学习框架,这个框架可以将 Caffe,TensorFlow的网络模型解析,然后与tensorRT中对应的层进行一一映射,把其他框架的模型统一全部 转换到tensorRT中,然后在tensorRT中可以针对NVIDIA自家GPU实施优化策略,并进行部署加速。

目前TensorRT4.0 几乎可以支持所有常用的深度学习框架,对于caffe和TensorFlow来说,tensorRT可以直接解析他们的网络模型;对于caffe2,pytorch,mxnet,chainer,CNTK等框架则是首先要将模型转为 ONNX 的通用深度学习模型,然后对ONNX模型做解析。而tensorflow和MATLAB已经将TensorRT集成到框架中去了
ONNX(Open Neural Network Exchange )是微软和Facebook携手开发的开放式神经网络交换工具,也就是说不管用什么框架训练,只要转换为ONNX模型,就可以放在其他框架上面去inference。这是一种统一的神经网络模型定义和保存方式,上面提到的除了tensorflow之外的其他框架官方应该都对onnx做了支持,而ONNX自己开发了对tensorflow的支持。从深度学习框架方面来说,这是各大厂商对抗谷歌tensorflow垄断地位的一种有效方式;从研究人员和开发者方面来说,这可以使开发者轻易地在不同机器学习工具之间进行转换,并为项目选择最好的组合方式,加快从研究到生产的速度。

TensorRT-介绍相关推荐

  1. NVIDIA边缘计算产品项目落地,tensorrt介绍以及应用

    基于tensorrt的模型开发 基于tensorrt的模型开发: 目标识别及自动驾驶等工业产品应用的感知架构结构: 基于tensorrt的模型开发: 深度学习模型研发的生命周期包括五步:目标确认.任务 ...

  2. TensorRT简介

    TensorRT 介绍 引用:https://arleyzhang.github.io/articles/7f4b25ce/ 1 简介 TensorRT是一个高性能的深度学习推理(Inference) ...

  3. AI视频行为分析系统项目复盘——技术篇3:tensorRT技术梳理

    0 背景 见<AI视频行为分析系统项目复盘--技术篇1> 1 tensorRT 介绍 NVIDIA®TensorRT™是一个深度学习平台,用于模型推理加速(仅支持NVIDIA自家GPU,C ...

  4. TensorRT加速 ——NVIDIA终端AI芯片加速用,可以直接利用caffe或TensorFlow生成的模型来predict(inference)...

    官网:https://developer.nvidia.com/tensorrt 作用:NVIDIA TensorRT™ is a high-performance deep learning inf ...

  5. TensorRT 环境搭建记录

    TensorRT 环境搭建记录 文章目录 TensorRT 环境搭建记录 1.TensorRT介绍 2.使用TensorRT总目标 3.Centos下TensorRT环境搭建(Ubuntu一样) 4. ...

  6. tensorrt,mmclas中的onnx转tensorrt

    NVIDIA TensorRT | NVIDIA Developerhttps://developer.nvidia.cn/zh-cn/tensorrtTensorRT详细入门指北,如果你还不了解Te ...

  7. 基于TensorRT的语义分割实验记录

    文章目录 TensorRT介绍 模型训练 TensorRT环境 CMakeList.txt配置 利用Torch2trt生成Engine文件 编译C++文件 对比测试 相关代码 TensorRT介绍 h ...

  8. 较为详细的记录总结TensorRT的python接口的使用,环境配置,模型转换和静态动态模型推理

    先来一段摘抄自网上的TensorRT介绍: TensorRT是英伟达针对自家平台做的加速包,TensorRT主要做了这么两件事情,来提升模型的运行速度. TensorRT支持INT8和FP16的计算. ...

  9. TensorRT:在NVIDIA各种GPU硬件平台下运行的高性能推理C++库【Pytorch->ONNX->TensorRT】【实现神经网络提速(读取ONNX模型并运行)】【目前对ONNX的支持最好】

    tensorRT 基本网络构建 创建builder 创建network 创建config network添加输入 network添加层,绑定输入 network mark output,指定输出节点 ...

  10. AI 开发神器来了!支持 CPU 加速优化!!

    AI开发现状 从过去AlphaGo在职业围棋中击败世界冠军,到现在大火的自动驾驶,人工智能(AI)在过去几年中取得了许多成就.其中人工智能的成功离不开三要素:数据.算法和算力.其中对于算力,除了训练( ...

最新文章

  1. LINUX 使用tcgetattr函数与tcsetattr函数控制终端四
  2. Java并发编程:进程和线程之由来
  3. airpods_如何通过AirPods与其他人共享音乐
  4. Gradle命令行便利
  5. 实践案例丨GaussDB网络重传/丢包问题定位总结
  6. Babelfish (关于mapstring,string的用法
  7. 第十六章——处理锁、阻塞和死锁(3)——使用SQLServer Profiler侦测死锁
  8. 算法:特殊二维数组查询key值是否存在
  9. Java SE、Java EE、Java ME三者之间的区别
  10. 绿色版飞信LibFetion提示用户密码错误的解决办法,直接改用飞信号登录即可
  11. 安装win7时,显示缺少所需的CD/DVD驱动器设备驱动程序
  12. 浅谈程序员的行业选择---程序人生
  13. CMMI认证是什么?为什么这些IT类企业都在申请?
  14. 证明威尔逊(Wilson)定理及其逆定理
  15. 微信小程序面向个人开放-附超详尽申请教程
  16. 我说我精通字符串,面试官竟然问我Java中的String有没有长度限制!?
  17. CSDN看书的书架入口
  18. 制作双足机器人用易拉罐_小小创客 | 用易拉罐做一台平衡车,跑起来太炫酷了吧...
  19. UDP之广播搜索局域网内设备信息
  20. QString中文乱码

热门文章

  1. B2C电商平台如何做SEO优化以提高流量?
  2. 【致敬未来的攻城狮计划】— 连续打卡第十四天:FSP固件库开发延时函数(时钟详解)
  3. FMouse是啥子?
  4. linux开启启动数字小键盘,适用于使用systemd的系统
  5. Android 自定义圆形头像
  6. 机器学习笔记Python笔记:HMM(隐马尔科夫模型)
  7. 2022届计算机视觉算法秋招面经(CV岗)——offer经
  8. 树莓派pip换国内源:解决换源后仍使用国内源的问题,亲测有效
  9. 金融级分布式交易的技术路径
  10. 马云、马化腾都曾给王中军什么建议?