第一种,混合量化--仅量化权重

该方式将浮点型的权重量化为int8整型,可将模型大小直接减少75%、提升推理速度最大3倍。该方式在推理的过程中,需要将int8量化值反量化为浮点型后再进行计算,如果某些Ops不支持int8整型量化,那么其保存的权重依然是浮点型的,即部分支持int8量化的Ops其权重保存为int8整型且存在quantize和dequantize操作,否则依然是浮点型的,因而称该方式为混合量化。该方式可达到近乎全整型量化的效果,但存在quantize和dequantize操作其速度依然不够理想

第二种,全整型量化--权重和激活值都进行量化

该方式则试图将权重、激活值及输入值均全部做int8量化,并且将所有模型运算操作置于int8下进行执行,以达到最好的量化效果。为了达到此目的,我们需要一个具有代表性的小数据集,用于统计激活值和输入值等的浮点型范围,以便进行精准量化。

全整型量化的输入输出依然是浮点型的,但如果某些Ops未实现该方法,则转化是没问题的且其依然会自动保存为浮点型

tensorflow量化策略详解相关推荐

  1. Incremental-Network-Quantization增量网络量化论文详解

    Incremental-Network-Quantization增量网络量化论文详解 笔者将从以下几个方面分析该论文的原理及其实现,由于笔者能力有限,如有错误望诸公指正. 论文作者代码:https:/ ...

  2. Spring Data JPA 从入门到精通~Naming命名策略详解及其实践

    Naming 命名策略详解及其实践 用 JPA 离不开 @Entity 实体,我都知道实体里面有字段映射,而字段映射的方法有两种: 显式命名:在映射配置时,设置的数据库表名.列名等,就是进行显式命名, ...

  3. CentOS7下的软件安装方法及策略详解

    CentOS7下的软件安装方法及策略详解 互联网   01-24 15:15:09   作者:佚名   我要评论 今天小编为大家带来的是CentOS7下的软件安装方法及策略详解:希望对大家安装Cent ...

  4. Tensorflow安装教程详解(图文详解,深度好文)

    Tensorflow安装教程详解(图文详解,深度好文) 前言 安装前的准备工作 关于python 关于Anaconda 开始使用Tensorflow 系统内配置Anaconda使用路径 Anacond ...

  5. Firewalld防火墙策略详解

    Firewalld防火墙策略详解 一.Firewalld firewalld防火墙是Centos7系统默认的防火墙管理工具,取代了之前的iptables防火墙,也是工作在网络层,属于包过滤防火墙. f ...

  6. Iptables防火墙策略详解

    Iptables防火墙策略详解 一.iptables Linux 系统的防火墙--netfilter/iptables IP信息包过滤系统,它实际上由两个组件netfilter 和 iptables组 ...

  7. Redis的淘汰策略详解

    接上一篇Redis的过期策略详解 Redis的过期策略详解 所谓的淘汰策略就是: 我们redis中的数据都没有过期,但是内存有大小,所以我们得淘汰一些没有过期的数据!! 那么怎么去淘汰了,我们上一篇讲 ...

  8. 【数字图像处理】三.MFC实现图像灰度、采样和量化功能详解

    本文主要讲述基于VC++6.0 MFC图像处理的应用知识,主要结合自己大三所学课程<数字图像处理>及课件进行讲解,主要通过MFC单文档视图实现显示BMP格式图片,并通过Bitmap进行灰度 ...

  9. Java多线程之线程池7大参数、底层工作原理、拒绝策略详解

    Java多线程之线程池7大参数详解 目录 企业面试题 线程池7大参数源码 线程池7大参数详解 底层工作原理详解 线程池的4种拒绝策略理论简介 面试的坑:线程池实际中使用哪一个? 1. 企业面试题 蚂蚁 ...

最新文章

  1. sql server 2008学习1–系统数据库
  2. Camel中的几个重要概念之Routes, RouteBuilders 和 Java DSL
  3. oracle pipelined返回值函数 针对数据汇总统计 返回结果集方法
  4. 为什么on用的时候会失效?
  5. php双引号解析漏洞
  6. Taro+react开发(38)注意请求接口的/
  7. Java什么时候提高境界支持async/await写法啊?
  8. SqlServe中使用EXEC @sql 来传递table变量
  9. JavaScript内建对象
  10. 从“运维”处谈OFO失败
  11. python-编程之美
  12. Windows系统遇到不能打开要写入的文件怎么办?----重启电脑即可
  13. Google 企业域名邮箱注册地址
  14. MSM8960处理器概述
  15. 网页视频下载mp4格式到本地
  16. iOS之深入探究动画渲染降帧
  17. android照片涂抹功能,android:照片涂画功能实现过程及原理详解
  18. 计算机常用术语中英对照
  19. 【计算机网络】网络层:虚拟专用网
  20. All the Vowels Please

热门文章

  1. 启动日志_Hybris服务器启动日志分析
  2. 使用Visual Studio(VS)开发Qt程序代码提示功能的实现
  3. An internal error occurred during: “AppXray Indexing
  4. Java 中的悲观锁和乐观锁的实现
  5. IPTABLES封闭和开放端口
  6. HDU 2289 Cup
  7. C++程序员必读的经典著作
  8. 【数据结构与算法】之深入解析“石子游戏VII”的求解思路与算法示例
  9. Git之深入解析如何使用Git的分布式工作流程与如何管理多人开发贡献的项目
  10. iOS之深入解析bitcode的功能与应用