在采用随机梯度下降算法训练神经网络时,一般使用滑动平均模型会在一定程度上提高最终模型在测试数据上的表现。Tensorflow中提供了tf.train.ExponetialMovingAverage来实现滑动平均模型。在初始化ExponentialMovingAverage时,要提供一个衰减率decay,也可以提供一个steps用于动态改变衰减率。衰减率用于控制模型更新速度,ExponentialMovingAverage对每一个变量维护一个影子变量(shadow variable),这个影子变量的初始值就是相应变量的初始值,而每次运行变量更新时,影子变量的值会更新为:

shadow_variable = decay*shadow_variable+(1-decay)*variable

shadow_variable为影子变量,variable为待更新的变量,decay为衰减率。decay决定了模型更新的速度,decay越大模型越趋于稳定。在实际应用中decay一般设非常接近1(如0.999或0.9999),为使前期训练更快,还可以提供steps参数来动态设置decay。

decay = min{decay,   (1+steps)/(10+steps)}

实例如下:

import tensorflow as tf
#定义一个变量用于计算滑动平均, 这个变量的初始值为0,所有需要计算滑动平均的变量必须是实数型,所以这里定义为float
v1 = tf.Variable(0, dtype=tf.float32)
#这里step变量模拟神经网络中迭代的轮数,用于动态控制衰减率
step = tf.Variable(0,trainable=False)
#定义一个滑动平均的类(class),初始化时给定衰减率0.99,控制衰减率的变量step。
ema = tf.train.ExponentialMovingAverage(0.99, step)
#定义一个更新变量滑动平均的操作。这里需要给定一个列表,每次执行这个操作时,这个列表中的变量都会被更新。
maintain_averages_op = ema.apply([v1])
with tf.Session() as sess:
    init = tf.global_variables_initializer()
    sess.run(init)
    #通过ema.average(v1)获取滑动平均之后变量的取值。在初始化之后变量v1的值和v1的滑动平均都为0
    print(sess.run([v1, ema.average(v1)]))
    
    sess.run(tf.assign(v1,5))
    #更新v1的滑动平均值。衰减率为min{0.99, 1+step/10+step=0.1}=0.1,所以v1的滑动平均被更新为0.1*0+0.9*5=4.5
    sess.run(maintain_averages_op)
    print(sess.run([v1, ema.average(v1)]))
    
    sess.run(tf.assign(step, 10000))
    sess.run(tf.assign(v1, 10))
    #更新v1的滑动平均值,衰减率为0.99,所以v1的滑动平均被更新为0.99*4.5+0.01*10=4.555
    sess.run(maintain_averages_op)
    print(sess.run([v1, ema.average(v1)]))
    
    #再次更新滑动平均值,得到新的滑动平均值为0.99*4.555+0.01*10=4.60945
    sess.run(maintain_averages_op)
    print(sess.run([v1, ema.average(v1)]))

tensorflow--滑动平均模型相关推荐

  1. TensorFlow滑动平均模型

    指数加权平均算法的原理 TensorFlow中的滑动平均模型使用的是滑动平均(Moving Average)算法,又称为指数加权移动平均算法(exponenentially weighted aver ...

  2. tensorflow随笔-滑动平均模型

    随机梯度下降算法训练时,使用滑动平均模型 可以提高模型健壮性. 在Tensorflow中提供了tf.train.ExponentialMovingAverage来实现滑动平均模型.在初始化Expone ...

  3. 【TensorFlow】TensorFlow从浅入深系列之五 -- 教你详解滑动平均模型

    本文是<TensorFlow从浅入深>系列之第5篇 TensorFlow从浅入深系列之一 -- 教你如何设置学习率(指数衰减法) TensorFlow从浅入深系列之二 -- 教你通过思维导 ...

  4. tensorflow随机梯度下降算法使用滑动平均模型

    在采用随机梯度下降算法训练神经网络时,使用滑动平均模型可以提高最终模型在测试集数据上的表现.在Tensflow中提供了tf.train.ExponentialMovingAverage来实现滑动平均模 ...

  5. 浅谈tensorflow的指数衰减学习率、正则化、滑动平均模型

    指数衰减学习率使训练迭代更加有效: 学习率决定了每一次迭代训练过程优化神经网络数的幅度,学习率的正确选取对于训练的效率.和效果均有一定的影响,如果我们学习率设定过大,则会可能导致参数在极值两侧跳动,这 ...

  6. Tensorflow笔记之滑动平均模型

    为了使模型在测试数据上更健壮的方法------滑动平均模型.在采用随机梯度下降算法训练神经网络时,使用滑动平均模型在很多应用中都可以在一定程度上提高最终模型在测试训练数据上的表现. 在Tensorfl ...

  7. TensorFlow入门:滑动平均模型

    在TensorFlow中提供了tf.train.ExponentialMovingAverage 来实现滑动平均模型,在采用随机梯度下降算法训练神经网络时,使用其可以提高模型在测试数据上的健壮性(ro ...

  8. Tensorflow:滑动平均模型

    本文转载自:TensorFlow入门:滑动平均模型 在TensorFlow中提供了tf.train.ExponentialMovingAverage 来实现滑动平均模型,在采用随机梯度下降算法训练神经 ...

  9. Tensorflow详解(八)——滑动平均模型

    目录 1.目标: 2.python实现方法: 3.tensorflow计算步骤: 1.目标: 为了在采用随机梯度下降算法训练神经网络时提高最终模型在测试数据上的表现,Tensorflow提供了一种在变 ...

  10. tensorflow 3.滑动平均模型

    # import tensorflow as tf #定义一个变量用于计算滑动平均,这个变量的初始值为0,注意这里手动指定了变量的类型为tf.float32, # 因为所有需要计算滑动平均的变量必须是 ...

最新文章

  1. “另一个程序正在使用此文件,进程无法访问”的解决方法
  2. OpenStack 实现技术分解 (6) 通用库 — oslo_log
  3. python数据类型-Python语言基本数据类型
  4. Py之jieba:Python包之jieba包(中文分词最好的组件)简介、安装、使用方法之详细攻略
  5. ftp.listfiles()卡住,不报错
  6. 【python】解决:TypeError: can't send non-None value to a just-started generator
  7. html 列表点,HTML列表
  8. lighthouse_如何提高您的渐进式网络应用的Google Lighthouse得分(最高可达100分)
  9. signature=d5d679bcec778027f40bcf8a2796c61b,Processing damaged items using image data lift
  10. 【干货】用户画像和精准化平台系统实践.pdf(附下载链接)
  11. U盘windows无法格式化的解决办法
  12. 终极算法【3】——符号学派
  13. 关于淘宝自动登陆的尝试——神烦笔记
  14. 英语作文计算机80词九年级,英语作文80词左右初三带翻译
  15. IBM车库创新:为科技创新头号工程打造共创引擎
  16. 文献调研——存算一体的一些基础知识
  17. 博士生成长需要经历的7道门
  18. 蓝桥杯—切面条/大衍数列
  19. Android软件安全与逆向分析下载电子书pdf下载
  20. PC实现Win10/原生安卓双系统

热门文章

  1. CentOS7中:通过 lrzsz 命令来上传和下载文件
  2. 高等数学:第八章 多元函数的微分法及其应用(7)方向导数与梯度
  3. 利用C语言访问mysql
  4. 汇正财经:揭秘维权退费黑产,远离维权陷阱
  5. Windows系统安装Ubuntu虚拟机
  6. C++进行简单的图像处理
  7. PHP内存马技术研究与查杀方法总结
  8. 讯歌最新款服务器,苹果Apple Music“音乐回忆 2020”歌单已开始更新
  9. 案场来访登记管理系统,iPAD管理,优化案场登记流程,提升效率
  10. 计算机与用户交互的界面是什么,交互界面是什么