TensorFlow笔记-08-过拟合,正则化,matplotlib 区分红蓝点

首先提醒一下,第7讲的最后滑动平均的代码已经更新了,代码要比理论重要
今天是过拟合,和正则化,本篇后面可能或更有兴趣,因为涉及到 matplotlib 可视化图形了,而不是纯数据

  • 过拟合:神经网络模型在训练集上的准确率比较高在新的数据进行预测或分类时准确率较低,说明模型泛华能力差
  • 正则化:在损失函数中给每个参数w加上权重,引入模型辅助度指标,从而抑制模型噪声,减小过拟合

使用正则化后,损失函数 loss 变为两项之和:

loss = loss(y与y_) + REGULARIZER*loss(w)

其中,第一项是预测结果与标准答案之间的差距,如之前讲过的交叉熵,均方误差等;第二项是正则化计算结果
看过我爬虫教程的可能了解这个正则 re,re就是这个 regularize

  • 正则化计算方法:
    (1)L1正则化:lossL1 = Σi |wi|
    用 Tensorflow 函数表示:loss(w) = tf.contrib.layers.11_regularizer(REGULARIZER)(w)
    (2)L2正则化:lossL2 = Σi |wi|2
    用 Tensorflow 函数表示:loss(w) = tf.contrib.layers.12_regularizer(REGULARIZER)(w)

  • 用 Tensorflow 函数实现正则化:
    tf.add_to_collection(‘losses’, tf.contrib.layers.12_regularizer(regularizer)(w)
    losss = cem + tf.add_n(tf.get_collection(‘losses’))

例如:
    用 300 个符合正态分布的点 X[x0, x1]作为数据集,根据点 X[x0, x1] 计算生成标注 Y_,将数据集标注为红色点和蓝色点。
    标注规则:当 x02 + x12 >= 2 时,y_=0,标注为蓝色
    我们分别用无正则化和正则化两种方法,拟合曲线,把红色点和蓝色点。在实际分类时,如果前向传播输出的预测值y接近1则为红色点概率越大,接近0则为蓝色点概率越大,输出的预测值y为0.5是红蓝点概率分界线
    在本例子中,我们使用了之前未用过的模块与函数

  • matplotlib 模块:Python 中可视化工具模块,实现函数可视化

  • matplotlib 的安装

    • 1.在 PyCharm 设置中添加就可以:

    • 2.终端安装指令:

      pip install matplotlib

  • 函数 plt.scatter ():利用指定颜色实现点 (x,y) 的可视化
    plt.scatter (x 坐标,y 坐标,c=“颜色”)
    plt.show()

  • 收集规定区域内所有的网格坐标点:
    # 找到规定区域以步长为分辨率的行列网格坐标点
    xx,yy = np.mgrid[起:止:步长,起:止:步长]
    # 收集规定区域内所有的网格坐标点
    grid = np.c_[xx.ravel(), yy.ravel()]

  • plt.contour() 函数:告知 x,y 坐标和各点高度,用 levels 指定高度的点瞄上颜色
    plt.contour (x 轴坐标值,y 轴坐标值,该点的高度,levels=[等高线高度])
    plt.show()
    本例代码如下:

#coding:utf-8
#导入模块,生成模拟数据集
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as pltBATCH_SIZE = 30
seed = 2
# 基于 seed 产生随机数
rdm = np.random.RandomState(seed)
#随机数返回行列的矩阵,表示组坐标点(x0, x1)作为输入数据集
X = rdm.randn(300,2)
#从X这个300行2列的矩阵中取出一行,判断如果两个坐标的平方和小于2,给Y赋值1,其余值0
#作为输入数据集的标签(正确答案)
Y_ = [int(x0*x0 + x1*x1<2) for (x0,x1) in X]
#遍历Y中的每个元素,1赋值 'red' 其余赋值为 'blue',这样可视化显示时人可以直观区分
Y_c = [['red' if y else 'blue'] for y in Y_]
#对数据集X和标签Y进行shap整理,第一个元素为-1表示,随第二个参数计算得到
#第二个元素表示多少列,把X郑磊为n行2列,把Y整理为n行1列
X = np.vstack(X).reshape(-1,2)
Y_ = np.vstack(Y_).reshape(-1,1)print(X)
print(Y_)
print(Y_c)# 用plt.scatter画出数据集X各行中第0列元素和第1列元素的点即各行的(x0,x1),
# 用各行Y_c对应的值表示颜色(c是color的缩写)
plt.scatter(X[:,0], X[:,1],c=np.squeeze(Y_c))
plt.show()# 定义神经网络的输入,参数和输出,定义前向传播过程
def get_weight(shape, regularizer):w = tf.Variable(tf.random_normal(shape), dtype=tf.float32)tf.add_to_collection('losses', tf.contrib.layers.l2_regularizer(regularizer)(w))return wdef get_bias(shape):b = tf.Variable(tf.constant(0.01, shape=shape))return bx = tf.placeholder(tf.float32, shape=(None, 2))
y_ = tf.placeholder(tf.float32, shape=(None, 1))w1 = get_weight([2,11], 0.01)
b1 = get_bias([11])
y1 = tf.nn.relu(tf.matmul(x, w1)+b1)w2 = get_weight([11,1], 0.01)
b2 = get_bias([1])
y = tf.matmul(y1, w2)+b2 #输出层不过激活# 定义损失函数
loss_mse = tf.reduce_mean(tf.square(y-y_))
loss_total = loss_mse + tf.add_n(tf.get_collection('losses'))# 定义反向传播方法:不含正则化
train_step = tf.train.AdadeltaOptimizer(0.0001).minimize(loss_mse)with tf.Session() as sess:init_op = tf.global_variables_initializer()sess.run(init_op)STEPS = 40000for i in range(STEPS):start = (i*BATCH_SIZE)%300end = start + BATCH_SIZEsess.run(train_step,feed_dict={x:X[start:end],y_:Y_[start:end]})if i % 2000 == 0:loss_mse_v = sess.run(loss_mse,feed_dict={x:X,y_:Y_})print("Atfer %d steps, loss is:%f" %(i, loss_mse_v))#xx在-3到3之间以步长为0.01,yy在-3到3之间以步长0.01,生成二维码网格坐标点xx,yy = np.mgrid[-3:3:.01, -3:3:.01]#将xx,yy拉直,并合成一个2列的矩阵,得到一个网格的集合grid = np.c_[xx.ravel(),yy.ravel()]#将网格坐标点喂入神经网络,probs为输出probs = sess.run(y, feed_dict={x:grid})# probs 的shape调整成xx的样子probs = probs.reshape(xx.shape)print("w1:\n",sess.run(w1))print("b1:\n", sess.run(b1))print("w2:\n", sess.run(w2))print("b2:\n", sess.run(b2))plt.scatter(X[:,0],X[:,1], c=np.squeeze(Y_c))
plt.contour(xx,yy,probs,levels=[.5])
plt.show()#定义反向传播方法:包含正则化
train_step = tf.train.AdamOptimizer(0.0001).minimize(loss_total)with tf.Session() as sess:init_op = tf.global_variables_initializer()sess.run(init_op)STEPS = 40000for i in range(STEPS):start = (i*BATCH_SIZE)%300end = start + BATCH_SIZEsess.run(train_step, feed_dict={x:X[start:end],y_:Y_[start:end]})if i %2000 ==0:loss_v = sess.run(loss_total, feed_dict={x:X,y_:Y_})print("Atfer %d steps, loss is:%f" % (i, loss_v))# xx在-3到3之间以步长为0.01,yy在-3到3之间以步长0.01,生成二维码网格坐标点xx, yy = np.mgrid[-3:3:.01, -3:3:.01]# 将xx,yy拉直,并合成一个2列的矩阵,得到一个网格的集合grid = np.c_[xx.ravel(), yy.ravel()]# 将网格坐标点喂入神经网络,probs为输出probs = sess.run(y, feed_dict={x: grid})# probs 的shape调整成xx的样子probs = probs.reshape(xx.shape)print("w1:\n", sess.run(w1))print("b1:\n", sess.run(b1))print("w2:\n", sess.run(w2))print("b2:\n", sess.run(b2))plt.scatter(X[:, 0], X[:, 1], c=np.squeeze(Y_c))
plt.contour(xx, yy, probs, levels=[.5])
plt.show()

运行过程可能较慢,请耐心等待
注意:红字提示不是报错,只是提示,现在可以不管

运行结果

主要看输出的三张图:

下面再说一篇每张图的意思:
第一张图:
    只有红蓝点,对随机的点进行数据集可视化,标注规则:当 x02 + x12 >= 2 时,y_=0,标注为蓝色

第二张图:
    代码的注释中说明已经很详细了,就是执行没有正则化训练过程,将红蓝点分开的效果
显然我这个有点失败,但主要就是为了突出第三张图片的效果

第三张图:
执行包含正则化训练过程,将红蓝点分开的效果

更多文章链接:Tensorflow 笔记


- 本笔记不允许任何个人和组织转载

TensorFlow笔记-08-过拟合,正则化,matplotlib 区分红蓝点相关推荐

  1. 20180929 北京大学 人工智能实践:Tensorflow笔记08

    https://www.bilibili.com/video/av22530538/?p=28 ---------------------------------------------------- ...

  2. 深度学习--TensorFlow(7)拟合(过拟合处理)(数据增强、提前停止训练、dropout、正则化、标签平滑)

    目录 拟合 1.拟合情况 2.抵抗过拟合方法 过拟合处理(防止过拟合): 一.数据增强 1.设置图像生成器 2.载入图片 3.图像转三维数据 4.三维转四维 5.生成图片(用图像生成器) 代码 二.提 ...

  3. 吴恩达《机器学习》学习笔记六——过拟合与正则化

    吴恩达<机器学习>学习笔记六--过拟合与正则化 一. 过拟合问题 1.线性回归过拟合问题 2.逻辑回归过拟合问题 3.过拟合的解决 二. 正则化后的代价函数 1.正则化思想 2.实际使用的 ...

  4. 人工智能实践:TensorFlow笔记学习(四)—— 神经网络优化

    神经网络优化  大纲 4.1 损失函数 4.2 学习率 4.3 滑动平均 4.4 正则化 4.5 神经网络搭建八股 目标 掌握神经网络优化方法 4.1 损失函数 神经元模型:用数学公式表示为:,f为激 ...

  5. 推荐系统实践读书笔记-08评分预测问题

    推荐系统实践读书笔记-08评分预测问题 本书到目前为止都是在讨论TopN推荐,即给定一个用户,如何给他生成一个长度为N的推荐列表,使该推荐列表能够尽量满足用户的兴趣和需求.本书之所以如此重视TopN推 ...

  6. 人工智能实践:TensorFlow笔记学习(五)—— 全连接网络基础

    MNIST数据集输出手写数字识别准确率 大纲 5.1 MNIST数据集 5.2 模块化搭建神经网络 5.3 手写数字识别准确率输出 目标 利用MNIST数据集巩固模块化搭建神经网路的八股,实践前向传播 ...

  7. tensorflow笔记:多层LSTM代码分析

    tensorflow笔记系列:  (一) tensorflow笔记:流程,概念和简单代码注释  (二) tensorflow笔记:多层CNN代码分析  (三) tensorflow笔记:多层LSTM代 ...

  8. Tensorflow 笔记 XIII——“百无聊赖”:深挖 mnist 数据集与 fashion-mnist 数据集的读取原理,经典数据的读取你真的懂了吗?

    文章目录 数据集简介 Mnist 出门右转 Fashion-Mnist 数据集制作需求来源 写给专业的机器学习研究者 获取数据 类别标注 读取原理 原理获取 TRAINING SET LABEL FI ...

  9. tensorflow笔记:多层CNN代码分析

    tensorflow笔记系列:  (一) tensorflow笔记:流程,概念和简单代码注释  (二) tensorflow笔记:多层CNN代码分析  (三) tensorflow笔记:多层LSTM代 ...

  10. 人工智能实践:TensorFlow笔记学习(八)—— 卷积神经网络实践

    大纲 7.1  复现已有的卷积神经网络 7.2  用vgg16实现图片识别 目标 掌握复现已有网络,用vgg16实现图片识别 7.1  复现已有的卷积神经网络 VGGNet是Karen simonya ...

最新文章

  1. Hi3516A开发--使用root模式登录Ubuntu14.04
  2. 盘一盘2021全球流量最高的网站~
  3. ThinkPHP3.2 实现阿里云OSS上传文件
  4. python中字符串格式化的形式_Python中format函数字符串格式化入门
  5. ctfshow-萌新-web10( 利用命令执行漏洞获取网站敏感信息)
  6. 浅谈2011年上半年Java游戏领域动态
  7. shp地图如何导入奥维地图手机_如何将CAD图导入到手机版奥维互动地图
  8. ffmpeg解析出的视频参数PAR,DAR,SAR的意义
  9. 广东省汕尾市谷歌卫星地图下载
  10. codeforces 416C C. Booking System(贪心)
  11. 计算机应用研究被ei检索吗,SCI/EI检索的国内计算机期刊
  12. echarts 圆环图中间插图或文字
  13. 真机调试钉钉微应用步骤
  14. 飞控地面站MissionPlanner界面修改------MainV2界面添加控件并动态刷新数据
  15. IBM——国际商业机器公司
  16. 为什么一般公司面试结束后会说「回去等消息」,而不是直接告诉面试者结果?
  17. HDU 1686 [KMP]
  18. 【量化笔记】Markowitz模型的python实现
  19. intellij IDE 快捷键(windows)
  20. cascode电流镜

热门文章

  1. 批改easyui datebox默认日期格式
  2. 180225——寒假总结
  3. 【18NOIP普及组】龙虎斗
  4. HDU_oj_2044 一只小蜜蜂
  5. 多线程下载RXdownload的使用
  6. 物流业对经济社会的贡献率看物流现状
  7. 慢性病地理信息系统技术分享
  8. bert中的sep_关于bert+lstm+crf实体识别训练数据的构建
  9. 使用libsvm对政府网站访问数据的分析和预测
  10. 关于HLS之m3u8小结