MNIST是一个入门级的计算机视觉数据集,它包含各种手写数字图片:

它包含60000张训练图片,10000张测试图片,,每张图片都代表0-9的数字。图片包含28像素X28像素。我们可以用一个数字数组来表示这张图片:

把这个数组展开成一个向量,长度是 28x28 = 784。如何展开这个数组(数字间的顺序)不重要,只要保持各个图片采用相同的方式展开,从这个角度来看,MNIST数据集的图片就是在784维向量空间里面的点。因此,在MNIST训练数据集中,mnist.train.images 是一个形状为 [60000, 784] 的张量,第一个维度数字用来索引图片,第二个维度数字用来索引每张图片中的像素点。在此张量里的每一个元素,都表示某张图片里的某个像素的强度值,值介于0和1之间。

相对应的MNIST数据集的标签是介于0到9的数字,用来描述给定图片里表示的数字。为了用于这个教程,我们使标签数据是"one-hot vectors"。 一个one-hot向量除了某一位的数字是1以外其余各维度数字都是0。所以在此教程中,数字n将表示成一个只有在第n维度(从0开始)数字为1的10维向量。比如,标签0将表示成([1,0,0,0,0,0,0,0,0,0,0])。因此, mnist.train.labels 是一个 [60000,784] 的数字矩阵。

Tensorflow提供了一个类来处理MNIST数据,该类会自动下载并转化MNIST数据格式,将数据从原始的数据包中解析成训练和测试神经网络时使用的格式。

from tensorflow.examples.tutorials.mnist import input_data

#载入MNIST数据集,前一个参数为数据存放路径,后一个参数表示one-hot vectors

mnist = input_data.read_data_sets('set your path',one_hot=True)

print('Training data size',mnist.train.num_examples)

print('Validating data size',mnist.validation.num_examples)

print('Testing data size',mnist.test.num_examples)

print('Example training data',mnist.train.images[0])

print('Example training data label',mnist.train.labels[0])

input_data.read_data_sets函数将MNIST数据集分为train、validation和test,其中train有55000张图片,validation有5000,两者组成训练集,而test有10000张图片。因为神经网络的输入是一个特征向量,所以将一张二维图片的像素矩阵放到一个一维数组中可以方便Tensorflow将图片的像素矩阵提供给神经网络的输入层。像素矩阵中元素的值域为[0,1],它代表了颜色的深浅。其中0表示白色背景,1则为黑色前景。此外,为方便使用随机梯度下降算法,input_data.read_data_sets函数生成的类还提供mnist.train.next_batch函数,以从训练数据中读取一小部分作为训练batch。

batch_size = 100

#从train中取出100个训练数据

xs,ys = mnist.train.next_batch(batch_size)

#X为100*784,Y为100*10

print('X shape: ',xs.shape)

print('Y shape: ',ys.shape)

怎么改mnist数据的标签_MNIST数据处理相关推荐

  1. 怎么改mnist数据的标签_【Pytorch】多个数据集联合读取

    深度学习好比炼丹,框架就是丹炉,网络结构及算法就是单方,而数据集则是原材料.现在世面上很多炼丹手册都是针对单一数据集进行炼丹,有了这些手册我们就能够很容易进行炼丹,但为了练好丹,我们常常收集各种公开的 ...

  2. 二、如何保存MNIST数据集中train和test的图片?

    如何保存MNIST数据集中train和test的图片? 介绍一种非诚神奇的图片保存方法,尤其是利用字典-format-结合来用,创建保存路径,这是一种史上很难用到的一种方法,哈哈哈哈,有点吹牛皮,不说 ...

  3. 在浏览器中进行深度学习:TensorFlow.js (四)用基本模型对MNIST数据进行识别

    2019独角兽企业重金招聘Python工程师标准>>> 在了解了TensorflowJS的一些基本模型的后,大家会问,这究竟有什么用呢?我们就用深度学习中被广泛使用的MINST数据集 ...

  4. MNIST数据集合在PaddlePaddle环境下使用简单神经网络识别效果

    简 介: 通过PaddlePaddle构造的简单神经网络对于MNIST数据库进行实验,可以看到使用普通的稠密网络,便可以达到很高的识别效果.训练结果存在一定的随机性.这取决于训练其实的条件.由于在Pa ...

  5. tensorflow学习笔记——使用TensorFlow操作MNIST数据(1)

    续集请点击我:tensorflow学习笔记--使用TensorFlow操作MNIST数据(2) 本节开始学习使用tensorflow教程,当然从最简单的MNIST开始.这怎么说呢,就好比编程入门有He ...

  6. TensorFlow学习笔记(二):快速理解Tutorial第一个例子-MNIST机器学习入门 标签: 机器学习SoftmaxTensorFlow教程 2016-08-02 22:12 3729人阅

    TensorFlow学习笔记(二):快速理解Tutorial第一个例子-MNIST机器学习入门 标签: 机器学习SoftmaxTensorFlow教程 2016-08-02 22:12 3729人阅读 ...

  7. Python 数据分析三剑客之 Pandas(八):数据重塑、重复数据处理与数据替换

    CSDN 课程推荐:<迈向数据科学家:带你玩转Python数据分析>,讲师齐伟,苏州研途教育科技有限公司CTO,苏州大学应用统计专业硕士生指导委员会委员:已出版<跟老齐学Python ...

  8. 下载MNIST数据集并使用python将数据转换成NumPy数组(源码解析)

    下载MNIST数据集并使用python将数据转换成NumPy数组 首先来分析init_mnist函数 接下来继续分析load_mnist函数 实现数据集转换的python脚本的代码 显示MNIST图像 ...

  9. 『为金融数据打标签』「2. 元标签方法」

    本文有 6161 字,20 图表截屏 建议阅读 32 分钟 0 引言 本文是 AFML 系列的第五篇 金融数据类型 从 Tick 到 Bar 基于事件采样 三隔栏方法 元标签方法 要构建一个模型来决定 ...

最新文章

  1. python字符照片_python图片转字符图片
  2. SWFUpload上传
  3. excel vba 使用mschart_使用VBA时不妨借力Excel催化剂的能力,开发更加轻松便捷
  4. SpringBoot启动流程分析(四):IoC容器的初始化过程
  5. DevExpress GridControl 后台设置列
  6. Java Character.UnicodeBlock of()方法与示例
  7. angular8多选框实现点击整行任意位置<tr>就可以选中多选框
  8. Java作业-数据库
  9. 从零开始学习音视频编程技术(四) FFMPEG的使用
  10. ipad 计算机连接网络设置方法,iPad Air怎么设置上网?苹果平板常用的上网方法图解...
  11. 在PPAPI插件中创建本地窗口
  12. ESXI安装威联通NAS系统
  13. ABBYY软件对PDF文本审阅操作之盖章
  14. mac电脑用计算机名共享打印机,MAC与Windows7共享打印机的设置方法
  15. html画布时钟添加背景图,用HTML5 Canvas 实现的 时钟
  16. 雷诺手表日历怎么修改?雷诺手表怎么调日期?
  17. 【Python百日基础系列】Day03 - Python 数据类型
  18. 这个代码很神秘自用(别点开,你看不明白的)
  19. File类如何获取文件后缀名
  20. Spark 概述以及与Hadoop的关系

热门文章

  1. IT行业紧缺职位引领高薪行情
  2. range函数python范围_python的range函数与切片操作符
  3. 明年起无CDN牌照的CDN服务商将禁止提供服务
  4. 学计算机大一新生在暑假的准备
  5. (附源码)springboot+mysql+基于javaweb的课堂考勤系统设计与实现 毕业设计142335
  6. 苹果手机怎么强制重启
  7. mybatis 乐观锁实现
  8. Cubietruck开发板折腾009:升级apt后的故障解决
  9. [笔试] 2016校招 中国银行校招(信息科技岗位)笔试+面试+收到体检
  10. 最难的IB课程为什么含金量最高?