为啥要用tfrecord

使用tfrecord是为了更高效地读取数据,这种方式比较适合数据量大且数据集相对稳定的情况。tfrecord将数据存储成了二进制记录序列的格式,这格式比较对计算机的胃口,读取更高效一些。
如果只是训练一点点数据,没必要存成tfrecord,因为这样带来的效率提升不够显著。
如果数据集里面的样本和标签时常有变动,也不太适合用tfrecord格式。因为数据集中样本和标签经常变动,可能是因为对任务的目标定位不够明确、数据集不够干净。这些数据存储成图片格式,方便进行查看和必要的改动。但存储成tfrecord格式,人工查看就不是很方便了。若是数据集较为干净、且任务定义明确,只是数据量在不断增长,还是比较适合存储成tfrecord的。

怎么制作tfrecord呢?

感觉有些复杂,为啥呢?因为制作tfrecord,数据大部分要经过2步转换。如下图所示,想存入tfrecord的数据,不管是数值、字符串还是图片,都得先变成正规军tf.train.Feature格式的数据。然后多个由关键字(string类型)和对应tf.train.Feature组成的字典生成tf.Example, 然后再序列化成二进制字符串,存储到文件中,大功告成。
真是太复杂了,为啥不能只输入一个路径,然后tensorflow自己分析里面有啥,然后存到tfrecord呢?(白日做梦)
现在就来实现以下这个过程。

tensorflow2读取数据P4: tf.data.TFRecordDataset创建Dataset相关推荐

  1. Tensorflow读取数据-tf.data.TFRecordDataset

    tensorflow TFRecords文件的生成和读取方法 文章目录 tensorflow TFRecords文件的生成和读取方法 1. TFRecords说明 2.关键API 2.1 tf.io. ...

  2. TensorFlow tf.data 导入数据(tf.data官方教程) * * * * *

    原文链接:https://blog.csdn.net/u014061630/article/details/80728694 TensorFlow版本:1.10.0 > Guide > I ...

  3. tf.data官方教程 - - 基于TF-v2

    这是本人关于tf.data的第二篇博文,第一篇基于TF-v1详细介绍了tf.data,但是v1和v2很多地方不兼容,所以替大家瞧瞧v2的tf.data模块有什么新奇之处. TensorFlow版本:2 ...

  4. mnist 转换为record 使用tf data 转换 读取 训练

    原文链接: mnist 转换为record 使用tf data 转换 读取 训练 上一篇: js 数组 堆栈 和 buckets 效率 对比 下一篇: tf data 切换数据集 使用并行提高效率 参 ...

  5. Tensorflow数据预处理之tf.data.TFRecordDataset---TFRecords详解\TFRecords图像预处理

    目录 1.概述 2.预处理数据 2.1.常量定义 2.2.导入库 2.3.从train.txt文件中读取图片-标签对 2.4.预处理图片并保存 2.5.调用main函数 3.读取预处理后的数据 3.1 ...

  6. java解析tfrecord_TensorFlow高效读取数据的方法——TFRecord的学习

    摘要: ortmatplotlib.pyplotaspltimportcv2defshow_image(title,image):'''显示图片:paramtitle:图像标题:paramimage: ...

  7. python如何读取tfrecord_tensorflow学习笔记——高效读取数据的方法(TFRecord)

    关于TensorFlow读取数据,官网给出了三种方法: 供给数据(Feeding):在TensorFlow程序运行的每一步,让python代码来供给数据. 从文件读取数据:在TensorFlow图的起 ...

  8. tensorflow教程 开始——数据集:快速了解 tf.data

    参考文章:数据集:快速了解 数据集:快速了解 tf.data 从 numpy 数组读取内存数据. 逐行读取 csv 文件. 基本输入 学习如何获取数组的片段,是开始学习 tf.data 最简单的方式. ...

  9. tf.data 加载 pandas dataframes

    tf.data 加载 pandas dataframes code # -*- coding: utf-8 -*- """ Created on 2020/11/20 1 ...

最新文章

  1. Kong APIGW — Overview
  2. 【Android 逆向】整体加固脱壳 ( DexClassLoader 加载 dex 流程分析 | RawDexFile.cpp 分析 | dvmRawDexFileOpen函数读取 DEX 文件 )
  3. bmon:一个强大的网络带宽监视和调试工具
  4. C++学习之路 | PTA乙级—— 1048 数字加密 (20 分)(精简)
  5. 增值电信服务费是什么意思_增值电信业务IDC许可证要年检吗,流程是什么
  6. 客户端分析php代码,分享:一个简单的全网解析客户端代码。
  7. Lucene.Net 2.3.1开发介绍 —— 二、分词(一)
  8. 在阿里云容器服务上创建一个使用Redis的Python应用
  9. Django_3_路由
  10. 程序员面对分歧和难题应当具备的态度
  11. 芯片之路: 海思半导体前世今生
  12. 树莓派WiFi设置固定IP地址
  13. 动手学深度学习(四十三)——机器翻译及其数据构建
  14. 人脸识别技术全面总结
  15. python投票问题,程序列出在python中获得多数投票的候选人
  16. 德赛西威全球首发“Smart Solution”智能出行解决方案
  17. 有台服务可以干哪些好玩的事
  18. imx6ul使用官方SDK裸机及驱动包
  19. 80后程序员感慨中年危机,Java程序员最新职业规划,面试篇
  20. 涨粉29w,获赞超百万,小红书近期创作趋势是什么?

热门文章

  1. Mysql redo log 漫游
  2. python3一个中文3个字符_python3随机生成中文字符(随机生成两字或三字的名字)...
  3. 一点资讯CEO辞职:任旭阳接任 曾任百度公司副总裁
  4. 字符串数组的相互转换
  5. 2023年深信服、奇安信、360等大厂网络安全校招面试真题合集(附答案)
  6. oracle oem wls,Oracle OEM各种顾问功能
  7. 洛谷刷题C语言:Physics Problem、PARKING、Trol、信息学竞赛、POT
  8. 移动硬盘提示使用驱动器中的光盘之前需要将其格式化怎么办?
  9. 人工智能迟早灭了程序猿
  10. CAD异形图形的绘制