基本信息

CIFAR-10 是一个包含60000张图片的数据集。其中每张照片为32*32的彩色照片,每个像素点包括RGB三个数值,数值范围 0 ~ 255。

所有照片分属10个不同的类别,分别是 'airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck'

其中五万张图片被划分为训练集,剩下的一万张图片属于测试集。

下载数据集

打开下面的链接进入官网下载

http://www.cs.toronto.edu/~kriz/cifar.html

下载完成后先解压缩,之后会得到如下几个文件

data_batch_1 ~ data_batch_5 是划分好的训练数据,每个文件里包含10000张图片,test_batch 是测试集数据,也包含10000张图片。他们的结构是一样的,下面就用 data_batch_1 作为例子进行说明。

读取数据

import pickledef load_file(filename):with open(filename, 'rb') as fo:data = pickle.load(fo, encoding='latin1')return data

首先定义读取数据的函数,这几个文件都是通过 pickle 产生的,所以在读取的时候也要用到这个包。

这里面返回的data是一个字典,先看看这个字典里面有哪些键吧。

data = load_file('test_batch')
print(data.keys())

输出结果

dict_keys(['batch_label', 'labels', 'data', 'filenames'])

  • batch_label

  对应的值是一个字符串,用来表明当前文件的一些基本信息。  

  如果是 data_batch_1 这个文件,里面的值就是

training batch 1 of 5

  如果是 test_batch 这个文件,里面的值就是

testing batch 1 of 1

  • labels

  对应的值是一个长度为10000的列表,每个数字取值范围 0~9,代表当前图片所属类别

  • data

  10000 * 3072 的二维数组,每一行代表一张图片的像素值。(32*32*3=3072)

  • filenames

  长度为10000的列表,里面每一项是代表图片文件名的字符串。


batches.meta 文件可以用相同的方法读取,里面存的是一些基本信息。

  • num_cases_per_batch

  10000

  • label_names
['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']

  • num_vis

  3072

转载于:https://www.cnblogs.com/irran/p/cifar-10.html

CIFAR-10 dataset 的下载与使用相关推荐

  1. linux 升级内核为4.10,Linux Kernel 4.10.4 发布下载

    知名 Linux 内核维护员 Greg Kroah-Hartman 已经在邮件列表中宣布了 Linux 4.10 的第四个维护更新,并且建议所有 Linux 发行版用户更新至该最新稳定版内核. lkm ...

  2. 微软开发的网页浏览器-IE10(Internet Explorer 10)提供下载

    IE10浏览器是微软开发的网页浏览器,在IE9浏览器的基础上增强了CSS3解析及硬件加速功能,并也支持了HTML5.IE10浏览器在硬件加速.数据处理速度.网站页面打开速度上都有了提升,在页面处理和视 ...

  3. arcgis 9.3/10.2.2/10.5版本下载

    arcgis 10.2.2 下载地址: 链接:https://pan.baidu.com/s/1k8jLALQLENLbbeDpTzBfkg 提取码:zzgb arcgis 10.5 下载地址: 链接 ...

  4. Hibernate 3.6.10 jar包下载链接

    新手深知找免费的困难,在这分享Hibernate 3.6.10 jar包下载链接 不仅有3.6.10 , 好像 3.*都有吧 链接: https://sourceforge.net/projects/ ...

  5. Windows 10/11 官方下载工具 镜像制作U盘启动盘 快速安装

    要制作U盘启动盘用来安装 Win10/11 系统,请先准备一个U盘,且U盘至少有8GB空间.注意:该U盘上 的所有内容都将被删除,制作前请先备份U盘资料. 使用U盘作为安装Win10的介质,最常见的有 ...

  6. WebLogic 10.3.1 下载地址

    WebLogic 10.3.1 下载地址: Oracle WebLogic Server 10.3.1 + OEPE - Package Installer   单语言版带OEPE Microsoft ...

  7. Ubuntu 10.04环境下载编译Android-2.2.1 (froyo) 源代码 1/2

    应一个在电信做android开发的哥们要求,帮忙把Goole未在sdk中打包的API(即:mms彩信功能),打包到自己编译的sdk里面.偶 用了差不多5天+5夜的时间,虽然没有成功.但对于Ubuntu ...

  8. 云linux界面设计,开源企业级的UI设计语言Ant Design 3.10.2发布下载

    企业级的 UI 设计语言和 React 实现 Ant Design 3.10.2 发布下载了,支持跨平台,该版本主要进行 bug 修复.Ant Design 是蚂蚁金服开发与正在使用的一套企业级的前端 ...

  9. 行人检测-Caltech Pedestrian Dataset 数据集下载及格式转换

    Caltech Pedestrian Dataset 数据集 加理工(caltech)提供的数据集, 该数据集主要包括 训练集+测试集:seq格式的数据: 行人标签数据:vbb(video bound ...

  10. 红旗linux v11预览版下载,红旗 Linux 桌面系统发布 v11 预览版,1月10日开放下载

    近日,国产操作系统红旗 Linux 官网上线最新的红旗 Linux 桌面操作系统 v11 社区预览版,更新内容包括多项组件更新和全新的主题界面等. 据悉,最新的红旗 Linux 桌面系统 v11 版本 ...

最新文章

  1. mysql种default约束的语句_sql语句大全之SQL DEFAULT 约束
  2. Error: EACCES: permission denied, symlink
  3. python venv 复制_pythonenv的安装及迁移
  4. tkinter中的canvas的边框问题
  5. 简单实现支付密码输入框 By HL
  6. SQLite | Select 语句
  7. 细菌基因组基本概念(一)
  8. Module build failed: ReferenceError: Unknown plugin module-resolver specified
  9. php和python-python与php比较
  10. Atitit.编程语言and 自然语言的比较and 编程语言未来的发展
  11. 马尔科夫决策过程(MDP) : BlackJack (MC-Off Policy)
  12. 最新新游社iApp源码+后台对接的hybbs内核
  13. 极致CMS v1.7版本-一款完全开源,免授权商用,功能强大的PHP建站系统
  14. activity串行多实例会签
  15. fatal: unable to access ...: LibreSSL SSL_connnect: Connection reset by peer in connect to... :443
  16. linux换屏快捷键,Linux系统快捷键最全合集
  17. 什么是长连接?长连接、短连接、三次握手
  18. 2021-2027全球与中国可持续性蛋白质市场现状及未来发展趋势
  19. 设计师必备的PPT辅助神器-iSlide
  20. 1k文件夹快捷方式病毒清理

热门文章

  1. 大学计算机系学生,大学计算机专业学生自我介绍
  2. 【WebRTC---源码篇】(二)PeerConnectionFactory
  3. 颜色空间缩减color space reduction
  4. delphi报列表索引越界怎么处理_图解Elasticsearch索引机制,此篇带你领悟新世界...
  5. voms下的反射大师_VOMS旧版
  6. python输入代码如何清除_Bug清除手册-代码书写规范与基本使用(Python)
  7. 隐藏水滴屏的软件_屏下摄像头,实现这一全面屏终极方案有多难?
  8. 网络监控系统中如何选择工业交换机?
  9. 浅谈模拟光端机和数字光端机的区别?
  10. 【渝粤教育】 国家开放大学2020年春季 2710蔬菜栽培技术 参考试题