这是kaggle上的一个英文大写字母手写数据集:A-Z Handwritten Alphabets

  • 只包含大写字母,图片尺寸为 28 × 28 28\times28 28×28 ,每个字母都放置在中心 20 × 20 20\times20 20×20 的区域。
  • 以灰度图的形式存储。
  • csv 文件一行的第一列为类别,后续 28 × 28 = 784 28\times28=784 28×28=784 列为像素值。

下面的代码展示将 csv 文件转换成图片并保存在结构化文件夹里:

import os
import numpy as np
import pandas as pd
import cv2dataset_dir = f'.../archive/A_Z Handwritten Data'def csv2img(dataset):for row in range(len(dataset)):line = dataset.iloc[row]save_dir = os.path.join(dataset_dir, chr(ord('A') + line[0]))os.makedirs(save_dir, exist_ok=True)img = line[1:].valuesimg_np = 255 - np.array(img.reshape((28, 28)), dtype=np.uint8)cv2.imwrite(os.path.join(save_dir, f'{i}.png'), img_np)if __name__ == '__main__':data = pd.read_csv(os.path.join(dataset_dir, 'A_Z Handwritten Data.csv'))csv2img(data)

fertig!

【数据集】英文手写字母数据集处理相关推荐

  1. 手写字母数据集转换为.pickle文件

    首先是数据集,我上传了相关的资源,https://download.csdn.net/download/fanzonghao/10566701 转换代码如下: import numpy as np i ...

  2. NIN模块tensorflow实现和一个自己制作的手写字母数据集

    NIN层 简介: 我们提出了一种新型的深度网络结构,称为"Network In Network"(NIN),它可以增强模型在感受野(receptive field)内对局部区域(l ...

  3. matlab手写字母识别,一种基于MATLAB的手写字母的神经网络识别方法

    文章编号 :1009 - 671X(2001) 10 - 0028 - 03 一种基于 MATLAB 的手写字母的神经网络识别方法 邓铭辉 ,孙 枫 ,张 志(哈尔滨工程大学 自动化学院 ,黑龙江 哈 ...

  4. 最大的英文手写数据集——IAM- ondb 简介、下载、读取、使用、分割及深度学习实战

    前言:最近在做sketch相关的,接触到一个很经典的英文手写数据集IAM,本文详细介绍一下IAM的下载.读取.使用.以及深度学习项目实战. 目录 简介 数据格式 读取 class 实例化应用举例 下载

  5. 基于tensorflow、keras利用emnist数据集构建CNN卷积神经网络进行手写字母识别

    EMNIST 数据集是一个包含手写字母,数字的数据集,它具有和MNIST相同的数据格式.The EMNIST Dataset | NIST 引用模块介绍: import tensorflow as t ...

  6. python手写英文识别_pytorch三层全连接层实现手写字母识别方式

    先用最简单的三层全连接神经网络,然后添加激活层查看实验结果,最后加上批标准化验证是否有效 首先根据已有的模板定义网络结构SimpleNet,命名为net.py import torch from to ...

  7. DL之CNN:自定义SimpleConvNet【3层,im2col优化】利用mnist数据集实现手写数字识别多分类训练来评估模型

    DL之CNN:自定义SimpleConvNet[3层,im2col优化]利用mnist数据集实现手写数字识别多分类训练来评估模型 目录 输出结果 设计思路 核心代码 更多输出 输出结果 设计思路 核心 ...

  8. 教你使用TensorFlow2对阿拉伯语手写字符数据集进行识别

    @Author:Runsen 在本教程中,我们将使用 TensorFlow (Keras API) 实现一个用于多分类任务的深度学习模型,该任务需要对阿拉伯语手写字符数据集进行识别. 数据集下载地址: ...

  9. 智科模式识别期末大课设:多种方法对数据集进行手写数字识别(数据集:MINIST)

    0结课作业内容 (1)程序编写及报告. 请大家下载70000个样本的MNIST数据集("手写体数字70000.zip",28*28像素),60000个用于训练,10000个用于测试 ...

  10. 神经网络——实现MNIST数据集的手写数字识别

    由于官网下载手写数字的数据集较慢,因此提供便捷下载地址如下 手写数字的数据集MNIST下载:https://download.csdn.net/download/gaoyu1253401563/108 ...

最新文章

  1. pr 文件结构不一致_建筑工程合同与招投标文件不一致,工程结款应该以哪份文件为主?...
  2. Python + Selenium 自动发布文章(二):简书
  3. python3.8.2汉化包-Python3.8.2中文版 32/64位 官方最新版
  4. Servlet 异常处理
  5. 30种优化查询速度的方法
  6. C++ 命名空间 实战(一)嵌套的命名空间
  7. 皖南医学院2020C语言试卷,安徽继续教育在线 - 皖南医学院
  8. 成功解决TypeError: unsupported operand type(s) for +: 'dict_items' and 'list'
  9. [Android Pro] 通过IMSI判断手机是移动、联通、电信
  10. 深入理解 Android 的 IPC 机制--------Binder
  11. FatFsVersion0.01源码分析
  12. ping 工具开发日记(1)
  13. EFM32片内外设--TFT 汉字字库
  14. 盘点国外名企的管理奇招
  15. 格创东智获《互联网周刊》2020工业互联网平台TOP12 解决方案提供商TOP16
  16. WTL入门(二) WTL简介
  17. 前端程序员发展必备工具
  18. 室内定位算法_【好设计论文】基于行人航迹推算的室内定位算法研究
  19. 【唐老狮】C#——转义字符
  20. 集成学习 Adaboost(python实现)

热门文章

  1. 专注一件产品,可以产生复利那样巨大的威力
  2. 计算机中 amp 是什么符号,Excel中的 quot;quot; amp;符号都代表什么怎么用?还有别的逻辑运算符号吗?...
  3. 为什么要买保险,并且如何配置保险,以及家庭保险的配置
  4. 留学生日常英语51~55
  5. 如何让联想拯救者Y9000P的大小写热键切换不显示?方法很简单。下载 Lenovo—hotkeys ,打开OSD图标,再关上就解决了。
  6. flutter Chip 组件
  7. 创业宝典:“百万习惯”成就你创业梦想
  8. One ID中的核心技术ID-Mapping究竟是怎么实现的?by彭文华
  9. Linux:awk命令详解
  10. 情绪版(Mood board)---衣服如何搭配的好工具