处理数据集python脚本(处理自己制作的数据集)
import osclass BatchRename():'''批量重命名文件夹中的图片文件'''def __init__(self):self.path = './qiche1' # 表示需要命名处理的文件夹def rename(self):filelist = os.listdir(self.path) # 获取文件路径total_num = len(filelist) # 获取文件长度(个数)print(total_num)print(filelist)for file in filelist:# print(file)filelist1 = os.listdir(self.path + '/' + file)print(filelist1)i = 1 # 表示文件的命名是从1开始的for item in filelist1:if item.endswith('.jpg'): # 初始的图片的格式为jpg格式的(或者源文件是png格式及其# 他格式,后面的转换格式就可以调整为自己需要的格式即可)print(item)# print(self.path)src = os.path.join('./qiche1'+ '/'+file+'/'+item)print(src)dst = os.path.join('./qiche1'+ '/'+file+'/'+'qiche1_'+file+'_'+ str(i) + '.jpg') # 处理后的格式也为jpg格式的,当然这里可以改成png格式# dst = os.path.join(os.path.abspath(self.path), '0000' + format(str(i), '0>3s') + '.jpg') 这种情况下的命名格式为0000000.jpg形式,可以自主定义想要的格式try:os.rename(src,dst)print('converting %s to %s ...' % ( src,dst))i = i + 1except:continueprint('total %d to rename & converted %d jpgs' % (total_num, i))if __name__ == '__main__':demo = BatchRename()demo.rename()
2,数据集划分
import os
from shutil import copy
import randomdef mkfile(file):if not os.path.exists(file):os.makedirs(file)file = 'car/images'
flower_class = [cla for cla in os.listdir(file) if ".txt" not in cla]
mkfile('car/train')
for cla in flower_class:mkfile('car/train/'+cla)mkfile('car/val')
for cla in flower_class:mkfile('car/val/'+cla)split_rate = 0.1
for cla in flower_class:cla_path = file + '/' + cla + '/'images = os.listdir(cla_path)num = len(images)eval_index = random.sample(images, k=int(num*split_rate))for index, image in enumerate(images):if image in eval_index:image_path = cla_path + imagenew_path = 'car/val/' + clacopy(image_path, new_path)else:image_path = cla_path + imagenew_path = 'car/train/' + clacopy(image_path, new_path)print("\r[{}] processing [{}/{}]".format(cla, index+1, num), end="") # processing barprint()
print("processing done!")
处理数据集python脚本(处理自己制作的数据集)相关推荐
- IntelRealSense d415深度相机拍照制作数据集python脚本
IntelRealSense d415深度相机拍照制作数据集python脚本 最近想做一个阴影数据集,手上d415相机像素好一点,就用来调用拍照啦. 上源码: import pyrealsense2 ...
- python脚本对labelme标注的数据集进行镜面旋转扩充数据集
使用labelme做数据集标注效率不得不说非常感人,由此开始思考如何利用已经标注的数据集 参考如下脚本 编写python脚本对labelme标注的数据集进行左右/上下镜面翻转扩充数据集_Alex-Le ...
- Python脚本:聚类小分子数据集
聚类分子(Clustering molecules) 聚类是一种有价值的化学信息学技术,用于将大型化合物数据集合细分为单个小组相似化合物.其中一个优点是处理非常大的小分子数据集时特别有用.通常用于分析 ...
- 聚类小分子数据集(基于RDKit的Python脚本)
聚类分子(Clustering molecules) 聚类是一种有价值的化学信息学技术,用于将大型化合物数据集合细分为单个小组相似化合物.其中一个优点是处理非常大的小分子数据集时特别有用.通常用于分析 ...
- python执行命令并返回结果集_如何执行python脚本然后将结果存储为Power BI中的pandas数据集?...
我是Microsoft Power BI的新手,我甚至不确定我的问题在Power BI的上下文中是否有效 . 我已经知道如何使用Power BI连接python . 我也知道如何获取数据集(作为pan ...
- Python脚本制作exe程序超详细!
Python脚本制作exe程序 1 为什么要将python脚本打包成exe程序 2 制作exe程序 1 为什么要将python脚本打包成exe程序 Python具有丰富和强大的库,能够把用其他语言制作 ...
- python脚本批量生成雷达回波数据集
批量生成雷达回波数据集 目前,没有找到探地雷达回波图的开源数据集,鉴于实验成本限制,采用gprMax v3.1.5仿真生成. 这里参照两个博主: 链接1:https://blog.csdn.net/g ...
- python脚本制作—大漠插件: MoveTo指令鼠标不移动
python脚本制作-大漠插件: MoveTo指令鼠标不移动 问题提出: 在pycharm中使用大漠对象中的MoveTo命令移动鼠标,鼠标不移动. 问题解决: 重启电脑后自己不知道为什么就好了,就这么 ...
- python制作图片数据集_Pytorch自己加载单通道图片用作数据集训练的实例
pytorch 在torchvision包里面有很多的的打包好的数据集,例如minist,Imagenet-12,CIFAR10 和CIFAR100.在torchvision的dataset包里面,用 ...
最新文章
- 数据结构之直接插入排序
- 2011,我的IT我的梦
- linux无人值守安装
- PhoneGap 1.5版本 cordova.js 简析 3(转)
- go语言socket通信初试
- 【KVM系列06】Nova 通过 libvirt 管理 QEMU/KVM 虚机
- 请不要对我说“你要马上把这个小问题修改好”
- PCA(主成分分析)思想及实现
- 从.NET Core 3.1项目生成本地可执行文件
- keil4如何将c语言转换成汇编语言_Keil 中关于C语言编译生成汇编代码函数名规则...
- Python 使用Protobuf(struct模块)
- simotion基本功能手册_深入浅出西门子运动控制器:SIMOTION实用手册
- 视频教程-ASP.NET就业实例视频教程(1)基础入门——搭建网站开发环境教学视频-.NET
- 各个国家的市场分析(俄罗斯,白俄罗斯)
- 酷睿i7 1260p怎么样 i71260p参数
- 学习《可复制的领导力》有感
- 掌控者靶场第二章:WAF绕过
- 独家:海尔消金“重仓”医美,月放款量惊人
- new FileReader()
- ESP32 TM1637显示4位数码管
热门文章
- htmlselect保留上次选择内容_搬家买什么工具,搬家有什么技巧,搬家选择什么公司?...
- hun 暑期实训之打牌 cin与scanf的输入
- C-Wandering Robot 模拟
- ubuntu14.04设置sublime text3为默认文本编辑器
- Java 1.1.1字符串之子串
- 机器学习、深度学习需要哪些数学知识?✅
- PAT 乙级1014	福尔摩斯的约会(C语言)
- 《南溪的目标检测学习笔记》——COCO数据集的学习笔记
- 【干货】python多进程和多线程谁更快
- 创世纪游戏、黄金分割比