Python读取并解析 bmp 文件
介绍
由于要开始学习图像方面的知识,读写图片是难免的。对图片的结构有一定的了解对理解图片存储还是很有帮助的。由于实验的代码是用 python 写的,因此读取文件就直接使用 python 了,虽然用 C 来读写文件更有效率,但我个人感觉 python 也没有很慢。下面来看一下bmp 文件结构和读取 bmp 文件的过程。
bmp 文件结构
bmp文件头(bmp file header):提供文件的格式、大小等信息
位图信息头(bitmap information):提供图像数据的尺寸、位平面数、压缩方式、颜色索引等信息
调色板(color palette):可选,如使用索引来表示图像,调色板就是索引与其对应的颜色的映射表
位图数据(bitmap data):就是图像数据
用表格形式可以表示为:
首先来看文件头的信息(14字节):
然后是位图信息图(40字节):
一般情况下,到这里我们就可以得到这个图片的基本信息了。由于调色板是不确定的,而且现在的bmp图片一般都没有调色板信息(因为24位),所以忽略第三个。
所以,思路还是很简单的。先读取 54 字节的头文件,利用读取的图片宽和高信息,对后面的数据进行读取。
注意:由于是以二进制形式进行读取的,因此,需要注意存储方式。bmp 文件的存储方式是小端方式,读取的时候也要使用小端法进行解析
Python 代码
# -*- coding: UTF-8 -*-
from struct import unpack# 读取并存储 bmp 文件
class ReadBMPFile :def __init__(self, filePath) :file = open(filePath, "rb")# 读取 bmp 文件的文件头 14 字节self.bfType = unpack("<h", file.read(2))[0] # 0x4d42 对应BM 表示这是Windows支持的位图格式self.bfSize = unpack("<i", file.read(4))[0] # 位图文件大小self.bfReserved1 = unpack("<h", file.read(2))[0] # 保留字段 必须设为 0 self.bfReserved2 = unpack("<h", file.read(2))[0] # 保留字段 必须设为 0 self.bfOffBits = unpack("<i", file.read(4))[0] # 偏移量 从文件头到位图数据需偏移多少字节(位图信息头、调色板长度等不是固定的,这时就需要这个参数了)# 读取 bmp 文件的位图信息头 40 字节self.biSize = unpack("<i", file.read(4))[0] # 所需要的字节数self.biWidth = unpack("<i", file.read(4))[0] # 图像的宽度 单位 像素self.biHeight = unpack("<i", file.read(4))[0] # 图像的高度 单位 像素self.biPlanes = unpack("<h", file.read(2))[0] # 说明颜色平面数 总设为 1self.biBitCount = unpack("<h", file.read(2))[0] # 说明比特数self.biCompression = unpack("<i", file.read(4))[0] # 图像压缩的数据类型self.biSizeImage = unpack("<i", file.read(4))[0] # 图像大小self.biXPelsPerMeter = unpack("<i", file.read(4))[0]# 水平分辨率self.biYPelsPerMeter = unpack("<i", file.read(4))[0]# 垂直分辨率self.biClrUsed = unpack("<i", file.read(4))[0] # 实际使用的彩色表中的颜色索引数self.biClrImportant = unpack("<i", file.read(4))[0] # 对图像显示有重要影响的颜色索引的数目self.bmp_data = []if self.biBitCount != 24 :print("输入的图片比特值为 :" + str(self.biBitCount) + "\t 与程序不匹配")for height in range(self.biHeight) :bmp_data_row = []# 四字节填充位检测count = 0for width in range(self.biWidth) :bmp_data_row.append([unpack("<B", file.read(1))[0], unpack("<B", file.read(1))[0], unpack("<B", file.read(1))[0]])count = count + 3# bmp 四字节对齐原则while count % 4 != 0 :file.read(1)count = count + 1self.bmp_data.append(bmp_data_row)self.bmp_data.reverse()file.close()# R, G, B 三个通道self.R = []self.G = []self.B = []for row in range(self.biHeight) :R_row = []G_row = []B_row = []for col in range(self.biWidth) :B_row.append(self.bmp_data[row][col][0])G_row.append(self.bmp_data[row][col][1])R_row.append(self.bmp_data[row][col][2])self.B.append(B_row)self.G.append(G_row)self.R.append(R_row)
这里,读取完文件后,我又将 R、G、B 三个通道的数值分出来了。主要是为了方便后续的处理,毕竟读取文件的目的是为了后面对图像的处理。
这是一个类,外部代码可以这样调用:
import numpy as np
import sys
from ReadBMPFile import ReadBMPFile
import cv2
# 命令行传入的文件路径
filePath = sys.argv[1]
# 读取 BMP 文件
bmpFile = ReadBMPFile(filePath)
# R, G, B 三个通道 [0, 255]
R = bmpFile.R
G = bmpFile.G
B = bmpFile.B
# 显示图像
b = np.array(B, dtype = np.uint8)
g = np.array(G, dtype = np.uint8)
r = np.array(R, dtype = np.uint8)
merged = cv2.merge([b, g, r]) #合并R、G、B分量 默认顺序为 B、G、R
cv2.imshow("Merged",merged)
参考文献
- BMP文件格式详解(BMP fileformat)
- 简单bmp图片处理工具——python实现
Python读取并解析 bmp 文件相关推荐
- python读取xml_python解析xml文件
加载和读取xml文件 import xml.dom.minidom doc = xml.dom.minidom.parse(xmlfile) 获取xml文档对象(对子节点和节点node都适用) roo ...
- Python读取多个excel文件(删除字段、数据格式转换、dataframe多表合并)并写入ElasticSearch实战(自动创建索引、写入ElasticSearch、探索性数据分析)
Python读取多个excel文件(删除字段.数据格式转换.dataframe多表合并)并写入ElasticSearch实战(自动创建索引.写入ElasticSearch.探索性数据分析) 目录
- python读取txt文件写入-python 读取、写入txt文件的示例
写入文件 使用open()函数和write()函数 但是有两种写法,分别是'a'和'w' 'a' 表示写入文件 若无该文件会直接创建一个 如果存在这个文件,会接着已有的内容的后面写入 with ope ...
- python分析pcap文件_利用Python库Scapy解析pcap文件的方法
每次写博客都是源于纳闷,python解析pcap这么常用的例子网上竟然没有,全是一堆命令行执行的python,能用吗?玩呢? pip安装scapy,然后解析pcap: import scapy fro ...
- jq ajax xml,jQuery+ajax读取并解析XML文件的方法
本文实例讲述了jQuery+ajax读取并解析XML文件的方法.分享给大家供大家参考,具体如下: ajax.xml: zhangsan 1 lisi 2 demo.html: /p> " ...
- python shp文件_对python 读取线的shp文件实例详解
如下所示: import shapefile sf = shapefile.reader("e:\\1.2\\cs\\dx_csl.shp") shapes = sf.shapes ...
- 使用Python读取LabVIEW TDMS 格式文件转成Excel格式+多进程版本
使用Python读取LabVIEW TDMS 格式文件转成Excel格式+多进程版本 文章目录 使用Python读取LabVIEW TDMS 格式文件转成Excel格式+多进程版本 前言: 背景 tm ...
- Java I/O读取和解析.emp文件示例
Java I/O读取和解析.emp文件示例 1.使用到的知识点 2.示例1 2.1存储几个员工数据到不同的文件 2.1.1题目要求 2.1.2相关代码 2.1.3结果展示 2.2读取存储数据的文件 2 ...
- Python读取.dat后缀名文件
Python读取.dat后缀名文件 .dat文件基本上是没有任何头的二进制文件.对于每个样本,它由(256,256,3)个uint8图像,(64,64,1)uint8深度图和1个uint8标签组成.T ...
最新文章
- Twisted入门教程(3)
- 查看Linux服务器下的内存使用情况
- 【高级Java架构师系统学习】java如何开发安卓软件
- 《人月神话》阅读体会(二)
- python 字符串方法
- rsync(一):基本命令和用法
- Mysql中有哪些数据类型(建议收藏)
- 东南大学成贤学院计算机报名,2019上半年东南大学成贤学院全国计算机等级考试预报名通知...
- 深度学习推荐模型-WideDeep
- 如果Google统治世界[组图]
- 在惠普BL460C G1上安装System Management Homepage(CentO...
- NTC热敏电阻(温度传感器)
- Opencv-获取两点之间距离
- JSON在线格式化,美化
- 论文阅读|目标检测之CE-FPN,将通道增强运用到上采样,减少信息丢失,同时添加了通道注意力机制
- FlashFXP,flashfxp建立ftp站点
- Linux环境变量PATH
- keras 实现GAN(生成对抗网络)
- direction: rtl;
- 决策理论(decision theory)
热门文章
- 亚马逊干货 | Listing如何优化
- 多肽合成技术原理,多肽合成方法解读
- select标签及其标签元素
- 用迭代法求平方根的算法
- awk 以空格及其他字符为分隔符
- 第二十五课.赋值运算符与复合赋值运算符
- jrebel 错误: 找不到口令文件: C:\Users\中文名称\AppData\......\jmxremote.password
- 基于MOXA AWK-1131A的WIFI模式,PC与三菱LCPU连接。
- Unity扩展GameObject等类中的方法
- hexo问题篇(偶尔抽抽疯)