为什么需要只读压缩文件系统?

在存储容量有限的嵌入式设备上,一般对于系统分区在使用过程中没有数据写入需求,同时希望可以节省存储空间——只读压缩文件系统应运而生。另外,只读压缩文件系统也可用于归档文件。相比tar,zip等压缩软件,只读压缩文件系统的性能和灵活性都更好。Linux早期的只读文件系统有CramFS和SquashFS,以及参考了上述两个文件系统设计的用户态只读压缩文件系统CromFS。另外,最近两年在Android平台上实现商用的EROFS也值得关注。EROFS针对手机使用场景,对读放大和内存占用过多从设计理念上带来了一些新的优化。

CramFS,SquashFS,CromFS横评

CramFS被设计成用于存储空间很小的嵌入式设备上,倾向于极致简单、极其节省空间。在使用上存在诸多限制,如:单个文件大小不能超过16MB、文件系统大小略大于256MB(最后一个文件允许超过256MB空间范围,即文件系统总大小不超过272MB)。CramFS的gid只保存8位,mkcramfs会简单的将gid截断保留最后8位(有一些安全风险)。CramFS支持硬链接,但是被硬链接的文件引用计数不会增加。CramFS文件没有时间戳,所有文件的创建/访问时间戳都是1970年1月1日 0:00:00 GMT。(最近访问过的文件可能会被更新时间戳,但只在内存中保存。)CramFS的镜像只支持被同样字节对齐方式的机器创建和挂载使用,页面大小只支持4KB。

SquashFS的出现替代了CramFS,但CramFS通过支持XIP(Execution In Place)有了新的用武之地。SquashFS设计上相比CramFS去掉了大部分限制因素:其会保存完整的uid/gid(32位)、文件创建时间,单文件最大支持16 EB,文件系统最大大小也是16 EB。压缩后的inode平均消耗8字节,根据文件类型不同(文件、目录、符号链接等)inode大小有所变化。对于压缩文件系统,压缩输入的数据块大小(chunk size)决定了压缩率收益和潜在的读放大开销。SquashFS 2.x版本的chunk size最大为64KB, SquashFS 3.x版本的chunk size最大可达1MB。SquashFS 3.x版本默认的chunk size是128KB,相比4KB大小的chunk size压缩率有明显提升。SquashFS还支持fragment block,即多个小文件存入一个block,极大的提升了压缩率。SquashFS支持大端和小端对齐方式,可以在不同的字节序机器上创建和挂载。

CromFS的主要设计目标是高压缩率,性能和内存使用量不是它关心的方面。CromFS是一个用户态文件系统,通过块级别去冗和高压缩率算法实现压缩收益最大化。同CramFS和SquashFS的详细特性对比如下表:

表1 CramFS,SquashFS,CromFS对比

EROFS带来哪些新变化?

EROFS的全称是Enhanced Read-Only File System,相比前述只读压缩文件系统最大的不同是压缩思路和解压方式的改变。不同于以往固定输入长度(Fixed Sized Input)的压缩形式,EROFS采用固定输出长度(Fixed Sized Output)的压缩思路。这解决了固定输入长度的压缩带来的读放大问题,4KB的固定输出长度压缩就可达到128KB的固定输入长度压缩的压缩率。对于SquashFS来说,达到同样的压缩收益可能需要比EROFS多读几倍的数据块。另外,SquashFS在运行时内存使用方面也远远多于EROFS的原地解压策略,这在系统处于低内存状态时会导致读性能大幅下降。为了更好的解压速度同时保证一定的压缩率,EROFS使用的压缩算法为LZ4。默认压缩输出块大小为4KB,其他特性支持上均对标SquashFS。这里不再一一赘述。

定长输出和定长输入的示意如下图所示,EROFS会通过多次尝试不同长度的输入数据将其压缩到固定大小(4KB)的输出块上,SquashFS则是根据预先配置好的输入长度(Chunk Size)压缩数据并写到输出块上(可能跨多个数据块)。当EROFS的固定输出长度设为存储设备的块大小(如:4KB)时,可以认为没有读放大。因为无论要读的内容是哪一部分以及大小,对于块设备来说都至少要读取一个数据块。

图 1 定长输出和定长输入的区别

在内存分配上,EROFS根据上层希望读取的内容是否需要将盘上读出数据全部解压会选择不同的策略。对于需全部解压的情况,EROFS会使用VFS已分配的Page Cache内存页,这样节省了内存的占用;对于需部分解压的情况,EROFS则会独立分配缓存页以便后续读取相同压缩块时避免产生新的I/O。当压缩数据块已被读入内存后,以下图中读取数据块3,4为例,EROFS的基本数据解压方式大致步骤如下:

1) 根据上层要读取范围计算要解压的数据块(这个例子中是0,1,2,3,4)

2) 分配临时缓存页(可选)存放解压内容(0,1,2),VFS已分配数据页不用再分配

3) 通过vmap将上述物理页映射为连续虚拟页

4) 如果有原地I/O占用了VFS分配的数据页,则将数据拷贝到临时页

5) 解压数据到指定虚拟地址

图 2 EROFS压缩和解压示意图

为优化内存占用,EROFS还提供了缓存解压/滚动解压(预分配一定数量的内存页)、原地解压等策略。另外,通过调度优化和协同解压进一步改善了数据读取性能。理论上,解压的过程增加了CPU计算时间,而压缩数据读取减少了I/O时间(特别是对于顺序读取来说)。所以对于只读压缩文件来说,压缩率达到一定收益后读性能会好于不压缩的文件系统。即CPU时间的增加小于I/O时间的减少,这从EROFS的测试数据也可以看出:当压缩节省空间超过35%以上时,随压缩比提升EROFS的读性能(特别是顺序读)会越来越好于EXT4。

以上就是对只读压缩文件系统的一个简单介绍,可以看出根据应用场景的不同各个只读压缩文件系统在压缩比、压缩/解压效率上各有侧重。EROFS相比其他只读压缩文件系统引入了更多的设计思路,实现细节和一些优化值得肯定。

参考文献:

[1]  Gao et. al., EROFS: A Compression-friendly Readonly File System for Resource-scarce Devices, ATC 2019

[2] SquashFS, https://zh.wikipedia.org/wiki/SquashFS

[3] CromFS, https://bisqwit.iki.fi/source/cromfs.html

[4] SquashFS HOWTO, https://tldp.org/HOWTO/SquashFS-HOWTO/whatis.html

[5] CramFS, https://www.kernel.org/doc/html/latest/filesystems/cramfs.html

扫码关注
“内核工匠”微信公众号
Linux 内核黑科技 | 技术文章 | 精选教程

盘点只读压缩文件系统相关推荐

  1. 制作linux只读文件系统,一种Squashfs只读根文件系统的远程升级方法及系统的制作方法...

    一种Squashfs只读根文件系统的远程升级方法及系统的制作方法 [技术领域] [0001]本发明涉及嵌入式Linux操作系统的根文件系统,具体是涉及一种Squashfs (南瓜文件系统)只读根文件系 ...

  2. linux中创建压缩文件系统----squashfs

    简介 squashfs程序能够创建出一种具有超高压缩率的只读型文件系统.它能够将2GB~3GB的数据压缩成一个700MB的文件.Linux LiveCD(或是LiveUSB)就是使用squashfs创 ...

  3. 【百度分享】BZFS—一种透明压缩文件系统

    简介随着数字技术的发展,网络所包含的信息量也与日俱增,如何高效存储这些数据成了很多互联网公司的一大难题.与此相关的出现了很多的压缩工具,这些算法可以使固有的资源存储的数据量大幅度提高.但是这些压缩工具 ...

  4. linux查看文件系统是否是只读,Linux 文件系统只读问题分析指引

    问题分析思路 在  Linux 服务器使用过程中,可能会出现文件系统只读的情况,该类问题的一般分析思路如下:检查 /etc/fstab 配置,查看是否对磁盘进行了挂载. 检查当前实际挂载的磁盘状态是否 ...

  5. linux编译文件系统只读,Linux文件系统只读及修复方法

    有时候维护Linux服务器时会面临这样一种错误,即显示文件系统变成(Read Only System),即文件系统变成只读的方式,产生这一问题的原因可能有两种: - 一是多机写入时同步机制出现问题(可 ...

  6. linux文件系统变成只读,Linux文件系统变成只读解决办法

    this.p={ m:2, b:2, loftPermalink:'', id:'fks_0950650870810800660930850870950850840830690920860850740 ...

  7. 嵌入式linux只读保护,如何使用squashfs只读文件系统制作Linux系统文件

    在使用嵌入式Linux 系统的时,会出现由于设备意外断电引起文件系统损坏而最终使该设备无法启动的现象.为了应对这种情况,通常会从硬件设计如采用备用电源,无论是锂电池还是超级电容等,或者从系统软件设上加 ...

  8. 2038问题 linux_Linux 文件系统类型导览

    Linux 文件系统多年来在不断发展,让我们来看一下文件系统类型. -- Sandra Henry-stocker(作者) 虽然对于普通用户来说可能并不明显,但在过去十年左右的时间里,Linux 文件 ...

  9. rootfs文件系统的制作(一)

    根文件系统(root filesystem)是存放运行.维护系统所必须的各种工具软件.库文件.脚本.配置文件和其他特殊文件的地方,也可以安装各种软件包. 一般根文件系统主要目录结构: 创建根文件系统步 ...

最新文章

  1. django定时任务实现(言简意赅) Django折腾记之启动定时任务(转)
  2. 基于BootStrap 4.x 中的Flex 实现各种布局
  3. 15个PHP库,你值得拥有!(下)
  4. php运行环境largon,环境配置(一)
  5. liunx--账户文件权限和管理(账户添加删除,组的添加和删除 文件的归宿和权限)
  6. jQuery 源码解析(三十一) 动画模块 便捷动画详解
  7. Jeecg-Boot 快速生成前后端代码
  8. JavaScript 详说事件流(冒泡、捕获、传播、委托)
  9. 华大MCU在IAR下的调试环境搭建及相关补丁包(百度网盘链接)
  10. 取绝对值,保留两位小数
  11. Candence学习篇(5)使用Padstack Editor制作贴片焊盘和通孔焊盘
  12. 基于OpenAPI Specification自动生成Android客户端代码
  13. 《H打飞机》技術支持網址
  14. 扫黑除恶进行中,公众号文章不知道怎样排版?看这里。
  15. bzoj1616 [Usaco2008 Mar]Cow Travelling游荡的奶牛 [BFS]
  16. 安装docker桌面版(Windows)
  17. 外壳防护等级(IP等级)
  18. repost 简朝阳 本科校友
  19. 一站式开发一个安卓APP-原型设计篇
  20. 思科网络学院-网络互连-第四章

热门文章

  1. 51Nod - 1289 大鱼吃小鱼
  2. 经纬度坐标转换成px_墨卡托坐标与经纬度转换
  3. Golang安装 linux
  4. java 栈的变量_Java栈和局部变量操作(一)
  5. 梁启超家书致思成书-人生之旅途历途甚长,所争决不在一年半月
  6. 如何在cmd下查询mongodb数据库
  7. FFT频谱分析(补零、频谱泄露、栅栏效应、加窗、细化、频谱混叠、插值),Matlab、C语言代码
  8. 智慧社区——让居民生活更美好
  9. win7 cmd 下 切换到其他盘符
  10. conda env虚拟环境