压缩 -压缩实现方法、常用的压缩格式
- 压缩是通过 特定的算法来减少机算机对文件的大小机制,可以减少 Bytes
有很多的公司 对 存储的数据,都是用压缩包的形式,很少会用到数据库,一朋友 ,新跳了一家公司 分配好项目之后,没想到,发来的 数据都是 压缩包,其中有一个包 里面有着 4000W 的用户信息 (具体啥玩意我也不知道)他的电脑 打都打不开。
( 咱不是程序大佬 小白白 )
让我突然重视了起来 压缩,因为平时 除了用快压 解压一些小电影剩下的好像什么都没有办,所以 度妈妈 了一些相关知识想着分享一下、也放在这里希望 大佬 能够指点
言归正传
我们大众化的理解就是解压 就是去除空格 其实也不完全对
接下来我们来说说 压缩
- 文件
( 文件 )压缩技术 简单的来说 就是查找文件内的重复 Bytes,然后建立一个具有相同 Bytes 的 字典 文件,并且用一个代码来 表示。
比如原文件里,有多处重复的 Bytes or word 如:LiEnze 我爱你,这个时候 就会生产出一个代码来表示 如:sb 当然只是举例、真实的操作要麻烦的多
- 图片
- ( 图片 )计算机处理信息 用的是 二进制表示、在一张图片内 有数不清的 相同颜色点对吧,压缩就会 在某个位置上 有多少个 蓝色点、在通过 公式用 (0, 1)来表示出来
压缩 方法分为:
( 有的时候想追求效率 必然质量会打点折扣 )
- 有损压缩:
- 举个例子 在压缩 图片的时候 你图片的左上角 少了一个 像素点 你的肉眼能看出来么?对吧!
- 所以有损压缩 非常适用于 压缩 图片 音频 视频 典型的代表格式就是 .mpeg
- 无损压缩:
- 当我们对数据追求完美 不是特别考虑效率的时候 无损压缩就用到了、代表格式就太多了 如:.zip .rar 这些啊
其实压缩 最重要的 一点还是去重 也就是 重复压缩
重复压缩 也有两种:
- 段语句的重复
Bytes 在重复三个以上就成为短语句
在压缩这种类型时候 zip 用的是 两个数字 一个是 重复位置到当前位置的 距离,另一个是重复的长度
比如:abcddddd 我这个当前重复的位置是第 3个(第一个位置索引是 0),重复的长度是 5,那么我就可以 d(3,5) 来表示重复的 d。
不要觉得一个 Bytes 有256个可能 三个字节就是有 256 ^ 3 种可能、这种压缩方法简直就是天方夜谭、
- 比如:一篇小说中出现的 主人公的名字,和女主角去酒店的名字,极大程度地多次出现、这样就恰恰的符合了 重复压缩的做法,但是重复压缩只适合进行一次压缩
- 如果对文件进行第二次重复压缩 意义不大,因为第一次压缩 已经大大的破坏了 源语句的重复倾向。
- 单 Bytes 的重复
一个字节有 236 中可能、这样重复的几率岂不是更大?因为他是单字节,所以范围缩小了好多的。
比如在 ASCII 文本文件中 常用的就是 字母 和 数字,据说 E 的使用率是最高的 。
图片就更好理解了 肯定 深色调 和 浅色调 使用的多嘛
这里顺便提一下:png图片格式是一种无损压缩,其核心算法就是 zip 算法,它和 zip 格式的文件的主要区别在于:作为一种图片格式,它在文件头处存放了图片的大小、使用的颜色数等信息。上面提到的短语式压缩的结果也有这种倾向:重复倾向于出现在离当前压缩位置较近的地方,重复长度倾向于比较短(20字节以内)。
常见的压缩格式:
JAR – Java Archive File
他是 Java 的一种文档格式、你也可以理解为他就是 ZIP文件 ,叫他文件包,他和 ZIP 的最大区别就是 JAR 文件的内容中包含了一个 META-INF/MANIFEST.MF 文件,这个文件是在生成 JAR 文件的时候自动创建的ZIP –
zip 是 very常见的一种压缩格式了它不需要单独的一个压缩或者解压缩软件,因为Windows系统已经集成了对 ZIP 压缩格式的支持。RAR –
RAR 的压缩地位仅次于 ZIP ,因为 RAR 的压缩率 要比 ZIP 高很多。有一个后起之秀 叫 7Z 有着 比 RAR 更高的压缩率 但是 没办法 RAR 在压缩领域奠定了一定的基础、不可撼动。CAB –
CAB 是微软推出的压缩文件格式,主要都是用于安装程序上,所以 CAB 文件包含的文件都是被经过处理的,代价就是咱们自己解压后可能还用不了ISO –
ISO 是 一种光盘镜像格式,是吧数据保存到光盘上。你一可以理解 这就是文件提取。TAR –
TAR .tar 为后缀的文件,WinZIP、WinRAR、都可以打开,因为 他们两个都对 TAR 进行了关联,注意说的一点是 TAR是linux 常用的文件格式UUE –
UUE 这个比较牛逼、是压缩遇到邮件编码混合 引起 乱码 的情况下就用压缩格式,可以用WinZIP、WinRAR打开。
压缩的操作相比较来说 还是比较麻烦的 当然啊 也有一些教程 我就不举例了
此博客并非 -原创-,全是搜集的 ~~~
发布的化,挂着转载,也不知道怎么填写 原 地址,所以只能写着原创、我觉得 学习别人的东西 自己没有进行更改 思维逻辑 还是别人的 那就不是 原创
压缩 -压缩实现方法、常用的压缩格式相关推荐
- 在线压缩视频的方法,一键压缩视频文件
压缩视频用什么方法呢?视频太大比较占用内存,一个视频还好,如果视频文件比较多的时候,就会导致电脑卡顿,我们想要在线将视频压缩需要怎么操作呢?下面就为大家简单的介绍一下在线压缩视频的方法. 1:在浏览器 ...
- linux中常用的压缩命令,Linux中常用的压缩和解压缩命令汇总
在Linux下,压缩和解压相比较Windows而言,琳琅满目的各种压缩包是一种莫名的负担,很多时候,根本就不知道该如何下手,经过无数次的折磨之后,通过伟大的互联网整理出了下面这份常用压缩包的后缀名的解 ...
- 常见的“压缩与解压缩”方法...
常见的"压缩与解压缩"方法... 常见的"压缩与解压缩"方法... 常见的"压缩与解压缩"方法... 压缩解压 linux下怎么解后缀名是g ...
- 照片怎么压缩变小,常用多方法详解
照片怎么压缩变小?有些平台上传照片时,常会因照片体积过大而上传失败.一张图片的大小差异很大,从几十MB到几KB不等.并非所有软件都会因为图片太小而无法上传,只规定了图片大小的上限.那么如果碰到非常大体 ...
- Linux常用文件压缩/解压命令格式大全(tar、gzip、bzip2、zip、compress、cpio、compress、dd)建议收藏
Linux常用文件压缩/解压命令格式大全 1. tar 2. gzip 3. bzip2 4. zip 5. compress 6. cpio 7.dd 1. tar 打包备份后的文件包缀:.tar ...
- 怎么压缩jpg图片文件大小?jpg图片格式的压缩方法
经常写公众号文章的小伙伴,应该遇到过插入jpg图片时失败的情况,这是因为图片超出了平台的上传限制,需要先把过大的图片压缩变小,该怎么压缩jpg图片大小呢?小编来给大家介绍一个jpg格式压缩的方法,使用 ...
- 图片压缩怎么弄?多种图片格式压缩大小的方法
平时接触的图片格式有许多种,比如jpg.png.gif.tiff.webp等,不同的场景都需要用不同的图片,但是当这些图片大小都不符合我们的使用要求时,该怎么去压缩图片大小呢?小编今天给大家分享一款支 ...
- Linux和Win常用分卷压缩和合并压缩方法(主要Linux)
一.实现功能 因为文件过大超过5G,从Windows上传到Linux时报错.所以,是需要windows中切割压缩,然后上传到Linux.但是,遇到Linux上合并分卷的解压困扰,所以,经过查询测试实现 ...
- PNG格式如何在线压缩的简单方法
PNG是图片的一种文件格式,PNG的在线压缩大家知道吗?在线压缩和普通的压缩是不一样的.应该有很多热都不会在线压缩,在线压缩PNG文件和在线压缩JPG文件是一样的,接下来就告诉大家怎么将PNG格式在线 ...
最新文章
- nginx在linux下安装,Nginx在linux下安装及简单命令
- Internet Explorer 8 Beta 2十大看点
- 数据库开发——MySQL——基本操作
- Spring和JSF集成:国际化和本地化
- html 文本 多列显示,CSS3文本,字体和多列
- 通过DMVS采集并存储SQL Server性能计数器数据
- 全网首发:LINUX编译JNA:编译libffi
- java处理最后一周_Java得到的一周的最后一天的一段时间内
- Julia:关于push 与 Array 和Dict 数据结构
- 学NTFS格式磁盘解析及atapi磁盘读写
- EnableViewState和ViewStateMode
- css中怎么改变图片尺寸,CSS也可以改变图片幅面尺寸
- 【SuperResolution】Spatial resolution的含义
- 爬取 百度logo(图片)
- WRSC无人帆船航行基本原理
- 【蓝桥杯省赛】冲刺练习题【枚举】倒计时【12】天
- 微商大咖不轻易透露的操作秘诀
- 信贷十条打响新一轮经济刺激第一枪
- 9种圣诞字体tabs选择
- 用python输出国际象棋棋盘_python输出国际象棋棋盘的实例分享