在kaggle上做题时遇到一个编码技术:Run-length encoding,此处记录一下~

行程编码(RLE)是一种无损数据压缩形式,其中数据的runs(即,在许多连续数据元素中出现相同数据值的序列)被存储为单个数据值和计数,而不是原来的runs。这对包含许多此类runs的数据最有用。例如,考虑简单的图形图像,如图标,线条图。它对于没有很多runs的文件没有用,因为它可能会大大增加文件大小。

例如,考虑在纯白色背景上包含纯黑色文本的屏幕。空白区域中会有很多长白色像素,文本中会有很多短黑色像素。假设的扫描线,B代表黑色像素,W代表白色,可能如下所示:

WWWWWWWWWWWWBWWWWWWWWWWWWBBBWWWWWWWWWWWWWWWWWWWWWWWWBWWWWWWWWWWWWWW

通过应用于上述假设扫描线的行程编码(RLE)数据压缩算法,可以如下呈现:

12W1B12W3B24W1B14W

这可以解释为十二个W,一个B,十二个W,三个B的序列。

参考地址:https://en.wikipedia.org/wiki/Run-length_encoding#Example

kaggle题目:https://www.kaggle.com/c/severstal-steel-defect-detection/overview/evaluation

Run-length encoding相关推荐

  1. Run Length Encoding

    游程编码 (Run Length Encoding ) 是一种简单的编码方法,通常用于控制论中对二值图像编码.ACM有一道题目就是关于该编码.见tzu 1149 或poj 1782 .虽然是简单题,我 ...

  2. 游程编码(Run Length Coding)

    游程编码 游程编码 基本介绍 示例1 示例2 游程编码适用的场景 游程编码 游程编码(Run Length Coding,简称RLC)又称游程编码.行程长度编码.变动长度编码 等,是一种统计编码.主要 ...

  3. RLE格式标注文件转为PNG格式(Run Length Encode)

    一.什么是 RLE 格式 在机器视觉领域的深度学习中,每个数据集都有一份标注好的数据用于训练神经网络. 为了节省空间,很多数据集的标注文件使用RLE的格式,比如 kaggle 挑战赛的 Airbus ...

  4. 图像有损压缩matlab程序,基于Matlab的灰度图像DCT与RLE的混合有损压缩

    人工智能及识别技术本栏目责任编辑:唐一东第5卷第21期(2009年7月)基于Matlab 的灰度图像DCT 与RLE 的混合有损压缩 朱玲芳,刘任任 (湘潭大学信息工程学院,湖南湘潭411105) 摘 ...

  5. jpg在线合并jpg_JPG如何运作

    jpg在线合并jpg by Colt McAnlis 通过Colt McAnlis JPG如何运作 (How JPG Works) The JPG file format was one of the ...

  6. 深入分析Parquet列式存储格式

    深入分析Parquet列式存储格式 Parquet是面向分析型业务的列式存储格式,由Twitter和Cloudera合作开发,2015年5月从Apache的孵化器里毕业成为Apache顶级项目,最新的 ...

  7. Spark基础知识解答

    Spark基础知识解答 一. Spark基础知识 1. Spark是什么? UCBerkeley AMPlab所开源的类HadoopMapReduce的通用的并行计算框架. Spark基于mapred ...

  8. 【Spark深入学习 -14】Spark应用经验与程序调优

    ----本节内容------- 1.遗留问题解答 2.Spark调优初体验 2.1 利用WebUI分析程序瓶颈 2.2 设置合适的资源 2.3 调整任务的并发度 2.4 修改存储格式 3.Spark调 ...

  9. XenApp/XenDesktop 7.11中对于视频、图片、文字的优化的说明

    在桌面虚拟化这个技术门类中,市面上一共主流有以下几种协议: Citrix的ICA/HDX协议 Teradici公司的PCoIP(VMware Horzion中主要使用的协议之一) 微软公司的RDP R ...

  10. (转载)浅析Hadoop文件格式

    对于Hadoop学习要持续,这里转载下关于hadoop文件格式,后续实践中在加以理解. 转载地址:http://www.infoq.com/cn/articles/hadoop-file-format ...

最新文章

  1. 【java 性能优化实战】2 深入剖析:哪些资源,容易成为瓶颈
  2. 17、Spring Boot普通类调用bean【从零开始学Spring Boot】
  3. node.js 中的package.json文件怎么创建?
  4. 如何在SAP Spartacus的scss里引入全局变量
  5. 百度OCR文字识别-Android安全校验
  6. mysql 修复表和优化表
  7. (自连接)SQL面试题-0608
  8. 如何给mac地址赋值_交换机工作基础——MAC地址表的构成与安全
  9. mybatis配置 SqlMapConfig.xml user.xml
  10. .net与java之争
  11. ElementUI:项目中引入自己的ICON
  12. android studio 单元测试详解
  13. 戴尔windows10桌面计算机,戴尔电脑win10怎么在桌面显示我得电脑
  14. thinkphp开发码支付系统/三网免挂/微信金额免输入/源支付5.8/打造更专业的聚合免签支付系统带云端
  15. TCL中变量嵌套使用
  16. 图文解说百兆和千兆网线制作方法
  17. jquery中e.target是什么意思
  18. NT151应用案例:西门子PLC S7-1200与派克ACR9000的通信(Part 3)
  19. 如何使用 minio 进行 BR 备份
  20. 2016年的不正式总结

热门文章

  1. 嵌入式以太网第二部分——ENC28J60网卡驱动
  2. SolidWorks stp文件转成实体
  3. 初步整合vue-element-admin和GitDataV两个Vue开源框架方案实现大数据可视化
  4. win10+Linux18.04双系统安装
  5. 搭建代理IP池的方法
  6. 无处不在的算法---《算法神探》读后感
  7. 什么是波动率?什么是期权的隐含波动率、历史波动率和实际波动率?
  8. 如何让旧电脑运行更快:升级笔记本组件和操作系统
  9. 第四篇 HTML5 伪类与伪元素
  10. java idle耗时_chrome中性能分析工具分析页面中Idle(空闲时间)占用太长时间,会不会影响页面性能,如果会是什么原因造成的?...