Nomalized Compression Distance(NCD)详解
Nomalized Compression Distance(NCD)是一种计算二进制文件相似性的一种简单算法公式是
X和Y是需要比较的两个文件的字节大小,C指压缩,C(XY)就是将XY放进一个压缩包中,C(X)就是单独压缩X以后压缩包的字节大小,C(Y)就是单独压缩Y以后压缩包的字节大小。
NCD的原理就是如果两个二进制文件非常相似,那么它们被共同压缩以后,重叠的部分就会很多,这样压缩以后的文件的字节大小就会越小,假如是两个完全相同的二进制文件,那么它们被压缩以后的体积应该和单独压缩一个这个文件的体积一样大,即
推荐用7-Zip进行压缩,7-Zip采用的lzma2算法是目前公认压缩率最高的算法。
Nomalized Compression Distance(NCD)详解相关推荐
- 曼哈顿距离(Manhattan Distance )详解
概念 曼哈顿距离--两点在南北方向上的距离加上在东西方向上的距离,即d(i,j)=|xi-xj|+|yi-yj|.对于一个具有正南正北.正东正西方向规则布局的城镇街道,从一点到达另一点的距离正是在南北 ...
- 曲线相似度衡量——曲线距离计算Fréchet distance详解与python计算
弗朗明歇距离(Fréchet distance)论文可以参考: 理论推导 Eiter, Thomas, and Heikki Mannila. "Computing discrete Fré ...
- 2D基本图形的Sign Distance Function (SDF)详解(下)
符号距离函数(sign distancefunction),简称SDF,又可以称为定向距离函数(oriented distance function),在空间中的一个有限区域上确定一个点到区域边 ...
- 编辑距离算法详解:Levenshtein Distance算法——动态规划问题
目录 背景: 求编辑距离算法: 图解过程: C++代码如下: 总结: 背景: 我们在使用词典app时,有没有发现即使输错几个字母,app依然能给我们推荐出想要的单词,非常智能.它是怎么找出我们想要的单 ...
- ZIP文件格式详解(一)——文件数据格式
ZIP文件格式详解(一)--文件数据格式 ------------------------------------------------------------------------------- ...
- YDB基本使用详解(转)
第七章YDB基本使用详解 一.如何与YDB对接(交互) 目前延云YDB提供如下几种方式 l命令行的方式 lWeb http接口的方式 lJDBC接口的方式 通过Java编程接入 通过可视化SQL分析统 ...
- vue中如何调用ios摄像头_vue2.0调用摄像头步骤详解
这次给大家带来vue2.0调用摄像头步骤详解,使用vue2.0调用摄像头的注意事项有哪些,下面就是实战案例,一起来看一下. 可以在github 上下载demo链接 vue组件代码 import {Ex ...
- samtools用法详解
文章目录 下载安装 测试数据 命令详解 dict faidx index reheader rmdup cat merge mpileup 查看参数 mpileup生成的结果 有参考序列的pileup ...
- nginx系列:nginx反向缓存代理详解
小生博客:http://xsboke.blog.51cto.com 如果有疑问,请点击此处,然后发表评论交流,作者会及时回复. -------谢谢您的参考,如有疑问,欢迎交流 一. 代理和nginx相 ...
最新文章
- 6.OSI七层网络模型与TCP/IP四层网络模型
- Dubbo原理和源码解析之服务引用
- apache apollo php,php windows環境 安裝 Apache-apollo + phpMQTT 實現發送 MQTT
- 5天学习MYSQL数据库第一天剩余全部笔记(超级详细的mysql入门笔记适合新手反复看加深记忆)
- 2013年国家计算机一级考试试题,2013年计算机一级的考试试题.doc
- android 模拟器read-only file system,WAC启动Android模拟器 transfer error: Read-only file system错误解决方法...
- string插入字符_String类
- LeetCode -- Sort List
- 查看显卡信号_既然大家说装了win10,就不用鲁大师监测显卡温度,为什么呢
- matlab调用C语言
- jdk1.8中文帮助文档
- 多媒体计算机组装过程,多媒体技术及《计算机组装及维护》课精彩结合.doc
- 阿里云数据工厂DataWorks
- 路由器搭建个人网站_PittMesh路由器归个人所有
- 机器学习-神经网络为什么需要非线性(激活函数)
- 【入门篇】一、什么是单片机
- 史玉柱深度剖析:民营的13种“死法”
- win10安装sql2005 /sql2005联机丛书和开发工具安装不上 服务启动不了等
- android大字体桌面,大图标大字体 Android老人机桌面试玩
- html设置图片的宽高