p-stable LSH
p-stable LSH与LSH的区别
LSH是用局部敏感的方法解决近似最近邻搜索的问题。在原始的LSH方法中,通过将原始空间嵌入到Hamming空间中,将d维空间转换成d'=Cd维的Hamming空间
p-stable LSH算法中,不需要将原始空间嵌入到Hamming空间中,可以直接在欧几里得空间下进行局部敏感哈希运算。
p-Stable分布
定义:对于一个实数集R上的分布D,如果存在P>=0,对任何n个实数v1,…,vn和n个满足D分布的变量X1,…,Xn,随机变量ΣiviXi和(Σi|vi|p)1/pX有相同的分布,其中X是服从D分布的一个随机变量,则称D为 一个p稳定分布。
对任何p∈(0,2]存在稳定分布:
利用p-stable分布可以有效的近似高维特征向量,并在保证度量距离的同时,对高维特征向量进行降维
其关键思想是,产生一个d维的随机向量a,随机向量a中的每一维随机的、独立的从p-stable分布中产生。
对于一个d维的特征向量v,如定义,随机变量a·v具有和(Σi|vi|p)1/pX一样的分布,因此可以用a·v表示向量v来估算||v||p 。
p-Stable分布LSH中的哈希函数
p-Stable分布的LSH利用p-Stable的思想,使用它对每一个特征向量v赋予一个哈希值。该哈希函数是局部敏感的,因此如果v1和v2距离很近,它们的哈希值将相同,并被哈希到同一个桶中的概率会很大。
根据p-Stable分布,两个向量v1和v2的映射距离a·v1-a·v2和||v1-v2||pX 的分布是一样的。
a·v将特征向量v映射到实数集R,如果将实轴以宽度w等分,并对每一段进行标号,则a·v落到那个区间,就将此区间标号作为哈希值赋给它,这种方法构造的哈希函数对于两个向量之间的距离具有局部保护作用。
哈希函数格式定义如下:
ha,b(v):Rd->N,映射一个d维特征向量v到一个整数集。哈希函数中又两个随机变量a和b,其中a为一个d维向量,每一维是一个独立选自满足p-Stable的随机变量,b为[0,w]范围内的随机数,对于一个固定的a,b,则哈希函数ha,b(v)为
参考:
https://blog.csdn.net/jasonding1354/article/details/38237353
p-stable LSH相关推荐
- 位姿检索PoseRecognition:LSH算法.p稳定哈希
位姿检索使用了LSH方法,而不使用PNP方法,是有一定的来由的.主要的工作会转移到特征提取和检索的算法上面来,有得必有失.因此,放弃了解析的方法之后,又放弃了优化的方法,最后陷入了检索的汪洋大海. 0 ...
- 局部敏感哈希(LSH)
一. 近邻搜索 局部敏感哈希,英文locality-sensetive hashing,常简称为LSH.局部敏感哈希在部分中文文献中也会被称做位置敏感哈希.LSH是一种哈希算法,最早在1998年由In ...
- 其他算法-LSH局部敏感度哈希
目录 LSH简介 LSH算法过程 LSH简介 LSH全称Locality Sensitive Hashing,即局部敏感度哈希,是一种常用的数据挖掘算法,LSH让海量且高维的数据检索变得高效:普通哈希 ...
- KD树和LSH局部敏感哈希
文档结构 文档表示 距离度量 KD树 原理 构建 查询 复杂度 KD树的KNN KD树的逼近KNN 不适用高维数据 LSH LSH潜在的问题 LSH算法 复杂度 概率逼近 多表 文档结构 文档表示 词 ...
- 《因果科学周刊》第3期:因果助力 Stable Learning
为了帮助大家更好地了解因果科学的最新科研进展和资讯,我们因果科学社区团队本周整理了第3期<因果科学周刊>,从 Causality, Causal Inference, Causal AI ...
- HDOJ 1914 The Stable Marriage Problem
rt 稳定婚姻匹配问题 The Stable Marriage Problem Time Limit: 5000/1000 MS (Java/Others) Memory Limit: 6553 ...
- PostgreSQL Oracle 兼容性之 - PL/SQL DETERMINISTIC 与PG函数稳定性(immutable, stable, volatile)...
标签 PostgreSQL , Oracle , 函数稳定性 , stable , immutable , volatile , DETERMINISTIC 背景 Oracle创建pl/sql函数时, ...
- [译]Node v5.0.0 (Stable)
原文:https://nodejs.org/en/blog/release/v5.0.0/ 你好Node.js v5!没错,我们刚刚才发布了Node.js v4,但这次的新版本并不意味着v4版本要离我 ...
- 软件版本中 release stable alpha beta pre snapshot 区别
我们在下载软件会遇到诸如release,stable,alpha,beta,pre,current,eval,rc,snapshot等版本,程序猿下载插件时尤为常见,现在我说明以下版本的意思 1,sn ...
- pyspark minHash LSH 查找相似度
先看看官方文档: MinHash for Jaccard Distance MinHash is an LSH family for Jaccard distance where input feat ...
最新文章
- 话说TP框架里的Vendor这目录是干什么用的啊?类库扩展thinkphp3.1版本
- SEO的操作流程梗概
- SQL积累-SQL取得字符串中的文件名
- python 搭建登陆系统_Django 搭建CMDB系统完整[1](用户登录)
- android 原始定位,安卓原生定位
- FZOJ 2014年11月份月赛 ytaaa(dp + RMQ)
- 华为p4用鸿蒙系统吗_华为正式发布鸿蒙OS Beta版,网友:荣耀还能用上鸿蒙吗
- Ansible批量在远程主机执行命令
- socket编程和进程线程同步跟新
- 现代通信原理5.1:信号的希尔伯特变换
- cmake 交叉编译工具链
- 社区之星任玉刚:Android开发者的职场规划
- 手机Web开发框架集
- linuxGame:文明5汉化
- 二分图匹配Hopcroft-Carp算法介绍
- python基础训练—列表
- raid5什么意思?如何做raid5?raid5 几块硬盘?
- 如何快速去除抖音短视频水印
- 批量删除数码照片或手机中的相机参数和个人隐私信息
- Hive的Parquet存储与LZO压缩
热门文章
- 论述题:会软件操作≠会做有限元分析(100分)
- Unity提示Error Asset Refreshing
- 【小白学java】D36》》》线程入门学习,线程同步机制 和 线程等待与唤醒机制
- 我的世界java版建绿宝石农场_我的世界:你会用新版手动绿宝石农场吗?灾厄巡逻队搭配地狱门!...
- 职称计算机ppt2003窍门,(2013职称计算机职称考试PPT2003试题及操作步骤.doc
- 【个人随笔】被跳蚤咬了,或者被虫子咬了之后很痒,解决办法!!
- 超纯水17.5M以上制备树脂详情参数 纯水抛光树脂 半导体纯水制备要求
- c#里的bindingsource和bindingnavigator
- 功能:html5录音
- Hadoop大数据系统架构(深入浅出)