Wasserstein距离

Wasserstein距离也叫做推土机距离(Earth Mover's distance),简称EMD,用来表示两个分布的相似程度。EMD是2000年IJCV期刊文章《The Earth Mover's Distance as a Metric for Image Retrieval》提出的一种直方图相似度量(作者在之前的会议论文中也已经提到,不过鉴于IJCV的权威性和完整性,建议参考这篇文章)。这也是由于它的推导过程可以很形象的用挖土填土来解释,这也是因为该距离定义中由一个分布转变为另一个分布所需要的代价和挖土填土的过程十分相似。

假设有两个工地P和Q,P工地上有m堆土,Q工地上有n个坑,现在要将P工地上的m堆土全部移动到Q工地上的n个坑中,所做的最小的功。

每堆土我们用一个二元组来表示(p,w),p表示土堆的中心,w表示土的数量。则这两个工地可表示为:

每个土堆中心pi到每个土坑中心qj都会有一个距离dij,则构成了一个m*n的距离矩阵。

那么问题就是我们希望找到一个流(flow),当然也是个矩阵[fij],每一项fij代表从pi到qj的流动数量,从而最小化整体的代价函数:

问题描述清楚了:就是把P中的m个坑的土,用最小的代价搬到Q中的n个坑中,pi到qj的两个坑的距离由dij来表示。fij是从pi搬到qj的土的量;dij是pi位置到qj位置的代价(距离)。要最小化WORK工作量。EMD是把这个工作量归一化以后的表达,即除以对fij的求和。

EMD公式:

https://www.cnblogs.com/denny402/p/7054950.html

案例sample:考虑两个离散的分布P和Q

为了让两个分布相同,我们一个个变量地观察,

  • *为了让P1和Q1相同,我们需要P1把手头上的3分2到P2去,这样P1和Q1都等于1,此时P2=4,其他数保持不变,这个过程是不是十分像挖掉P1的土填到P2上~
  • 为了让P2和Q2相同,我们也要做类似的挖土填土工作,但注意,此时P2手头上由P1填的2,因此现在P2是4,但是Q2依然是2,因而P2也要挖2分土给P3,保持和Q2一样。
  • P3和Q3也是一样,但此时P3为3,Q3为4,因为我们只能先挖土再填土,因此要Q3挖1分土给Q4,这样P4和Q4也能够一样。

每一步的代价计算公式为 ,第0步我们规定为0,故有

所以最终的总代价,也即Wasserstein距离则为

Wasserstein距离笔记相关推荐

  1. GWD:基于高斯Wasserstein距离的旋转目标检测 | ICML 2021

      论文详细描述了当前旋转目标检测的主要问题,提出将旋转回归目标定义为高斯分布,使用Wasserstein距离度量高斯分布间的距离用于训练.目前,常规目标检测也有很多将回归转化为概率分布函数的做法,本 ...

  2. 当支持向量机遇上神经网络:这项研究揭示了SVM、GAN、Wasserstein距离之间的关系...

    选自arXiv 作者:Alexia Jolicoeur-Martineau 编辑:小舟.蛋酱 转载自公众号:机器之心 SVM 是机器学习领域的经典算法之一.如果将 SVM 推广到神经网络,会发生什么呢 ...

  3. wasserstein距离_EMD(earth mover#x27;s distances)距离

    对于离散的概率分布,Wasserstein距离也被描述为推土距离(EMD).如果我们将分布想象为两个有一定存土量的土堆,那么EMD就是将一个土堆 转换 为另一个土堆所需的最小总工作量.工作量的定义是 ...

  4. 使用Wasserstein距离鉴别器的无监督图对齐

    来源:专知本文为论文,建议阅读5分钟 图对齐的目的是识别跨多个图的节点对应,这在各个领域具有重要意义. 图对齐的目的是识别跨多个图的节点对应,这在各个领域具有重要意义.由于监督信息往往是不可获取的,无 ...

  5. EMNLP 2020 | 基于Wasserstein距离的正则化序列表示

    ©PaperWeekly 原创 · 作者|金金 单位|阿里巴巴研究实习生 研究方向|推荐系统 论文标题: Wasserstein Distance Regularized Sequence Repre ...

  6. WGAN的成功,可能跟Wasserstein距离没啥关系

    ©PaperWeekly 原创 · 作者|苏剑林 单位|追一科技 研究方向|NLP.神经网络 WGAN,即 Wasserstein GAN,算是 GAN 史上一个比较重要的理论突破结果,它将 GAN ...

  7. 从Wasserstein距离、对偶理论到WGAN

    作者丨苏剑林 单位丨广州火焰信息科技有限公司 研究方向丨NLP,神经网络 个人主页丨kexue.fm 2017 年的时候笔者曾写过互怼的艺术:从零直达WGAN-GP,从一个相对通俗的角度来介绍了 WG ...

  8. Wasserstein距离在生成模型中的应用

    作者丨黄若孜 学校丨复旦大学软件学院硕士生 研究方向丨推荐系统 前言 本文是关于 Wasserstein 距离在生成模型中的应用的一个总结,第一部分讲 Wasserstein 距离的定义和性质,第二部 ...

  9. 信息量、信息熵、交叉熵、KL散度、JS散度、Wasserstein距离

    前两篇介绍了目标检测中的回归损失函数,本来这篇打算介绍目标检测中的分类损失函数.但是介绍classification loss function自然绕不过交叉熵,所以还是简单的把信息论中的一些概念在这 ...

最新文章

  1. 打造AI产教融合共赢生态,微软亚洲研究院扩大开放了这些资源
  2. 约束布局ConstraintLayout看这一篇就够了
  3. MegaRAID阵列卡配置RAID阵列 - WebBIOS - CLI
  4. 百度地图轨迹开发,如何绘制带有箭头的折线
  5. 2019年值得关注的八大DevOps趋势
  6. docker 获取宿主机ip_Docker基础修炼6——网络初探及单机容器间通信
  7. Android 应用开发(20)--- 定义自定义应用程序权限
  8. JavaWeb:前端开发基础
  9. 基于Go语言实现高并发推荐系统架构设计
  10. dnsmasq, ipset和iptables配置
  11. Vue----组件库
  12. C语言多人对战贪吃蛇,双人对战贪吃蛇
  13. 第十七届全国大学生智能车竞赛航天智慧物流获奖证书
  14. 电脑连不上网—更改电脑ip
  15. localstorage ie11不支持
  16. 玩转Python量化金融工具之NumPy
  17. RmNet和CDC-ECM的区别,NDIS和RNDIS的区别。
  18. 硬盘串口和并口的区别
  19. Ceph新长支持稳定版本Luminous(12.x.x)新功能总结
  20. 高中新课标教材:四省营销 端倪初露

热门文章

  1. 瑞熙贝通|实验室低值易耗品管理平台V2.0
  2. Linux平台命令挂载U盘——实现数据共享
  3. VoIP和电话网络浅析
  4. 单条视频播放超6000万,涨粉24万,撒狗粮也能轻松上热门?
  5. HTML实例——鼠标跟随
  6. 企业源代码加密方案分享
  7. javascript 正则表达式 不包含
  8. 本周测试服务器角色转移系统仅开放转入,《梦幻西游2》4月7日更新内容介绍_《梦幻西游2》4月7日更新公告_飞翔教程...
  9. Oracle 多表查询与集合运算
  10. 电脑开机全是英文进不了系统怎么办