文章目录

  • 显著性评价指标
    • 1. 眼注视点显著性
      • Receiver Operating Characteristic curve(ROC)
      • Area Under Curve(AUC)
      • shuffled AUC(sAUC)
      • Pearsons Linear Correlation Coefficient(CC)
      • Normalized Scanpath Saliency(NSS)
      • Kullback-Leibler Divergence (KLDiv)
    • 2. 显著性目标检测
      • Mean Absolute Error
      • PR曲线
      • F-measure
    • 3. 如何得到fixation map

同步在个人博客: https://ericpengshuai.github.io/shen-du-xue-xi/582602e12ae2.html

显著性评价指标

显著性一般分为物体的显著性(saliency object detection)以及眼注视点( eye fixation saliency)的显著性,虽然两者都能展现吸引用户注意力的物体或者区域,但是侧重点不同。物体的显著性主要在于图像中各个物体轮廓的检测,具体来说就是目标检测,语义分割等等都涉及到物体的显著性;而眼注视点的显著性更多是关注用户观看的区域,和用户的观看行为有联系。由于用户在观看全景视频时,往往会关注视频中比较突出的部分,所以两者也有交集。

  • 参考1:显著性目标检测
  • 参考2:图像显著性检测算法的评价指标介绍

1. 眼注视点显著性

Receiver Operating Characteristic curve(ROC)

Area Under Curve(AUC)

Viewport-based Saliency Prediction提到这个不太好?

shuffled AUC(sAUC)

ROC 曲线又称受试者受试者工做特征曲线,以假正例率(False Positive Rate, FPR)为横轴,真正例率(True Positive Rate, TPR)为纵轴所组成的坐标图,以0~255不一样的阈值对预测的眼注视点显著图分类描点,从而绘制成曲线图。从直观上看,曲线越接近左上角,说明该算法检测性能越好;曲线下面积称之为AUC, AUC越大说明算法检测性能越好。因为AUC会受中心误差(center bias)的影响,研究者又提出更加鲁棒的sAUC评价指标。

Pearsons Linear Correlation Coefficient(CC)

CC ↑ \uparrow ↑是指皮尔逊相关系数,也是线性相关系数,用来评价预测的眼关注点显著图和参考图ground truth之间的线性相关性,CC越大说明该模型性能越好

协方差: C o v ( X , Y ) = Σ i = 1 n ( x i − E ( X ) ) ( y i − E ( Y ) ) n Cov(X,Y)=\frac{\Sigma_{i=1}^n(x_i-E(X))(y_i-E(Y))}{n} Cov(X,Y)=nΣi=1n​(xi​−E(X))(yi​−E(Y))​

感性的理解,如果数据杂乱,正负抵消,那么这个协方差就很小,就谈不上二者相关;如果数据很一致,想么协方差就负的比较多(负相关),要么就是正的比较多(正相关)

消除x和y的量差,引用皮尔逊相关系数: σ X , Y = C o v ( X , Y ) σ X ⋅ σ Y \sigma_{X,Y}=\frac{Cov(X,Y)}{\sigma_X·\sigma_Y} σX,Y​=σX​⋅σY​Cov(X,Y)​

  • 具体对于显著性而言,P和D分别代表saliency map和fixation map,被视为随机变量

C C ( P , Q ) = C o v ( P , Q ) σ ( P ) × σ ( Q ) CC(P,Q)=\frac{Cov(P,Q)}{\sigma(P)\times\sigma(Q)} CC(P,Q)=σ(P)×σ(Q)Cov(P,Q)​

参考:https://blog.csdn.net/limiyudianzi/article/details/103437093

Normalized Scanpath Saliency(NSS)

NSS ↑ \uparrow ↑是指标准化扫描路径显着性,用来评价二者之间的差别值,NSS越大说明模型性能越好;

N S S ( P , Q ) = 1 N ⋅ Σ i ( P ‾ i × Q i ) NSS(P,Q)=\frac{1}{N}·\Sigma_i({\overline P_i}\times Q_i) NSS(P,Q)=N1​⋅Σi​(Pi​×Qi​)

其中P是saliency map,Q是fixation map的二值图,其中i是像素的下标,N是所有的像素值总数,N is the total number of fixated pixels, P ‾ = P − μ ( P ) σ ( P ) \overline P=\frac{P-\mu(P)}{\sigma(P)} P=σ(P)P−μ(P)​

Kullback-Leibler Divergence (KLDiv)

KLDiv ↓ \downarrow ↓是指KL散度,Kullback-Leibler (KL) 是一种广泛使用的信息论度量,用于衡量两个概率分布之间的差异。KLDiv越小说明该模型检测性能越好。

K L ( P , Q ) = Σ i Q i l o g ( ϵ + Q i ϵ + P i ) KL(P,Q)=\Sigma_iQ_ilog(\epsilon+\frac{Q_i}{\epsilon+P_i}) KL(P,Q)=Σi​Qi​log(ϵ+ϵ+Pi​Qi​​)

其中 ϵ \epsilon ϵ表示正则化常数,KL是非对称差异度量

具体再参考:https://blog.csdn.net/matrix_space/article/details/80550561

  • 参考1:What Do Different Evaluation Metrics Tell Us About Saliency Models? IEEE TPAMI 2019
  • 参考2:Deep Visual Attention Prediction IEEE TIP 2018

2. 显著性目标检测

Mean Absolute Error

MAE是指平均绝对值偏差,用于评价预测的显著图和参考图之间的差别,MAE越小说明该算法性能越好;

M A E ↓ = 1 W × H ∑ W x = 1 ∑ H y = 1 ∣ S ‾ ( x , y ) − G ‾ ( x , y ) ∣ MAE \downarrow = \dfrac{1}{W \times H}\sum{W}_{x=1}\sum{H}_{y=1}| \overline{S}(x,y)-\overline{G}(x,y) | MAE↓=W×H1​∑Wx=1​∑Hy=1​∣S(x,y)−G(x,y)∣

PR曲线

Precise是差准率,Recall是查全率,将图像二值化之后计算:

P r e c i s i o n = T P T P + F P Precision=\frac{TP}{TP+FP} Precision=TP+FPTP​ 以及 R e c a l l = T P T P + F N Recall=\frac{TP}{TP+FN} Recall=TP+FNTP​

将输出图片S进行二值化时,阈值选择为从0到255,每取一个阈值,即可对所有输出图S算得一组相对应的Precision值与Recall值。最后将所有图像在该阈值下的Precision值与Recall值分别求平均,最后将会得到256对P,R值,以Recall为横坐标,Precision为纵坐标绘制曲线图即可得到precision-recall (PR)曲线。

F-measure

查全率查准率在非负权重β下的加权调和平均值(Weighted Harmonic Mean) ,计算公式如下:

F β ↑ = ( 1 + β 2 ) P r e c i s i o n ∗ R e c a l l β 2 P r e c i s i o n + R e c a l l F_\beta \uparrow =\frac{(1+\beta^2)Precision*Recall}{\beta^2Precision+Recall} Fβ​↑=β2Precision+Recall(1+β2)Precision∗Recall​

β 2 \beta^2 β2一般取值为0.3,即增加了Precision的权重值,认为查准率比查全率要重要些。因为当模型将输出图全部标为目标区域时,查全率Recall将等于100%,但是查准率Precision却很低。

  • ROC (Receiver Operating Characteristic curve)
  • AUC (Area Under Curve)
  • MAP (Mean Average Precision)
  • MAR (Mean Average Recall)

上述评价指标中,ROC与AUC相似于眼注视点任务,都是用不一样的阈值来肯定描点位置,而后将全部点链接起构成ROC曲线;

MAP是指平均精度率,MAR是指平均召回率,MAR和MAP越大说明算法性能越好。

3. 如何得到fixation map

计算以上这些指标的时候需要得到fixation map,好像可以考虑OpenCV里面的高斯模糊函数等。未完待续……

显著性评价指标:眼注视点和目标检测指标(附参考论文)相关推荐

  1. 目标检测指标TP、FP、TN、FN和Precision、Recall

    目标检测指标TP.FP.TN.FN,Precision.Recall 1. IOU计算 在了解Precision(精确度).Recall(召回率之前我们需要先了解一下IOU(Intersection ...

  2. 52 个深度学习目标检测模型汇总,论文、源码一应俱全!(附链接)

    来源:AI有道 本文约2000字,建议阅读5分钟 本文给你总结52个深度学习检测模型. 标签:计算机视觉 目标检测作为计算机视觉中的一个重要分支,近些年来随着神经网络理论研究的深入和硬件 GPU 算力 ...

  3. 52 个深度学习目标检测模型汇总,论文、源码一应俱全

    本文约2000字,建议阅读5分钟 本文给你总结52个深度学习检测模型. 标签:计算机视觉 目标检测作为计算机视觉中的一个重要分支,近些年来随着神经网络理论研究的深入和硬件 GPU 算力的大幅度提升,一 ...

  4. 目前最全:52 个深度学习目标检测模型汇总,论文、源码一应俱全!

    文章来源:https://zhuanlan.zhihu.com/p/115035951 作者:红色石头 目标检测作为计算机视觉中的一个重要分支,近些年来随着神经网络理论研究的深入和硬件 GPU 算力的 ...

  5. faster rcnn论文_52 个深度学习目标检测模型汇总,论文、源码一应俱全!(附链接)...

    来源:AI有道 本文约2000字,建议阅读5分钟 本文给你总结52个深度学习检测模型. 标签:计算机视觉目标检测作为计算机视觉中的一个重要分支,近些年来随着神经网络理论研究的深入和硬件 GPU 算力的 ...

  6. 多模态深度学习综述总结 与 目标检测多模态融合领域论文推荐

    文章目录 一.多模态学习定义及应用 二.模态表示 2.1 单模态表示 2.1.1 语句模态表示 2.1.2 视觉模态表示 2.1.3 声音模态表示(略) 2.2 多模态表示 2.2.1 模态共作用语义 ...

  7. 一文总结旋转目标检测全面综述:论文方法与代码

    参考一文总结旋转目标检测全面综述:论文方法与代码 - 云+社区 - 腾讯云 首先放上DOTA数据集官网(http://captain.whu.edu.cn/DOTAweb/index.html),官网 ...

  8. CVPR21小目标检测:上下文和注意力机制提升小目标检测(附论文下载)

    计算机视觉研究院专栏 作者:Edison_G CVPR21文章我们也分享了很多最佳的框架,在现实场景中,目标检测依然是最基础最热门的研究课题,尤其目前针对小目标的检测,更加吸引了更多的研究员和企业去研 ...

  9. 旋转目标检测 | 基于高斯Wasserstein距离损失的目标检测(附源代码)

    计算机视觉研究院专栏 作者:Edison_G 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 源码获取|扫码回复"GWD"获取源码 边界不连续及其与 ...

最新文章

  1. JDK 13 新特性一览
  2. debian 升级glibc
  3. 【蓝桥杯】 2018年国赛 矩阵求和
  4. [html] iOS下页面如何启动加载时显示画面图片?如何设置大小?它有什么好处?
  5. Python高级——mini_web框架(实现web框架接口,数据库连接)
  6. Android笔记 隐式意图demo
  7. 1249 Problem Q
  8. MYSQL-常用函数
  9. 数据采集程序(网页小偷)点滴心得
  10. android的otg功能,android怎么打开otg功能
  11. opencv转码,分辨率大小导致的bug
  12. LSF_安装(UNIX or Linux)
  13. 绩效考核指标KPI 听课笔记
  14. 数据结构——数据结构算法之《图》
  15. 能用计算机做什么作文,关于描写计算机的作文
  16. baidu+app+per+android,超级授权管理 SuperSU v2.82 SR5 for Android
  17. 达内培训python费用
  18. winform中的UI刷新总结
  19. usaco Horseshoes
  20. 无线电视,有线电视和卫星电视

热门文章

  1. 年薪20W的自动化测试工程师教你用Postman做接口测试
  2. 送给母亲们的三行诗!
  3. 正则表达式匹配非,以及非字符串的匹配
  4. 基于阿童木的MCA来了
  5. 计算机广告制作学几年能学好,计算机广告制作(高级)专业介绍
  6. line-clamp
  7. 国内银行接连爆出数据泄露事件,金融行业如何在源头处建立防线
  8. Android 高仿74款APP
  9. 腾讯游戏原来是这样使用 Prometheus 的!(上)
  10. geohash 总结