目录

1.命中率HR(Hits Ratio)

2.归一化折损累计增益(Normalized Discounted Cumulative Gain,NDCG)

3.平均倒数排名(Mean Reciprocal Rank,MRR)

4.ILS

5.AUC&GAUC

6.Recall

7.覆盖率

9.半衰期(half-life-utility )

10.排序偏差准确率(rank-biased precision,RBP)

11.Mean Average Precision (MAP)

12.多样性

13.新颖性

14.稳定性指标:Mean Absolute Shift(平均绝对位移,MAS)


1.命中率HR(Hits Ratio)

意义:关心用户想要的,我有没有推荐到,强调预测的“准确性”

参数说明:
N:用户的总数量
hits(i):第i个用户访问的值是否在推荐列表中,是则为1,否则为0

2.归一化折损累计增益(Normalized Discounted Cumulative Gain,NDCG)

意义:关心找到的这些项目,是否放在用户更显眼的位置里,即强调“顺序性“

参数说明:
N:用户的总数量
p i : 第 i 个 用 户 的 真 实 访 问 值 在 推 荐 列 表 的 位 置 , 若 推 荐 列 表 不 存 在 该 值 , 则 p i → ∞ p_{i}:第i个用户的真实访问值在推荐列表的位置,若推荐列表不存在该值,则p i→∞

3.平均倒数排名(Mean Reciprocal Rank,MRR)

意义:关心找到的这些项目,是否放在用户更显眼的位置里,即强调“顺序性“

参数说明:
N:用户的总数量
pi : 第 i 个 用 户 的 真 实 访 问 值 在 推 荐 列 表 的 位 置 , 若 推 荐 列 表 不 存 在 该 值 , 则 pi → ∞ p_{i}:第i个用户的真实访问值在推荐列表的位置,若推荐列表不存在该值,则pi​→∞

4.ILS

意义:衡量推荐列表多样性的指标,计算公式:

如果,S(bi​,bj​)计算的是 i ii和j jj两个物品的相似性,如果推荐列表中的物品越不相似,ILS越小,那么推荐结果的多样性越好。

5.AUC&GAUC

定义:对于二分类问题:

准确度:  ,精确率:  ,

召回率: , TPR(True Positive Rate):

FPR(越低越好):  , F1-Score:  

ROC :Receiver Operating Characteristic.
有些分类器(如朴素贝叶斯) , 输出的是 <预测类别, 概率> 的形式, 取不同的阈值, 就可以在当前数据集上得到不同的指标. 以FPR 为横轴,TPR为纵轴,画出来的就是ROC曲线。

GAUC:Group AUC, AUC的一个变种, 常用于{推荐,计算广告} 等个性化场景, 通常以user作为group的维度, 即 user weighted AUC.
AUC 是全局样本排序能力的一个体现, GAUC 侧重于单个user下样本间的排序能力, 以此作离线指标, 对线上AB效果的参考性更强.
 , 其中,AUCu表示该user下样本所组成数据集的AUC。

AUC实现代码:

import numpy as np
from sklearn.metrics import roc_auc_scorey_true = np.array([0, 0, 1, 1])
y_scores = np.array([0.1, 0.4, 0.35, 0.8])
print("AUC is ", roc_auc_score(y_true, y_scores))   # 0.75

6.Recall

定义:预测的topN,与用户实际点击的交集大小,除以实际点击的大小之和。

公式:

7.平均绝对误差(Mean Absolute Error, MAE)和标准平均绝对误差(NMAE)

定义: , 

其中,rmax和rmin分别为用户u评分区间的最大值和最小值。

8.均方根误差(Root Mean Squared Error, RMSE)和均方误差(MSE)

定义: 

去掉根号即是MSE;

7.覆盖率

定义:推荐系统能够推荐出来的物品占总物品的比例。覆盖率越高表明模型能够针对更多的item产生推荐,从而促进长尾效应的挖掘。

定义:

此外,信息熵和基尼系数也可用来度量覆盖率。

8.Average Racipocal High ARHR

定义:加权版的HR, 衡量一个item被tui-h1m   i

9.半衰期(half-life-utility )

定义:度量的是推荐系统对一个用户的实用性也即是用户真实评分和系统默认评分值的差别;

10.排序偏差准确率(rank-biased precision,RBP)

定义:与 DCG 指标不同,排序偏差准确率(rank-biased precision,RBP)假设用户往往先浏览排在推荐列表首位的商品然后依次以固定的概率p浏览下一个,以1−p的概率不再看此推荐列表。

11.Mean Average Precision (MAP)

 , 其中, 

12.多样性

13.新颖性

14.稳定性指标:Mean Absolute Shift(平均绝对位移,MAS)

参考:

【1】https://blog.csdn.net/shiaiao/article/details/109004341

【2】推荐系统有哪些常用的评价标准-SofaSofa

【3】推荐系统研究中常用的评价指标 - 知乎

推荐系统常用评价指标相关推荐

  1. 推荐系统常用评价指标和代码实现

    评价指标 Recall 名称: 召回率(真阳性率) 意义:在推荐系统中,我们只关心正确推荐的有多少,也就是用户真实喜欢的,并不会关心推荐错的,所以我们用召回率,而不是准确率: 理解这个前提:混淆矩阵 ...

  2. 推荐系统常用评价指标:NDCG、Recall、Precision、Hit Rate

    评价指标 NDCG Normalized Discounted Cumulative Gain(归一化折损累计增益) NDCG用作排序结果的评价指标,评价排序的准确性. 推荐系统通常为某用户返回一个i ...

  3. 推荐系统:常用评价指标总结【准确率、精确率、召回率、命中率、(归一化折损累计增益)NDCG、平均倒数排名(MRR)、ROC曲线、AUC(ROC曲线下的面积)、P-R曲线、A/B测试】

    1.Recall(召回率)与Precision(精确率) 网站在提供推荐服务时,一般是给用户一个个性化的推荐列表,这种推荐叫做TopN推荐,TopN推荐的预测准确率一般通过召回率和精确率来度量. 在介 ...

  4. 推荐系统常用的评价指标:HR、NDCG、MRR

    推荐系统常用的评价指标 应用背景介绍 评价指标的知识来源 命中率HR(Hits Ratio) 归一化折损累计增益(Normalized Discounted Cumulative Gain,NDCG) ...

  5. 推荐系统常用的推荐算法

    转载自  推荐系统常用的推荐算法 一.推荐系统概述和常用评价指标 1.1 推荐系统的特点 在知乎搜了一下推荐系统,果真结果比较少,显得小众一些,然后大家对推荐系统普遍的观点是: (1)重要性UI> ...

  6. 预测评价系统_「机器学习」一文读懂分类算法常用评价指标

    前言 评价指标是针对将相同的数据,输入不同的算法模型,或者输入不同参数的同一种算法模型,而给出这个算法或者参数好坏的定量指标. 在模型评估过程中,往往需要使用多种不同的指标进行评估,在诸多的评价指标中 ...

  7. 推荐系统的评价指标总结

    评价一个推荐系统的好坏的重要性不用多少.本文的总结非常的全面,相信读者通过阅读本文以及本文参考的文献可以对推荐系统的评价指标有比较全面的掌握. 对推荐系统的研究一个重要的环节是如何评价一个推荐算法的好 ...

  8. 推荐系统常用的推荐算法总结

    一.推荐系统的概述 个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品.随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品.这种浏 ...

  9. 错误类型、混淆矩阵及目标检测常用评价指标

    目标检测常用评价指标 本文主要参考陈恺大佬在B站商汤账号的介绍mmdetection的视频. 检测结果的正确/错误类型 真阳性(Ture Positive):算法检测到了某类物体(Positive), ...

最新文章

  1. 图解使用CURL下载和上传文件
  2. java最大子方阵_Java实验(5) 最大子方阵
  3. Halcon:模版匹配
  4. SSH2 后端编程思路总结
  5. [C++] string
  6. uni.share失效 无法唤醒微信 而且还卡住的情况
  7. python实现池化操作
  8. hihocoder-Week195-奖券兑换
  9. 记一次 Ubuntu Linux 动态调整分区空间
  10. “科创中国”创新资源共享平台助力2020年“企业创新大家谈”活动
  11. Android Q 修改Fingerprint
  12. 【运动学】基于matlab EKF姿态估计【含Matlab源码 1638期】
  13. java int 运算符,java中各种运算符
  14. ceph存储 FC HBA、iSCSI HBA、以太网卡3者区别
  15. 利用redis代替session保存用户 减少tomcat压力
  16. 职场神攻略:5分钟自我介绍法 快准狠!
  17. 六轴机器人光机_烂大街的六轴机器人
  18. Wallabag——开源稍后读知识管理服务工具
  19. 在线客服系统如何应对移动化市场需求
  20. Python+pyc文件编译和运行

热门文章

  1. 前端词汇A、B、C、D、E、F
  2. Unity3D服务器端使用PhysX计算物理
  3. 一个列子让你弄懂SpringBoot实现后台框架的搭建
  4. 人均年薪70万!华为项目经理达到了哪些标准?
  5. actix-web -介绍
  6. Windows提权资料搜集
  7. 半年报信号!良品铺子的稳健增长与长期势能
  8. MP:精神疾病患者和正常发育人群皮层特征的共同模式
  9. Tensorflow数据读取篇之一 ——字节与张量的区别
  10. ATM取款机小程序——Java