前言

所谓“物以类聚,人以群分”,基于用户的协同过滤算法就是基于这个原理来实现的。

你可能听过“啤酒与尿不湿”的故事:通过对一家超市的销售数据分析发现,有很多人在购买啤酒的同时又购买了尿不湿,这就是基于物品的协同过滤算法的案例。

读完本文你可以了解这两种算法的原理,并学会如何实现这两种算法。

1 基于用户的协同过滤算法

我们在生活中如何找到自己喜欢的商品呢?比如你想买一件衬衫,可能会看一下或者问一下周围的朋友都穿什么样的衬衫,在朋友的影响下,你有很大概率会到线上网店或者线下实体店中看一下这件衬衫。在推荐系统中,这就是一种向用户推荐感兴趣商品的方法,叫基于用户的协同过滤算法。

根据这个思路,我们可以看出基于用户的协同过滤算法主要分为2个步骤。

(1)找到和目标用户兴趣相似的用户。

这一步的关键是找到和目标用户相似的用户。我们看一下,在电商产品中如何通过用户的数据找到和目标用户相似的用户。

比如用户的下单数据为:①用户A下单购买了商品a、b、c;②用户B下单购买了商品a;③用户C下单购买了商品a、b。

通过这个简单的例子,我们可以看出,A和C的相似度显然高于A和B的相似度,因为A和C同时购买了商品a、b,而A和B仅仅同时购买了商品a。

那么如何通过算法计算用户A、B、C之间的相似度呢?这里可以引入余弦相似度公式。

数据中台推荐系统入门(二):两种经典的推荐算法相关推荐

  1. 数据中台推荐系统入门(三):推荐系统的评测指标

    前言 本文介绍一下推荐系统的相关评测指标.推荐系统的数据指标分为两种. (1)商业指标,即推荐系统的与最终交易额相关的指标.我们做推荐系统的目的是为了代替人工给用户推荐商品,提高效率,实现千人千面的用 ...

  2. 数据中台实战入门篇:数据中台对内、对外合作机制

    前言 之前文章讲了 <数据中台实战入门篇:双中台战略>,主要解决了什么是中台.什么是数据中台.业务中台.什么公司适合搭建双中台体系这几个问题.本篇文章讲一下数据中台的人员构成.内部如何合作 ...

  3. mysql数据存储方式_数据存储在mysql的两种方式

    数据存储在mysql的两种方式 发布时间:2020-05-12 16:16:25 来源:亿速云 阅读:250 作者:三月 下文主要给大家带来数据存储在mysql的两种方式,希望这些内容能够带给大家实际 ...

  4. html css导航栏字体图标,HTML+CSS入门之两种图标字体库

    本篇教程介绍了HTML+CSS入门之两种图标字体库,希望阅读本篇文章以后大家有所收获,帮助大家HTML+CSS入门. < ## 0. 前言 比较基础的图标加载:和块元素的背景background ...

  5. java实参将数据传递给形参的两种形式

    java实参将数据传递给形参的两种形式 /*** java实参将数据传递给形参的两种形式* 1,按值传递* 2,按引用传递* * 当参数是基本数据类型时,数据不占用堆内存,按值传递* 当参数是引用类型 ...

  6. 推荐系统入门(十):新闻推荐实践5(附代码)

    推荐系统入门(十):新闻推荐实践5(附代码) 目录 推荐系统入门(十):新闻推荐实践5(附代码) 前言 LGB模型 DIN模型 一.排序模型 1.LGB排序模型 2.LGB分类模型 3.DIN模型 二 ...

  7. 推荐系统入门(七):新闻推荐实践2(附代码)

    推荐系统入门(七):新闻推荐实践2(附代码) 目录 推荐系统入门(七):新闻推荐实践2(附代码) 引言 数据收集 数据存储 数据分析 实战 总结 参考资料 引言 相关系列笔记: 推荐系统入门(一):概 ...

  8. 推荐系统入门(六):新闻推荐实践1(附代码)

    推荐系统入门(六):新闻推荐实践1 目录 推荐系统入门(六):新闻推荐实践1 前言 赛题简介 数据概况 评价方式理解 Baseline 总结 参考资料 前言 相关系列笔记: 推荐系统入门(一):概述 ...

  9. HashMap遍历的两种方式,推荐使用entrySet()

    转自:HashMap遍历的两种方式,推荐使用entrySet() 第一种: Map map = new HashMap(); Iterator iter = map.entrySet().iterat ...

最新文章

  1. Binder相关面试总结(二):Binder到底是什么?
  2. [转]小硕3年是怎样发6篇SCI的
  3. OneZero团队Beta发布剧透
  4. Marketing Cloud里使用了哪个版本的UI5 Odata模型?
  5. OSGI –模块化您的应用程序
  6. hadoop--Reduce Join
  7. [转载] python 闭包和装饰器详解
  8. win7桌面背景_win7桌面背景怎么改?
  9. 《自卑与超越》读书笔记优秀范文3200字
  10. ENVI中FLAASH大气校正中的Atmosphere Model选项各含义
  11. app运营推广投放策略
  12. 千年后,邂逅属于你的游园梦:华为带给智慧园区的生态鼎新
  13. 放弃高薪的程序员,体制内或许才是最好的归宿
  14. laravel admin里百度编辑器自定义路径和文件名
  15. 品牌IP打造的实用性教程
  16. 青龙面板快s极速版(本地)
  17. Nagios监控服务器与客户端的安装
  18. python爬取12306_Python 爬取12306火车票
  19. java道路上需要坚挺
  20. 广东省英语听说计算机考试时间,2020高考首战!广东/福建等31省市英语听说+听力时间汇总,这些考生每年要考两次...

热门文章

  1. 移动支付漏洞大 没密码也能买买买
  2. 在Windows上启用LDAPs
  3. SSL证书安装指南 - Winodws 2003 Server IIS 6.0
  4. [票据打印]打印走纸控制(1) - 设置纸型
  5. KEIL和source insight混合编辑时,文本对齐的方式
  6. python基础学习[python编程从入门到实践读书笔记(连载四)]:数据可视化项目第15章
  7. java注释的简单_Java简单注解
  8. python凯撒密码加密写入文件_Python用户名密码登录系统(MD5加密并存入文件,三次输入错误将被锁定)及对字符串进行凯撒密码加解密操作...
  9. linux 内核抓包功能实现基础(二) netfilter处理
  10. python编写es脚本_es数据迁移脚本(python)