P1_1 推荐系统

  • 推荐引擎:
    • 案例分析
    • 推荐方式
    • 个性化推荐
    • 推荐系统的本质
    • 相似度度量方法
    • 推荐系统的核心:
    • 推荐系统组成:

推荐引擎:

通过探寻不同物品(产品Item、Product)或者不同用户之间喜好的联系,用于预测用户喜好的物品。

案例分析

以亚马逊图书推荐为例:
Spark机器学习
-a. 推荐一: 1 Product
经常一起购买的商品
-b. 推荐二: 5 * 12 = 60 Product
浏览此商品的顾客也同时浏览
-c. 推荐三: 5 * 20 = 100 Product
购买此商品的顾客也同时购买

以JD商品推荐为例:
樱桃(Cherry)MX-Board 2.0 G80-3801机械键盘
-a. 推荐一:人气配件
购买此Product同时购买Product
-b. 推荐二:针对不同配件
推荐TopKey个Product
-c. 推荐三:达人选购
购买最多类似Product,推荐
-d. 推荐四:看了又看
同时浏览的类似Product
-e. 推荐五:键盘热销榜
同价位、同品牌、总排行

推荐方式

以看电影为例,推荐系统几种方式:
1.向朋友咨询,称为社会化推荐(social recommendation),即让好友给自己推荐物品;
2.搜素引擎搜索,称为基于内容的推荐(content-based filtering),寻找和自己之前看过的电影在内容上相似的电影。
3.找到和自己历史兴趣相似的一群用户,看看他们最近在看什么电影,称为**基于协同过滤(collaborative filtering)**的推荐。

个性化推荐

个性化推荐系统需要依赖用户的行为数据,一般都是作为一个应用存在与不同网站之中。在互联网的各类网站中都可以看到推荐系统的应用,而个性化推荐系统在这些网站中的主要作用是通过分析大量用户行为日志,给不同用户提供不同的个性化页面,来提高网站的点击率和转化率。

推荐系统的本质

寻找不同物品之间或不同用户之间的相似度

相似度度量方法

同现相似度:
wij=∣N(i)⋂N(j)∣∣N(i)∣w_{ij}=\frac{|N(i) \bigcap N(j)|}{|N(i)|} wij​=∣N(i)∣∣N(i)⋂N(j)∣​
欧式距离(Euclidean Distance)
d(x,y)=∑(xi−yi)2sim(x,y)=11+d(x,y)d(x,y)=\sqrt{\sum(x_i - y_i)^2} \quad sim(x,y)=\frac{1}{1+d(x,y)} d(x,y)=∑(xi​−yi​)2​sim(x,y)=1+d(x,y)1​
皮尔逊相关系数(Pearson Correlation Coefficient)
ρX,Y=covX,YσXσY\rho_{X,Y}=\frac{cov{X,Y}}{\sigma_X \sigma_Y} ρX,Y​=σX​σY​covX,Y​
Cosine相似度(Cosine Similarity)
T(x,y)=x⋅y∣∣x∣∣2∗∣∣y∣∣2=∑xiyi∑xi2∑yi2T(x,y)=\frac{x \cdot y}{||x||^2*||y||^2}=\frac{\sum x_iy_i}{\sqrt{\sum x_i^2}\sqrt{\sum y_i^2}} T(x,y)=∣∣x∣∣2∗∣∣y∣∣2x⋅y​=∑xi2​​∑yi2​​∑xi​yi​​
Tanimoto系数(Tanimoto Coefficient)又称广义Jaccard系数
T(x,y)=x⋅y∣∣x∣∣2∗∣∣y∣∣2−x⋅y=∑xiyi∑xi2∑yi2−∑xiyiT(x,y)=\frac{x \cdot y}{||x||^2*||y||^2 - x \cdot y}=\frac{\sum x_iy_i}{\sqrt{\sum x_i^2}\sqrt{\sum y_i^2} - \sum x_iy_i} T(x,y)=∣∣x∣∣2∗∣∣y∣∣2−x⋅yx⋅y​=∑xi2​​∑yi2​​−∑xi​yi​∑xi​yi​​

推荐系统的核心:

产品(商品Product、Item)
系统:产生记录用户行为数据(浏览数据和购买数据)
算法:推荐系统算法和分类、回归与聚类算法

推荐系统组成:

数据
算法(online在线&offline离线)
Message System -> KAFKA
Search engine
NoSQL -> HBase、Redis
分布式计算 -> Spark
效果评测 -> 购买量,销售额 是否增加

P1_1 推荐系统 (背景介绍)相关推荐

  1. 我为什么要花3年熬几百个夜写一本推荐系统的专著?

    作者 | gongyouliu 编辑 | auroral-L 大家好,我是强哥.一个热爱暴走.读书.写作的人! 我的新书「构建企业级推荐系统:算法.工程实现与案例分析」终于出版啦!这是一本大部头的书, ...

  2. 「构建企业级推荐系统系列」实时个性化推荐介绍

    作者 | gongyouliu 编辑 | auroral-L 随着互联网的深入发展和产品布局的多元化,越来越多的企业通过提供快节奏的产品及服务消耗用户的碎片化时间,从而赢得用户的青睐.这类产品通过便捷 ...

  3. 深入理解YouTube推荐系统算法!

    之前天池-安泰杯跨境电商智能算法大赛是我初次接触推荐相关的比赛,通过比赛让我对推荐系统有了较为浅显的认识,赛后也是打算系统的学习这方面的内容,此后我也会将[推荐系统]作为一个系列板块进行更新,主打经典 ...

  4. 全新的深度模型在推荐系统中的应用

    文章作者:周浩 第四范式 研究员 编辑整理:汪方野 出品平台:第四范式天枢.DataFunTalk 导读:如今,在电子商务.物联网等领域,推荐系统扮演着越来越重要的地位.如何根据用户的历史行为和项目的 ...

  5. 【推荐系统】深入理解推荐系统:无需人工特征工程的xDeepFM

    [推荐系统]专栏历史部分文章: 深入理解推荐系统:召回 深入理解推荐系统:排序 深入理解推荐系统:Fairness.Bias和Debias 深入理解推荐系统:推荐系统中的attention机制 深入理 ...

  6. 【推荐系统】深入理解推荐系统:排序

    写在前面 [推荐系统]专栏历史文章: 深入理解推荐系统:召回 深入理解YouTube推荐系统算法 作为[推荐系统]系列文章的第三篇,将以"排序"作为今天的主角,会从四个方面来介绍推 ...

  7. 【推荐系统】深入理解YouTube推荐系统算法

    去年天池-安泰杯跨境电商智能算法大赛是我初次接触推荐相关的比赛,通过比赛让我对推荐系统有了较为浅显的认识,赛后也是打算系统的学习这方面的内容,此后我也会将[推荐系统]作为一个系列板块进行更新,主打经典 ...

  8. 何向南教授团队最新综述:对话推荐系统中的进展与未来挑战

    ©作者|高崇铭.雷文强等 来源|社媒派SMP 背景介绍 推荐系统为工业界带来了巨大的收益.大多数推荐系统都是以静态的方式工作,即从用户历史的交互中来推测用户的兴趣爱好从而做出推荐.然而,这样的方式有缺 ...

  9. 会议交流 | 如何提升推荐系统的可解释性?——DataFunSummit2022知识图谱在线峰会...

    背景介绍 知识图谱及特征学习结合智能推荐,可解决数据稀疏性及冷启动问题,更好的提升推荐决策场的准确性.多样性及可解释性,进而提升各个场景的推荐决策效率和体验. 3月12日13:30-16:50,在Da ...

最新文章

  1. wParam和lParam两个参数到底是什么意思?
  2. Struts2用户输入验证(6)
  3. [Java基础]让Map value自增
  4. mybatis的注解开发之三种动态sql
  5. Linux 开机显示:welcome to emergency mode
  6. 一步步编写操作系统 38 一级页表与虚拟地址3
  7. (王道408考研操作系统)第二章进程管理-第三节2:实现进程互斥的软件方法
  8. jboss esb 学习笔记与html的传输,Jboss_ESB学习笔记1.doc
  9. Django 框架 新建app 、新建表
  10. python界面编程实例_python GUI库图形界面开发之PyQt5美化窗体与控件(异形窗体)实例...
  11. 计算机组成原理—指令格式
  12. java import lang_要使用lang包中的类,必须用import语句将java.lang程序包引入到源程序。...
  13. 《深入浅出统计学》总结
  14. C语言自己编写头文件
  15. 求助,WIN10系统,我的推特用不了,提示网络没连接,其实我网络是好的,求大神指点,万分感谢!
  16. 我们应该如何看待牛市熊市?到了牛市熊市有什么标志吗?
  17. 你好,世界:第一个Java程序(《Java与Python学习通法》)
  18. uni-app中内嵌u-charts图标导致页面在图表无法滑动
  19. 沁园春计算机,借助电脑软件教学生写“沁园春”
  20. 数字电路----加法器的实现

热门文章

  1. g++提醒:file format not recognized; treating as linker script
  2. CPU外频倍频、主板晶振与内存异步工作
  3. 定时任务每秒执行、每分钟执行、每小时执行、每天执行、每周执行、每月执行、每年执行、定时任务重复执行、循环执行
  4. 在小程序授权公众号,获取公众号的code(前端)
  5. PowerDesigner反向工程并添加注释,导出表到word
  6. 为什么程序员找不到女朋友?
  7. 本地门户 PHP,基于ThinkPHP框架开发的本地智慧生活门户O2O系统V3.9.9全新界面商业版+PC和WAP端多个功能+商家+物业+社区+街道办独立后台...
  8. 用户画像理论和搭建过程
  9. kurento教程_如何使用WebRTC和Kurento媒体服务器,来建立视频会议App(一)
  10. 王者荣耀英雄铭文及出装