关联分析法,超详解!进来秒懂!!
关联分析的目的是找到事务间的关联性,用以指导决策行为。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的啤酒和尿布的货架摆放或捆绑销售可提高超市的服务质量和效益。又如“‘C语言’课程优秀的同学,在学习‘数据结构’时为优秀的可能性达88%”,那么就可以通过强化“C语言”的学习来提高教学效果。
接下来我会分为四部分来讲解
我们先明确一些概念:
频繁项集:经常出现在一块儿的物品的集合。
关联规则:暗示两种物品之间可能存在很强的关系。
支持度(support):
项在事务中发生的频率。
支持度表示项集{X,Y}在总项集里出现的概率。
公式为:
Support(X- +Y) = P(X,Y)/P(I) = P(X∪Y) /P(I)
其中,I表示总事务集。
置信度(Confidence): .
表示在先决条件x发生的情况下,由关联规则”X→Y"推出Y的概率。
即在含有x的项集中,含有Y的可能性,公式为:
Confidence(X-→Y)= P(Y|X) = P(X,Y)/ P(X) = P(XUY)/ P(X)
提升度(Lift):
表示含有x的条件下,同时含有Y的概率,与Y总体发生的概率之比。
Lift(X→Y)= P(Y|X) / P(Y)
关于关联分析还有另外的算法,这里讲解Apriori算法
这里的逆否命题怎么理解呢?就是说比如一个项集{2,3},不是频繁的,那么它的超集{2,3,5}就一定不是频繁的。
下面我会举个例子,来讲解这个算法
由表,我们找出频繁项集(其中阈值是由我们随便设的)
剪枝加自连接,得到我们最后的频繁项集
由频繁项集产生强关联规则,然后算关联规则之间的置信度和提升度
由此我们得出,用户感兴趣的规则为儿童床→蚊帐或蚊帐→儿童床。
这里明确一个强关联规则中提升度的概念,要使我们两个东西之间关联是有效的,就需要计算提升度,大于1的提升度,才是用户感兴趣的,有效的。
那么怎么区分理解置信度和提升度?置信度也就是说在买了冰丝凉席之后又去买儿童床的概率,提升度则是衡量冰丝凉席→儿童床这条规则是否有效。如果冰丝凉席→儿童床=0,就说明两者独立不存在关联性,用户一般就会单独购买两者,不会一起买。就比如1号炒锅和2号炒锅,用户买了1号之后,就不会再买2号了,因为用户已经有了炒锅。=0就说明两者是这两种炒锅的关系。
关联分析法,超详解!进来秒懂!!相关推荐
- 【机器学习】关联分析Apriori算法详解以及代码实现
Apriori算法以及统计学基础 什么是关联分析 简单的统计学基础 Apriori输出频繁集 从频繁项集中挖掘关联规则 什么是关联分析 从大规模数据集中寻找物品间的隐含关系被称作关联分析.而寻找物品的 ...
- 灰色关联分析法详解及python实践
1. 关于灰色关联分析 1.1. 什么是灰色关联分析 灰色关联分析是指对一个系统发展变化态势的定量描述和比较的方法,其基本思想是通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧 ...
- DID会固定年份吗_倍分法DID详解 (三):多时点 DID (渐进DID) 的进一步分析
作者:王昆仑 (天津大学) E-mail: shawn0513@163.com 连享会专题课程:DSGE 模型及应用 连享会 DSGE 专题课程 这是连享会「倍分法(DID)专题推文」系列的第三篇文章 ...
- rust如何在木板上上传图片_腐蚀rust游戏玩法方式详解
在腐蚀这款游戏中玩家所有的物资都需要自己去寻找,不过很多时候遇到不怀好意的玩家时最好提高安全意识,及时躲避袭击,下面是游戏玩法发展方式详解. 游戏玩法方式详解 这里分两种发展方式 1.纯新手 首先需要 ...
- 线性规划之单纯形法【超详解+图解】-转载
线性规划之单纯形法[超详解+图解] 目录 1.作用 2.线性规划的一般形式 5.1几何意义 5.2如何判断最优 5.3如何选择新的基变量 5.4如何选择被替换的基变量 5.5终止条件 标准型: 转化为 ...
- 消息队列超详解(以RabbitMQ和Kafka为例,为何使用消息队列、优缺点、高可用性、问题解决)
消息队列超详解(以RabbitMQ和Kafka为例) 为什么要用消息队列这个东西? 先说一下消息队列的常见使用场景吧,其实场景有很多,但是比较核心的有3个:解耦.异步.削峰. 解耦:现场画个图来说明一 ...
- Android Telephony分析(三) ---- RILJ详解
前言 本文主要讲解RILJ工作原理,以便更好地分析代码,分析业务的流程. 这里说的RILJ指的是RIL.java (frameworks\opt\telephony\src\java\com\And ...
- DID会固定年份吗_倍分法DID详解 (二):多时点 DID (渐进DID)
作者:王昆仑 (天津大学) Stata连享会 计量专题 || 公众号合集 2020寒假Stata现场班 (北京, 1月8-17日,连玉君-江艇主讲) 「+助教招聘」 2020寒假Stata现场班 文 ...
- [C++ 系列] 90. 超详解C++思维导图
这段时间针对 C++ 的学习到了一个收尾的阶段.目前所涉及到了 C++ 基础语法.大小知识点的学习.当然语言学习绝对离不开实战项目的练手,网络优质资源以及各类经典丛书也是 C++ 学习的巨大宝库.在此 ...
- 十日均线算法oracle,10日均线法的详解
@@@.各位..注意该股必需是多头排列.....最好是多头市场.........这样正确率才高..收盘价在十天平均线上才可以考虑买入股票.股价跌破十天平均线时,必须卖出股票.有的人一定会觉得这太简单. ...
最新文章
- 40无法u盘启动_制作好U盘启动盘,却无法引导启动,该怎么办?
- python dry原则_python使用建议与技巧分享(一)
- QT学习:字符串类QString
- springMVC+ajaxFileUpload中文名乱码的问题
- 用C51编写单片机延时函数
- win7下搭建opengl es 2.0开发环境
- ng-model和ng-bind之间有什么区别
- 使用history.back()出现警告: 网页已过期的解决办法
- 玩耍redis遇到的问题之记录
- vue+vuex的应用笔记
- Atitit 浏览器tech原理与概论 目录 1. 浏览器概述	1 1.1. 浏览器野史 UserAgent列传	1 1.2. 浏览器趋势	1 1.3. 浏览器大战	1 1.4. 三次浏览器大战	2
- 用HashAlgorithm來加强數據的保險程度。
- 实用的在线文本分析工具
- firebug下载地址
- 做善良公社项目的经历和感受——善良公社
- 100部5星国外经典电影
- 程序员必学的计算机网络知识(数据链路层)
- 极光短信验证码的集成过程
- 速卖通商品详情API接口(商品详情页面数据接口)
- 华为NAT的命令总结
热门文章
- ldc服务器销售,ldc云服务器源码
- Visio 安装暴雷记录
- edp和edt哪个好_香水edp和edt的区别
- 仿写天猫tmall首页
- ppt图片特效 c语言实现,用了这么久的PPT,才知道PPT可以一键生成特效图片!太好看了...
- 2019电大计算机专业英语1答案,2019年最新国家开放大学电大《管理英语4》网络核心课形考网考作业附全答案...
- 2021-11-17每日刷题打卡
- windowns 程序图标变白色
- 【CNN+VIT】LocalViT: Bringing Locality to Vision Transformers
- 在 Windows 10 上安装 Coq 库 Mathematical Components