关联规则分析

  • 1.简单来说-关联规则
  • 2.经典关联规则挖掘-Apriori

1.简单来说-关联规则

关联规则–通过量化的数字描述物品甲的出现 对 物品乙的出现 有多大影响。

最早是为了发现超市销售数据库中不同的商品之间的关联关系:哪组商品可能会在一次购物中同时购买。

广泛应用于–购物篮数据,生物信息学,医疗诊断,网页挖掘和科学数据分析。

关联规则举例:

  1. 购买面包的用户很有可能会购买牛奶,面包≥牛奶面包\geq 牛奶面包≥牛奶,面包为前项,牛奶为后项。面包降价销售,适当提高牛奶的售价。这一关联规则,可能会增加超市的整体利润。

  2. “啤酒与尿布”–最常听到的例子

关联规则分析: 找出数据集中各项之间的关联关系。
发现关联规则的算法 为 无监督学习算法–Apriori,Eclat,FP-Tree,灰色关联法

2.经典关联规则挖掘-Apriori

Apriori–挖掘频繁项集,核心思想:通过连接产生候选项与其支持度,通过剪枝生成频繁项集。

基本概念:

  1. 关联规则的支持度–项集A和B同时发生的概率:p(A∩B)p(A\cap B)p(A∩B)
  2. 关联规则的置信度–项集A发生,则项集B发生的概率:p(B∣A)p(B|A)p(B∣A)
  3. 最小支持度/最小置信度–一条规则有效的最小阈值,专家确定。
  4. 项集–包含项目的集合{牛奶,麦片,糖}是一个三项集
  5. 支持度计数:事物集中包含项目集A的事物的个数。

依据公式计算相应的概率就可以了,就是概念的理解。

MachineLearning(11)-关联规则分析相关推荐

  1. Python 在线电子零售公司销售数据(Online Retail | Kaggle)关联规则分析(Apriori算法)

    引言: 本文使用python语言完成了在线电子零售公司的跨国交易数据集的数据分析与可视化.根据关联规则原理设计实现了基于Apriori算法的关联规则挖掘程序并将程序封装.使用封装好的关联规则挖掘程序对 ...

  2. 基于R语言的关联规则分析项目

    转自http://blog.163.com/dm_team/blog/static/2379750132014891084989/ 摘要 抱着成为一名优秀的数据分析师/数据挖掘师的理想,我们组成了一个 ...

  3. 使用数据挖掘软件Rapidminer进行关联规则分析

    这段时间使用了Rapidminer进行关联规则的挖掘实验,很多细节问题折腾了好长时间.在网络上也搜不到类似的东西,尤其是中间遇到一个问题折腾了两天.最后是通过研究Rapidminer本身带有的例子才把 ...

  4. 机器学习实践:超市商品购买关联规则分析

    第2关:动手实现Apriori算法 def createC1(dataset):C1 = set()for t in dataset:for item in t:item_set = frozense ...

  5. 关联规则分析 Apriori 算法 简介与入门

    关联规则的几个概念: 关联规则是形如 X -> Y 的蕴含式,表示通过 X 可以推导出 Y,X称为关联规则的左部(Left Hand Side,LHS),Y 称为关联规则的右部(Right Ha ...

  6. 基于.NET实现数据挖掘--关联规则分析算法

    本篇继续我们的微软挖掘算法系列总结,前几篇我们分别介绍了:Microsoft决策树分析算法.Microsoft聚类分析算法.Microsoft Naive Bayes 算法.Microsoft 时序算 ...

  7. 协同过滤和关联规则分析的区别

    协同过滤 (Collaborative filtering),按维基百科的说法,有广义和狭义两种定义.现在讨论较多的是狭义的定义,在电商网站应用比较广泛.狭义的定义指的是,通过收集群体用户的偏好信息, ...

  8. 数据挖掘之关联规则分析

    关联规则分析也称为购物篮分析,最早是为了发现超市销售数据库中不同的商品之间的关联关系. 用于寻找数据集中各项之间的关联关系.根据所挖掘的关联关系,可以从一个属性的信息来推断另一个属性的信息.当置信度达 ...

  9. 【某航】关联规则分析CatalogCrossSell数据集——数据挖掘导论

    代码链接:github代码 1.任务目标 针对所提供的CatalogCrossSell.xls数据集,要求对该数据及进行关联规则分析,并且解释生成的结果,评价指标包括lift,ratio, confi ...

最新文章

  1. Rob hess 关于sift的说明
  2. 如何用python做数据分析统计服_使用python实现数据分析
  3. 工厂模式 java场景_研磨设计模式之简单工厂模式(场景问题)
  4. 一个成功的BI项目实施需要注意哪些?
  5. IDEA最全使用教程
  6. 博客营销之博客平台的选择和优化
  7. 2022年网络安全行业发展趋势
  8. android吃鸡闪退,绝地求生刺激战场iPhone6/6P闪退怎么办
  9. 怎么让照片变年轻_PS高手让你变得更年轻
  10. row format delimited fields terminated by ','
  11. 华为云图像标签使用之智慧相册
  12. 联合查询分组取最新数据
  13. Vue之导出xlsx
  14. HTTP解析库http-parser简介及使用
  15. 中国没有掌握的尖端技术_适用于所有人的尖端AAA遮光技术
  16. 蓝桥云课linux入门4:目录结构及文件基本操作
  17. No qualifying bean of type [com.*.*.dao.InfoDao] found for :错误!
  18. openlayers 计算绘制的矢量多边形的面积 (getArea方法)
  19. ENVI辐射定标与大气校正
  20. 制作FLV格式Flash视频

热门文章

  1. ZDB5304烧写方法
  2. vector利用swap()函数进行内存的释放
  3. Asterisk SIP连通测试(X-Lite eyebeam)
  4. WinCE系统的编译过程
  5. 【转】我的CV之路第一篇:ITK是啥?
  6. 【转】【MySQL】事务与锁(四):行锁到底锁住的是什么?记录?字段?索引?
  7. 第十四节:Lambda、linq、SQL的相爱相杀(3)
  8. sharepoint当流程流转到某个节点对文档进行水印操作
  9. php 父类中获取子类的名称,php – 在父类中获取子类的名称(静态上下文)
  10. 【JS 逆向百例】有道翻译接口参数逆向