Apriori算法——中医病症辩证关联规则分析
数据读取与预处理
import pandas as pd
df = pd.read_excel('中医辨证.xlsx')
df.head()
# 简单演示下tolist()函数
df['病人症状'].tolist()
# 转换为双重列表结构
symptoms = []
for i in df['病人症状'].tolist():symptoms.append(i.split(','))
print(symptoms)
print(symptoms)
通过apyori库来实现Apriori算法
from apyori import apriori
rules = apriori(symptoms, min_support=0.1, min_confidence=0.7)
results = list(rules)
for i in results: # 遍历results中的每一个频繁项集for j in i.ordered_statistics: # 获取频繁项集中的关联规则X = j.items_base # 关联规则的前件Y = j.items_add # 关联规则的后件x = ', '.join([item for item in X]) # 连接前件中的元素y = ', '.join([item for item in Y]) # 连接后件中的元素if x != '': # 防止出现关联规则前件为空的情况print(x + ' → ' + y) # 通过字符串拼接的方式更好呈现结果
通过mlxtend库来实现Apriori算法
from mlxtend.preprocessing import TransactionEncoder
TE = TransactionEncoder() # 构造转换模型
data = TE.fit_transform(symptoms) # 将原始数据转化为bool值
data
import pandas as pd
df = pd.DataFrame(data, columns=TE.columns_) # 用DataFrame存储bool数据
df.head()
from mlxtend.frequent_patterns import apriori
items = apriori(df, min_support=0.1, use_colnames=True)
items
items[items['itemsets'].apply(lambda x: len(x)) >= 2]
from mlxtend.frequent_patterns import association_rules
rules = association_rules(items, min_threshold=0.7)
rules
for i, j in rules.iterrows(): # 遍历DataFrame二维表格的每一行X = j['antecedents'] # 关联规则的前件Y = j['consequents'] # 关联规则的后件x = ', '.join([item for item in X]) # 连接前件中的元素y = ', '.join([item for item in Y]) # 连接后件中的元素print(x + ' → ' + y) # 通过字符串拼接打印关联规则
Apriori算法——中医病症辩证关联规则分析相关推荐
- 机器学习:基于Apriori算法对中医病症辩证关联规则分析
系列文章目录 作者:i阿极 作者简介:Python领域新星作者.多项比赛获奖者:博主个人首页
- [DM复习]Apriori算法-国会投票记录关联规则挖掘(上)
Apriori算法|关联规则挖掘 〇.相关基础概念 1.购物篮数据的二元表示 事务:购物篮数据可以用一个列表来表示,列表中的每一行都对应一个事务 项:表格中的每一列则对应一个数据项 项的二元表示:如果 ...
- r语言实现关联分析--关联规则挖掘(Apriori算法) (r语言预测学习笔记)
r语言实现关联分析–关联规则挖掘 关联分析: 引子: 我们一般把一件事情发生,对另一间事情也会产生影响的关系叫做关联.而关联分析就是在大量数据中发现项集之间有趣的关联和相关联系(形如"由于某 ...
- apriori算法代码_sklearn(九)apriori 关联规则算法,以及FP-growth 算法
是什么: apriori算法是第一个关联规则挖掘算法,利用逐层搜索的迭代方法找出数据库中的项集(项的集合)的关系,以形成规则,其过程由连接(类矩阵运算)与剪枝(去掉没必要的中间结果)组成.是一种挖掘关 ...
- 关联规则—Apriori算法—FPTree
文章目录 一.关联规则 1.1 概念 1.2 示例 二.关联规则挖掘推论(Apriori 算法) 2.1 关联规则挖掘方法: 2.3 FP-growth 三.FP-growth原理 3.1 生成项头表 ...
- 【数据挖掘】关联分析之先验(Apriori)原理与Apriori算法
阅读本文之前建议先理解关联分析的基本概念与术语.传送门 本文简单介绍关联分析中的先验(Apriori)原理与Apriori算法,持续更新与补充. 先验(Apriori)原理 原理简介: 如果一个项集是 ...
- python apriori算法 sklearn_sklearn(九)apriori 关联规则算法,以及FP-growth 算法
是什么: apriori算法是第一个关联规则挖掘算法,利用逐层搜索的迭代方法找出数据库中的项集(项的集合)的关系,以形成规则,其过程由连接(类矩阵运算)与剪枝(去掉没必要的中间结果)组成.是一种挖掘关 ...
- 机器学习之关联规则(支持度和置信度、Apriori算法)
关联规则及其基础: 表1:购物篮例子的分析 关联分析:用于发现隐藏在大型数据集中的有意义的联系.所发现的联系可以用关联规则或频繁项集的形式表示. 例如,从表1中可以提取出:{尿布} ⟹ {啤酒}(该规 ...
- 购物篮分析( Apriori算法)—零售数据实战
购物篮分析( Apriori算法)-零售数据实战 [开题]在我从事零售行业的期间,曾拜读过"啤酒与尿布"一书,对于沃尔玛的购物篮分析模型产生极大的兴趣.由于网上对Aprioro算法 ...
最新文章
- 25 年汽车技术老兵亲述,自动驾驶新驶向
- size-t数据类型 ssize-t数据类型
- 90. Leetcode 剑指 Offer 62. 圆圈中最后剩下的数字 (动态规划-基础题)
- 数据结构与算法之暴力递归改动态规划
- 后缀的形容词_构词法(18)构成形容词的常见后缀 3
- 9 Fresh jQuery Media Players
- 重操JS旧业第五弹:函数
- 神州数码否认买下华为荣耀,股价连续第二日涨停,创历史新高!
- 小白电商美工(设计师)都该了解一下PSD分层模板
- 抽奖活动mysql表设计_抽奖项目的系统设计方案
- 李航老师《统计学习方法》第二版第十一章课后习题答案
- c语言仿宋gb2312字体,【仿宋gb2312字体下载】仿宋gb2312字体官方下载 免费版-七喜软件园...
- php微信 api,PHP微信API接口类
- PC端浏览器模拟微信浏览器环境
- OneTab扩展:解决 Chrome 内存占用过多问题
- 汇编语言课程设计动态图形设计小车动态图形
- 2020第三届江西省高校网络安全技能大赛 线下赛 CTFAWD Writeup
- CSS+DIV-设置图片效果
- 2022世界杯神预测有哪个最神!最后一个富而喜悦到底是谁?
- Template-Web