数据读取与预处理

import pandas as pd
df = pd.read_excel('中医辨证.xlsx')
df.head()

# 简单演示下tolist()函数
df['病人症状'].tolist()

# 转换为双重列表结构
symptoms = []
for i in df['病人症状'].tolist():symptoms.append(i.split(','))
print(symptoms)
print(symptoms)

通过apyori库来实现Apriori算法

from apyori import apriori
rules = apriori(symptoms, min_support=0.1, min_confidence=0.7)
results = list(rules)
for i in results:  # 遍历results中的每一个频繁项集for j in i.ordered_statistics:  # 获取频繁项集中的关联规则X = j.items_base  # 关联规则的前件Y = j.items_add  # 关联规则的后件x = ', '.join([item for item in X])  # 连接前件中的元素y = ', '.join([item for item in Y])  # 连接后件中的元素if x != '':  # 防止出现关联规则前件为空的情况print(x + ' → ' + y)  # 通过字符串拼接的方式更好呈现结果

通过mlxtend库来实现Apriori算法

from mlxtend.preprocessing import TransactionEncoder
TE = TransactionEncoder()  # 构造转换模型
data = TE.fit_transform(symptoms)  # 将原始数据转化为bool值
data

import pandas as pd
df = pd.DataFrame(data, columns=TE.columns_)  # 用DataFrame存储bool数据
df.head()

from mlxtend.frequent_patterns import apriori
items = apriori(df, min_support=0.1, use_colnames=True)
items

items[items['itemsets'].apply(lambda x: len(x)) >= 2]

from mlxtend.frequent_patterns import association_rules
rules = association_rules(items, min_threshold=0.7)
rules

for i, j in rules.iterrows():  # 遍历DataFrame二维表格的每一行X = j['antecedents']  # 关联规则的前件Y = j['consequents']  # 关联规则的后件x = ', '.join([item for item in X])  # 连接前件中的元素y = ', '.join([item for item in Y])  # 连接后件中的元素print(x + ' → ' + y)  # 通过字符串拼接打印关联规则

Apriori算法——中医病症辩证关联规则分析相关推荐

  1. 机器学习:基于Apriori算法对中医病症辩证关联规则分析

    系列文章目录 作者:i阿极 作者简介:Python领域新星作者.多项比赛获奖者:博主个人首页

  2. [DM复习]Apriori算法-国会投票记录关联规则挖掘(上)

    Apriori算法|关联规则挖掘 〇.相关基础概念 1.购物篮数据的二元表示 事务:购物篮数据可以用一个列表来表示,列表中的每一行都对应一个事务 项:表格中的每一列则对应一个数据项 项的二元表示:如果 ...

  3. r语言实现关联分析--关联规则挖掘(Apriori算法) (r语言预测学习笔记)

    r语言实现关联分析–关联规则挖掘 关联分析: 引子: 我们一般把一件事情发生,对另一间事情也会产生影响的关系叫做关联.而关联分析就是在大量数据中发现项集之间有趣的关联和相关联系(形如"由于某 ...

  4. apriori算法代码_sklearn(九)apriori 关联规则算法,以及FP-growth 算法

    是什么: apriori算法是第一个关联规则挖掘算法,利用逐层搜索的迭代方法找出数据库中的项集(项的集合)的关系,以形成规则,其过程由连接(类矩阵运算)与剪枝(去掉没必要的中间结果)组成.是一种挖掘关 ...

  5. 关联规则—Apriori算法—FPTree

    文章目录 一.关联规则 1.1 概念 1.2 示例 二.关联规则挖掘推论(Apriori 算法) 2.1 关联规则挖掘方法: 2.3 FP-growth 三.FP-growth原理 3.1 生成项头表 ...

  6. 【数据挖掘】关联分析之先验(Apriori)原理与Apriori算法

    阅读本文之前建议先理解关联分析的基本概念与术语.传送门 本文简单介绍关联分析中的先验(Apriori)原理与Apriori算法,持续更新与补充. 先验(Apriori)原理 原理简介: 如果一个项集是 ...

  7. python apriori算法 sklearn_sklearn(九)apriori 关联规则算法,以及FP-growth 算法

    是什么: apriori算法是第一个关联规则挖掘算法,利用逐层搜索的迭代方法找出数据库中的项集(项的集合)的关系,以形成规则,其过程由连接(类矩阵运算)与剪枝(去掉没必要的中间结果)组成.是一种挖掘关 ...

  8. 机器学习之关联规则(支持度和置信度、Apriori算法)

    关联规则及其基础: 表1:购物篮例子的分析 关联分析:用于发现隐藏在大型数据集中的有意义的联系.所发现的联系可以用关联规则或频繁项集的形式表示. 例如,从表1中可以提取出:{尿布} ⟹ {啤酒}(该规 ...

  9. 购物篮分析( Apriori算法)—零售数据实战

    购物篮分析( Apriori算法)-零售数据实战 [开题]在我从事零售行业的期间,曾拜读过"啤酒与尿布"一书,对于沃尔玛的购物篮分析模型产生极大的兴趣.由于网上对Aprioro算法 ...

最新文章

  1. 25 年汽车技术老兵亲述,自动驾驶新驶向
  2. size-t数据类型 ssize-t数据类型
  3. 90. Leetcode 剑指 Offer 62. 圆圈中最后剩下的数字 (动态规划-基础题)
  4. 数据结构与算法之暴力递归改动态规划
  5. 后缀的形容词_构词法(18)构成形容词的常见后缀 3
  6. 9 Fresh jQuery Media Players
  7. 重操JS旧业第五弹:函数
  8. 神州数码否认买下华为荣耀,股价连续第二日涨停,创历史新高!
  9. 小白电商美工(设计师)都该了解一下PSD分层模板
  10. 抽奖活动mysql表设计_抽奖项目的系统设计方案
  11. 李航老师《统计学习方法》第二版第十一章课后习题答案
  12. c语言仿宋gb2312字体,【仿宋gb2312字体下载】仿宋gb2312字体官方下载 免费版-七喜软件园...
  13. php微信 api,PHP微信API接口类
  14. PC端浏览器模拟微信浏览器环境
  15. OneTab扩展:解决 Chrome 内存占用过多问题
  16. 汇编语言课程设计动态图形设计小车动态图形
  17. 2020第三届江西省高校网络安全技能大赛 线下赛 CTFAWD Writeup
  18. CSS+DIV-设置图片效果
  19. 2022世界杯神预测有哪个最神!最后一个富而喜悦到底是谁?
  20. Template-Web

热门文章

  1. txt文本的魔数到底是多少
  2. DNS工作原理及解析过程
  3. Unity游戏动画 从入门到住院 4:动画状态机
  4. 推荐一些有趣的在线编程游戏
  5. erlang 开源项目之 Bigwig
  6. FFmpeg 视频添加水印图片
  7. html居中小圆点●,圆点怎么打_居中小圆点怎么打出来_电脑常识_中华康网
  8. deepin系统安装的若干问题
  9. 关于纯前端excel上传、下载功能
  10. 目标检测论文核心思想,18-19-20年论文梗概