mahout FpGrowth
数据网址:
这里写链接内容
调用FpGrowth算法
bin/hadoop jar mahout/mahout-examples-0.9-job.jar org.apache.mahout.fpm.pfpgrowth.FPGrowthDriver -i /user/zls/input/retail.dat -o patterns -method mapreduce -s 1000 -regex '[\ ]'
-s 表示最小支持度
‘[\ ]’表示行内的数据以空格分开
调用mahout还原回来
mahout seqdumper -i /user/zls/patterns/fpgrowth/part-r-00000 -o patterns.txt
mahout FpGrowth相关推荐
- Centos下机器学习算法Mahout库的安装和示例
1.Mahout简介 Apache Mahout是Apache Software Foundation(ASF)旗下的一个开源项目,提供了一些经典的机器学习算法,旨在帮助开发人员更加方便快捷地创建智能 ...
- Mahout的推荐系统
Mahout的推荐系统 什么是推荐系统 为什使用推荐系统 推荐系统中的算法 什么是推荐系统 为什么使用推荐系统? 促进厂商商品销售,帮助用户找到想要的商品 推荐系统无处不在,体现在生活的各个方面 图书 ...
- mahout fpg
2019独角兽企业重金招聘Python工程师标准>>> 下载http://mirrors.cnnic.cn/apache/mahout/0.11.0/apache-mahout-di ...
- mahout使用PFP和FPG算法
mahout提供了内存中的FPG和分布式的PFP两种算频繁项集的方法,其中PFP实现上也是将feature分组,然后在节点上独立地运行FPG算法.PFP默认分组为50,如果项的数量特别多,可能需要考虑 ...
- 深入剖析FP-Growth原理
同步更新公众号:海涛技术漫谈 频繁项挖掘广泛的应用于寻找关联的事物.最经典的就是,电商企业通过分析用户的订单,挖掘出经常被共同购买的商品,用于推荐. 本文首先介绍频繁项挖掘技术的演进,从暴力求解到Ap ...
- 数据挖掘算法之关联规则挖掘(二)FPGrowth算法
之前介绍的apriori算法中因为存在许多的缺陷,例如进行大量的全表扫描和计算量巨大的自然连接,所以现在几乎已经不再使用 在mahout的算法库中使用的是PFP算法,该算法是FPGrowth算法的分布 ...
- mahout相关笔记
20210817 https://www.cnblogs.com/ahu-lichang/p/7073836.html mahout 安装 https://www.cnblogs.com/freefa ...
- mahout kmeans
2019独角兽企业重金招聘Python工程师标准>>> Mahout实战 Mahout是apache Soft Foundation旗下的一个开源项目 提供一些可扩展的机器学习领域经 ...
- Spark机器学习(9):FPGrowth算法
关联规则挖掘最典型的例子是购物篮分析,通过分析可以知道哪些商品经常被一起购买,从而可以改进商品货架的布局. 1. 基本概念 首先,介绍一些基本概念. (1) 关联规则:用于表示数据内隐含的关联性,一般 ...
最新文章
- 【Fibonacci-PEG,LDPC】基于Fibonacci-PEG算法的LDPC码校验矩阵的构造
- 如何成为架构师?3条有效的实战经验
- IIS不能下载ini文件
- 最吓人的鬼故事排行榜前十名(转载)
- 免堆期由谁申请_谈谈离婚冷静期
- linux中 ECShop的文件不能写
- Docker教程小白实操入门(14)--如何使用CMD和ENTRYPOINT指令指定容器启动时要运行的命令
- 高响应比优先调度算法 java_操作系统高响应比优先模拟算法
- 虚拟同步发电机技术(VSG)综述解读和研发思考
- 全国idc 机房大全
- 皮克定理(计算多边形面积)
- 射影几何----齐次坐标下的三点共线和非齐次坐标下的三点共线是等价的
- Dockerfile Registry WebUI 之 docker-registry-frontend 高级应用
- 华芯通关闭,华为等国产服务器芯片企业再受打击
- 微信h5页面制作总结
- vanishing point detection in autopilot
- LLC输出滤波电容选择
- 【装修选材】自然系原木,才是空间真正的百搭之王!
- 风电滑环的作用有哪些
- 如何快速查看MCC竞价账户下子账户的剩余预算金额?
热门文章
- 最高大上的小学生作业
- 手机的麦克风和扬声器,距离宜远
- 计算机各配置性能如何区分,如何查看图形卡(教您如何检查计算机图形卡的性能和型号)...
- java的函数重载函数_Java函数重载和重写
- [LeetCode]1024. 视频拼接
- 什么是光纤电缆?它的工作原理是啥?弱电人必知!
- 不负好时光——《Netty in Action》中文版《Netty实战》翻译手记
- Android 解决系统字体变大导致WebView页面显示错乱问题
- python画图哆啦a梦大头贴_用python的turtle库画哆啦A梦大头贴
- 计算机服务(启动/停止)