一、超市总体销售情况
1.1.数据预处理
读取超市数据并命名数据集 dat,观察数据,并更改原始数据中时间的记录方式:

dat<-read.csv("某超市销售数据.csv")
dat$销售时间<-format(dat$销售时间,scientific=FALSE)

由于售货员姓名对分析不产生影响,删除该列,并重新命名各列:

dat<-dat[,-c(1)]
names(dat)<-c("ID","time","No.","item","price","num","total")
as.factor(dat$item)#将产品名称设置为因子变量

为了分别按照日期和时间段进行分析,把销售时间拆分为两部分,销售日期和销售时间。

date<-substr(dat$time,1,8)
hour<-substr(dat$time,9,10)#文本拆分,按照日期与时间
dat<-data.frame(dat,date=date,hour=hour)#更新数据集

1.2不同产品的销售量及销售额
此处利用tapply函数进行分组计算,分别得到每种产品的销售额及销售量,并进行排序:

cp<-tapply(dat$total,dat$item,sum)#计算每种产品的销售额
cpn<-tapply(dat$num,dat$item,sum)#计算每种产品的销售量
cp<-data.frame(cp)
cpn<-data.frame(cpn)
ocpn<-cpn[order(cpn,decreasing = T),]#对产品销售量进行排序
ocp<-cp[order(cp,decreasing = T),]#对产品销售额进行排序

可以发现,销量较高的产品中,小吃类占大多数。

销售额较高的则主要是香烟,对于烤肠这种成本低,销售额却高的产品,看来是每家超市必进的商品。
1.4对不同时间段超市运营情况的分析
想要从时间角度来对超市运营情况分析,首先要做的就是对数据集按照不同的时间分布来进行合并,此处我们分别按照日期和小时来进行数据的合并。

datecp<-tapply(dat$total,dat$date,sum)
hourcp<-tapply(dat$total,dat$hour,sum)

tapply函数得到的结果是一组向量,并且是带行名的向量,因此需要对所得到数据集进行一个处理方便后续分析。

days<-rownames(datecp)
hour<-rownames(hourcp)
cp<-as.vector(hourcp)
hourcp<-data.frame(hour=

苏果超市R语言关联分析相关推荐

  1. R语言关联分析之啤酒和尿布

    关联分析 概述 啤酒和尿布的故事,我估计大家都听过,这是数据挖掘里面最经典的案例之一.它分析的方法就关联分析. 关联分析,顾名思义,就是研究不同商品之前的关系.这里就发现了啤酒和尿布这两个看起来毫不相 ...

  2. R语言︱情感分析—词典型代码实践(最基础)(一)

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:词典型情感分析对词典要求极高,词典中 ...

  3. [R语言] R语言PCA分析教程 Principal Component Methods in R

    R语言PCA分析教程 Principal Component Methods in R(代码下载) 主成分分析Principal Component Methods(PCA)允许我们总结和可视化包含由 ...

  4. R语言效用分析 ( 效能分析、Power analysis)、除了pwr包之外还有其它包、例如、基因研究中的效能分析、MBESS包可用于各种形式的效能分析和最少样本量确定、其他效用分析包的简要介绍

    R语言效用分析 ( 效能分析.Power analysis).除了pwr包之外还有其它包.例如.基因研究中的效能分析(power analysis).MBESS包可用于各种形式的效能分析(power ...

  5. R语言效用分析 ( 效能分析、Power analysis)确定样本量、假设检验与两类错误、pwr包进行效用分析 ( 效能分析、Power analysis)的常用函数列表

    R语言效用分析 ( 效能分析.Power analysis)确定样本量.假设检验与两类错误.pwr包进行效用分析 ( 效能分析.Power analysis)的常用函数列表 目录

  6. R语言生存分析(survival analysis)与生存资料有关的概念详解

    R语言生存分析(survival analysis)与生存资料有关的概念详解 目录 R语言生存分析(survival analysis)与生存资料有关的概念详解 #生存分析

  7. R语言单因素方差分析(One-Way ANOVA)实战:探索性数据分析(EDA)、单因素方差分析模型结果解读(检查模型假设)、分析不同分组的差异TukeyHSD、单因素方差分析的结果总结

    R语言单因素方差分析(One-Way ANOVA)实战:探索性数据分析(EDA).单因素方差分析模型结果解读(检查模型假设).分析不同分组的差异TukeyHSD.单因素方差分析的结果总结 目录 R语言 ...

  8. R语言生存分析寿命表(life table)实战案例:比较两种药物治疗感染患者的生存时间

    R语言生存分析寿命表(life table)实战案例:比较两种药物治疗感染患者的生存时间 目录

  9. R语言生存分析COX回归分析实战:以乳腺癌数据为例

    R语言生存分析COX回归分析实战:以乳腺癌数据为例 目录

  10. R语言生存分析Log-rank假设检验组间生存曲线比较实战

    R语言生存分析Log-rank假设检验组间生存曲线比较实战 目录 R语言生存分析Log-rank假设检验组间生存曲线比较实战 #log-rank检验

最新文章

  1. python2.7爬虫实例-用案例让你一文搞懂python网络爬虫
  2. MySQL索引使用方法和性能优化
  3. 2.3.1 为超参数选择合适的范围
  4. win10使用Composer-Setup安装Composer以及使用Composer安装Yii2最新版
  5. 小程序 redux_Redux应用程序最重要的ESLint规则
  6. BZOJ3252攻略——长链剖分+贪心
  7. 力扣-面试题 16.10. 生存人数
  8. 11.11 开课二个月零七天(ajax和bootstrp做弹窗)
  9. 针式PKM的设计原则
  10. 2021安徽安全员B证考试多选练习题库
  11. SQL增删改查语句笔记一
  12. 应用回归分析第五版电子书_应用回归分析课后习题参考答案 全部版 何晓群,刘文卿...
  13. python合并大量ts文件_python之爬虫(爬取.ts文件并将其合并为.MP4文件——以及一些异常的注意事项)...
  14. Java读取Oracle中LONG类型数据
  15. iOS组件化方案对比
  16. python online json editor_python+django常用富文本插件使用配置(ckeditor,kindeditor)
  17. 帆软函数:阿拉伯数字转中文、阿拉伯数字转人民币大写
  18. dhcp服务器设置(路由器dhcp服务器怎么设置)
  19. 《认知天性:让学习轻而易举的心理学规律》
  20. Android8.1 MTK平台 Dialer修改(通话常亮、按钮接听)

热门文章

  1. 学习uni-app的心得体会
  2. 实战篇:一个核心系统 3 万行代码的重构之旅
  3. 如何建立风险、内控与合规三位一体的管控体系?
  4. 中国石油华东计算机的邵明文导师,邵明文
  5. 《员工体验全景调研》重磅发布:七成企业关注电子签应用
  6. Java 【手写webserver】学习笔记
  7. linux命令入门教程视频,linux命令入门视频教程
  8. Rider: 创建空Web API Controller
  9. 2020-3-21模拟赛题解
  10. 不要停下来!八分音符酱!青年男女深夜频频鬼叫!!!