Hive数据分析案例——汽车销售数据分析
使用HiveQL实现来实现,本数据为上牌汽车的销售数据,分为乘用车辆和商用车辆。数据包含销售相关数据与汽车具体参数。数据项包括:时间、销售地点、邮政编码、车辆类型、车辆型号、制造厂商名称、排量、油耗、功率、发动机型号、燃料种类、车外廓长宽高、轴距、前后车轮、轮胎规格、轮胎数、载客数、所有权、购买人相关信息等。
3.1创建数据库works。
3.2创建外部表
(1)在hdfs上创建一个空目录work_car;
(2)在hive中刚刚建立的数据库works下创建表CarData。
3.3导入数据
3.4查询前10条数据
4 需求分析(使结果前十用HiveQL实现):
4.1汽车行业市场分析:
1统计乘用车辆和商用车辆的数量(即非营运和营运车辆)
2统计山西省2013年每个月的汽车销售数量
4.2 用户数据市场分析:
1 统计买车的男女比例
4.3 不同车型销售统计分析:
1统计不同类型车在每年的总销售量
2 统计各品牌汽车销售量,按销售量倒序排序
3按所有权和类型分组统计销量
4.统计不同排量的车的数量(排量分为3级 小排量:1000以下,中排量:1000-3000,大排量3000及以上)
5 针对某一品牌的竞争分析:
1 统计五菱每一个月的销售量
6针对各市销售分析:
1.统计各市销售量,按销量倒序排序
Hive数据分析案例——汽车销售数据分析相关推荐
- mapreduce和hive 对山西省汽车销售数据分析
数据样本(使用python处理数据集,这里面就不放上去了,需要私信),下面是处理过的数据,这里我使用的是填充数据,也可以截取数据 很多人私信要这个数据文件,由于工作了,CSDN用的少了,不好意思~ 链 ...
- python金融数据分析案例_Python数据分析行业案例课程--欺诈检测
注意: 1. 本行业案例课程为Python 3 数据分析系列课程的行业案例部分,学员请务必先观看课程介绍免费视频,确认已学习本课程所需Python分析技能. 2. 本课程的核心目的是协助学员学习具体业 ...
- python医药数据分析_Python数据分析案例-药品数据分析案例
最近学习了python数据分析的一些基础知识,有numpy,pandas,matplotlib等,找了一个药品数据分析的小项目练一下手. 数据分析的步骤一般可以分为6个: 1,明确分析的目的 2,数据 ...
- 数据分析案例-股票数据分析
- Hive汽车销售数据分析系统实战开发:
Hive汽车销售数据分析系统实战开发: 汽车销售(Atuo Sales)是消费者支出的重要组成成分,同时能很好的反映出消费者对经济前景的信心.通常,汽车销售情况我们了解一个国家经济循环强弱情况的第一手 ...
- 26个数据分析案例——第二站:基于Hive的民航客户价值分析
26个数据分析案例--第二站:基于Hive的民航客户价值分析 实验所需环境 • Python: Python 3.x: • Hadoop2.7.2环境: • Hive2.2.0 数据说明 资料包 链接 ...
- 基于Hadoop + Hive框架进行电子商务数据分析的设计与实现
摘要 随着大数据时代的到来,企业挖掘出隐藏巨大的数据价值给带来了更多的市场机会.大数据存储,处理和处理的研究已是企业未来发展的趋势,因此,将开展基于Hadoop + Hive框架进行电子商务数据分析, ...
- 数据清洗(一):拉勾网数据分析案例
1.导入数据 # 导入相应的包 import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib i ...
- 26个数据分析案例——第一站:基于Python的HBase冠字号查询系统
26个数据分析案例--第一站:基于Python的HBase冠字号查询系统 实验所需环境 • Python: Python 3.x: • Hadoop 2.7.7环境: • HBase 1.3.5: 数 ...
- 3星|《数据思维:从数据分析到商业价值》:有趣的数据分析案例
3星|<数据思维:从数据分析到商业价值>:有趣的数据分析案例 Posted on 2017-11-24 19:59 左其盛 阅读(118) 评论(0) 编辑 收藏 数据思维(从数据分析到商 ...
最新文章
- python迭代计算_如何在Python中迭代坐标列表并计算它们之间的距离
- MySQL太细碎了,我硬生生捋出了一条核心大主线!
- 计算机d都学啥,信息学奥数基础知识D计算机的基本组成
- java手机音乐文件夹,从原始文件夹打开音乐文件,使用Android上的意图在设备的默认应用程序上播放...
- windows环境下32位汇编语言程序设计 90盘_程序设计作业题汇总
- 【DRP】【SQL】-悲观锁-防止多用户同时操作时出现脏数据
- 中国挤奶点控制器市场趋势报告、技术动态创新及市场预测
- requestAnimationFrame()方法实现帧动画
- 论文写作——算法部分写作心得
- 对 Unity 动画系统 Mecanim 的调研
- idea 网页项目无法显示图片
- 推荐系统中的bais系统(二)—Select Bais和Exposure Bias
- 【数据挖掘】2022数据挖掘之Matplotlib完整使用(折线图、散点图、柱状图、直方图、饼图)
- 重磅!Meta AI开源OPT-175B:1750亿参数大模型
- IntelliJ IDEA历史版本官网下载地址
- 数据库视图view的解析
- JavaScript中的浅拷贝与深拷贝(手写浅拷贝和深拷贝)
- greenplum(gp)的常用命令
- 时间管理的十一条黄金定律
- 恢复通讯录显示服务器开小差,手机通讯录误删除怎么恢复?教你几招一看就会...