Hive数据仓库汽车销售分析练习题(项目)
汽车销售分析
现有数据集,内含汽车销售信息;相关列的字段说明如下
省 |
月 |
市 |
区县 |
年 |
车辆型号 |
制造商 |
品牌 |
车辆类型 |
所有权 |
使用性质 |
数量 |
发动机型号 |
排量 |
功率 |
燃料种类 |
车长 |
车宽 |
车高 |
厢长 |
厢宽 |
厢高 |
轴数 |
轴距 |
前轮距 |
轮胎规格 |
轮胎数 |
总质量 |
整备质量 |
核定载质量 |
核定载客 |
准牵引质量 |
底盘企业 |
底盘品牌 |
底盘型号 |
发动机企业 |
车辆名称 |
年龄 |
性别 |
山西省 |
3 |
朔州市 |
朔城区 |
2013 |
LZW6450PF |
上汽通用五菱汽车股份有限公司 |
五菱 |
小型普通客车 |
个人 |
非营运 |
1 |
L3C |
8424 |
79 |
汽油 |
4490 |
1615 |
1900 |
10 |
45 |
26 |
2 |
3050 |
1386 |
175/70R14LT |
4 |
2110 |
1275 |
7 |
上汽通用五菱汽车股份有限公司 |
客车 |
1913 |
男性 |
1.在HIVE建立数据仓库表
2.使用HIVE命令加载数据
3.验证HIVE数据k结果,确保数据加载到数据仓库中
4.统计乘用车辆何商用车轮销售数量和销售数量占比
5.统计山西省2013年每个月的汽车销售数量及占比
6.统计买车的男女比例及男女对车的品牌的选择(男性喜爱品牌Top10,女性喜爱的品牌
7.统计车的所有权(属于个人、属于单位、其他的数量、占比)、车辆型号top10、车辆类型Top10
8.统计不同类型的车辆在1年内各月份的销售情况;分析不同类型车辆销售黄金月份Top3
9.对于销售量最高的品牌Top3,统计其发动机型号及燃油种类;
10.统计五菱某个年份每月的销售量
代码和数据
Hive数据仓库汽车销售分析练习题(项目)相关推荐
- hive数据仓库摘录和总结
2019独角兽企业重金招聘Python工程师标准>>> Hive技术文档 --Author HuangFx 2013/01/29 Hive是什么? Hive是蜂房的意思,为什么ha ...
- 自建Hive数据仓库跨版本迁移到阿里云Databricks数据洞察
简介:客户在IDC或者公有云环境自建Hadoop集群构建数据仓库和分析系统,购买阿里云Databricks数据洞察集群之后,涉及到数仓数据和元数据的迁移以及Hive版本的订正更新. 直达最佳实践:[自 ...
- Hive数据仓库实战
文章目录 前言 一.Hive原理和功能介绍 二.Hive安装部署 三.Hive SQL操作 UDF函数 Hive 数据仓库模型设计 总结 前言 Hive作为大数据平台Hadoop之上的主流应用,公司一 ...
- tableau应用——某汽车销售分析
一.项目背景: 针对某品牌汽车的销售情况做可视化分析 主要服务于: 1.决策层领导 2.销售部门经理 项目目的: 1.汽车销售管理: 主要各领导需要了解销售相关指标,如销量,销售额等 2.竞品的渠道分 ...
- 尚硅谷数据仓库实战之1项目需求及架构设计
尚硅谷数据仓库实战之1项目需求及架构设计 第2章 项目需求及架构设计 需求分析 项目框架 技术选型 数据流程设计 框架版本选型 服务器选型 集群规模 集群资源规划设计 第3章 数据生成模块 目标数据 ...
- Hadoop分布式存储和计算MapReduce的使用以及Hive数据仓库等内容精讲
一,zookeeper环境搭建 ZooKeeper致力于为分布式应用提供一个高性能.高可用,且具有严格顺序访问控制能力的分布式协调服务 服务器IP 主机名 myid的值 192.168.186.133 ...
- Hive数据仓库简介
文章目录 Hive数据仓库简介 一.数据仓库简介 1. 什么是数据仓库 2. 数据仓库的结构 2.1 数据源 2.2 数据存储与管理 2.3 OLAP服务器 2.4 前端工具 3. 数据仓库的数据模型 ...
- hive数据仓库建设
hive数据仓库建设 1.设计原生日志表 原生日志表用来存放上报的原始日志,数据经过清洗加工后会进入到各个日志表中. 1.1 创建数据库 #创建数据库 $hive>create database ...
- 几篇关于Hadoop+Hive数据仓库的入门文章
Hadoop计算平台和Hadoop数据仓库的区别 http://datasearch.ruc.edu.cn/~boliangfeng/blog/?tag=%E6%95%B0%E6%8D%AE%E4%B ...
最新文章
- 可见的轮廓线用虚线绘制_为什么你用SketchUp没有别人“快”?
- (剑指Offer)面试题18:树的子结构
- M 点滑动平均 Python 实现
- 多文件目录下makefile文件递归执行编译所有c文件 很不错
- Linux 技巧: Bash 测试和比较函数
- 精彩回放 | 玩转 VS Code 物联网开发
- adb 抓取日志到指定文件,文件命名为当前电脑时间
- JAVA入门级教学之(猜数字测试)
- 身为“月光族”的电视选择之道
- 那些慢慢消失的手机功能,最怀念第一个!
- 十多年前国内的三大杀毒软件瑞星、江民和金山毒霸的现状如何?
- 蓝牙nrf52832的架构和开发(转载)
- NUC1041 数字三角形【DP】
- 聊聊我的 ACL2020 论文
- 《Linux内核分析》 week6作业-Linux内核fork()系统调用的创建过程
- Notepad软件的下载安装和使用
- Android之水滴落下的下拉刷新
- 南水北调中线调水量仅占丹江口水库水量1/4
- [转]读《简约至上》有感 - 及我的支语片言
- 上海店宝宝:电商靠谱助力农产品出村进城
热门文章
- 水果与体质10大巧搭配
- 类型“XXX”违反了继承安全性规则。派生类型必须与基类型的安全可访问性匹配或者比基类型的安全可访问性低。...
- 文件夹变成计算机程序,电脑中毒,文件夹变成应用程序,该怎么处理?
- 两个0.1uf 电容造成的两个BUG
- Galera Cluster for MySQL 详解(三)——管理监控
- PCB布局布线常用规则
- 智能机那些事儿――第九讲 硬件
- Git和SVN的区别及Git的使用
- 靠谱百度网盘目录管理系统安装图文教程
- 浙大远程教c语言在线作业答案,浙江大学远程教育2020面向对象程序设计在线作业答案...