大家好,喜欢Bigdata的阿尼亚来了!希望大家会喜欢阿尼亚的文章!!哇酷哇酷!!!

本次为师傅们带来的是“红亚杯”常用数据分析Hive SQL应用专题赛——满分解析系列的第③期,是“Hive专题赛(2)”篇章哦!

第①期完整赛题、第②期Hive专题赛(1)的链接在下面,师傅们想看完整赛题、Hive专题赛(1)的请安心享用:

【阿尼亚喜欢BigData】“红亚杯”常用数据分析Hive SQL应用专题赛——满分解析①_爱波吉的阿尼亚的博客-CSDN博客

【阿尼亚喜欢BigData】“红亚杯”常用数据分析Hive SQL应用专题赛——满分解析②_爱波吉的阿尼亚的博客-CSDN博客

目录

Hive专题赛(2)

TopK、排序数据分析:

1.统计person表中各种族(race)的总人数,并按照总人数倒序排序,将结果写入本地/root/person06/。

2.统计不同职业薪资大于50K的总人数,且人数按照降序排序取Top3,将结果写入本地/root/person07/。

3.计算较高收入(收入等于大于50K的为高收入)人群占整体数据的比例(保留两位小数),注意:设置支持笛卡尔积参考步骤说明,将结果写入本地/root/person08/。

Hive DDL基础操作:

1.在person数据库下创建student内部表(表结构参考步骤描述),并指定以制表符“\t”分隔;

2.使用alter语句修改student内部表结构新增一列字段名称为“address”,类型为“string”;

3.使用drop语句删除student内部表。


Hive专题赛(2)

TopK、排序数据分析:

TopK、排序数据分析

考核条件如下:

1.统计person表中各种族(race)的总人数,并按照总人数倒序排序,将结果写入本地/root/person06/。

操作环境: hive专题赛环境

insert overwrite local directory '/root/person06'
row format delimited fields terminated by '\t'
select race,count(*) as c from person group by race order by c desc;

2.统计不同职业薪资大于50K的总人数,且人数按照降序排序取Top3,将结果写入本地/root/person07/。

操作环境: hive专题赛环境

insert overwrite local directory '/root/person07/'
row format delimited fields terminated by '\t'
select occupation,count(*) as s from (select * from person where income=">50K") t1 group by occupation order by s desc limit 3;

3.计算较高收入(收入等于大于50K的为高收入)人群占整体数据的比例(保留两位小数),注意:设置支持笛卡尔积参考步骤说明,将结果写入本地/root/person08/。

操作环境: hive专题赛环境

set hive.strict.checks.cartesian.product;         #查看当前是否支持笛卡尔积set hive.strict.checks.cartesian.product=false;   #修改设定成为支持笛卡尔积
insert overwrite local directory '/root/person08/'
row format delimited fields terminated by '\t'
select round((t2.v/t4.s),2) from (select count(*) as v from person t1 where income=">50K" )t2 join (select count(*) as s from person t3) t4;

Hive DDL基础操作:

Hive DDL基础操作

考核条件如下:

1.在person数据库下创建student内部表(表结构参考步骤描述),并指定以制表符“\t”分隔;

操作环境: hive专题赛环境

create table if not exists student(id int,name string,age int,sex string)
row format delimited fields terminated by '\t';

2.使用alter语句修改student内部表结构新增一列字段名称为“address”,类型为“string”;

操作环境: hive专题赛环境

alter table student add columns(address string);

3.使用drop语句删除student内部表。

操作环境: hive专题赛环境

drop table if exists student; 

【阿尼亚喜欢BigData】“红亚杯”常用数据分析Hive SQL应用专题赛——满分解析③相关推荐

  1. 【阿尼亚喜欢BigData】“红亚杯”常用数据分析Hive SQL应用专题赛——满分解析④

    大家好,喜欢Bigdata的阿尼亚来了!希望大家会喜欢阿尼亚的文章!!哇酷哇酷!!! 本次为师傅们带来的是"红亚杯"常用数据分析Hive SQL应用专题赛--满分解析系列的第④期, ...

  2. 【阿尼亚喜欢BigData】“红亚杯”数据分析进阶—使用Python操作Hive专题赛——满分解析③

    大家好,喜欢Bigdata的阿尼亚来了!希望大家会喜欢阿尼亚的文章!!哇酷哇酷!!! 本次为师傅们带来的是"红亚杯"数据分析进阶-使用Python操作Hive专题赛--满分解析系列 ...

  3. 【阿尼亚喜欢BigData】“红亚杯”数据分析进阶—使用Python操作Hive专题赛——满分解析②

    大家好,喜欢Bigdata的阿尼亚来了!希望大家会喜欢阿尼亚的文章!!哇酷哇酷!!! 本次为师傅们带来的是"红亚杯"数据分析进阶-使用Python操作Hive专题赛--满分解析系列 ...

  4. 【阿尼亚喜欢BigData】“红亚杯”Python编程专题赛——满分解析①

    大家好,喜欢Bigdata的阿尼亚来了!希望大家会喜欢阿尼亚的文章!!哇酷哇酷!!! 本次为师傅们带来的是"红亚杯"Python编程专题赛--满分解析系列的第①期,让我们先来看看完 ...

  5. 【阿尼亚喜欢BigData】“红亚杯”Python编程专题赛——满分解析③

    大家好,喜欢Bigdata的阿尼亚来了!希望大家会喜欢阿尼亚的文章!!哇酷哇酷!!! 本次为师傅们带来的是"红亚杯"Python编程专题赛--满分解析系列的第③期,是"P ...

  6. 【阿尼亚喜欢BigData】“红亚杯”大数据环境搭建与数据采集技能线上专题赛——满分解析⑤

    大家好,喜欢Bigdata的阿尼亚来了!希望大家会喜欢阿尼亚的文章!!哇酷哇酷!!! 本次为师傅们带来的是"红亚杯"大数据环境搭建与数据采集技能线上专题赛--满分解析系列的第⑤期, ...

  7. 【阿尼亚喜欢BigData】“红亚杯”大数据环境搭建与数据采集技能线上专题赛——满分解析③

    大家好,喜欢Bigdata的阿尼亚来了!希望大家会喜欢阿尼亚的文章!!哇酷哇酷!!! 本次为师傅们带来的是"红亚杯"大数据环境搭建与数据采集技能线上专题赛--满分解析系列的第③期, ...

  8. 【阿尼亚喜欢BigData】“红亚杯”大数据环境搭建与数据采集技能线上专题赛——满分解析②

    大家好,喜欢Bigdata的阿尼亚来了!希望大家会喜欢阿尼亚的文章!!哇酷哇酷!!! 本次为师傅们带来的是"红亚杯"大数据环境搭建与数据采集技能线上专题赛--满分解析系列的第②期, ...

  9. 【阿尼亚喜欢BigData】“红亚杯”Python编程专题赛——满分解析⑤

    大家好,喜欢Bigdata的阿尼亚来了!希望大家会喜欢阿尼亚的文章!!哇酷哇酷!!! 本次为师傅们带来的是"红亚杯"Python编程专题赛--满分解析系列的第⑤期,是"P ...

最新文章

  1. 什么是强人工智能,强人工智能的实现,需要具备哪些条件?
  2. STM32 基础系列教程 36 - Lwip_dns
  3. mysql 数据库的基本管理
  4. SpringBoot2.0之四 简单整合MyBatis
  5. 二级计算机选择题知识点资源,计算机省二级选择题.txt
  6. mysql使用多个索引_mysql索引合并:一条sql可以使用多个索引
  7. FireFox下竟然对HTML注释与IE下有不同的解析
  8. python中浮点型占几个字节_python的浮点数占多少个字节
  9. CAD软件中怎么裁剪参照?
  10. Mac ssh locahost Connection refused
  11. NLP标注工具:brat【可用于标注:实体、关系、事件、属性】【只能用于Linux下】【开源、免费】
  12. MAXENT模型的生物多样性生境模拟与保护优先区甄选、自然保护区布局优化及未来气候变化情景下自然保护区优化评估写作技巧
  13. 【ELM预测】基于极限学习机ELM实现数据预测matlab源码
  14. 无线通信中比bit更小的“”数据单位”码片(也叫码元 ,chip) 什么是符号速率
  15. PostgreSQL 14 版本发布,快来看看有哪些新特性!
  16. 浅议实时操作系统RTOS
  17. usb与 hid, 串口 趣谈
  18. 优秀的数据产品经理需要掌握哪些技能?
  19. 廊坊汽车迁入北京流程纪实
  20. 一个女孩主动加你微信,不说话也不打招呼是因为啥呢?

热门文章

  1. 关于Unity中特殊符号的输入以及格式的调整
  2. 深夜一家面馆里所发生的一幕
  3. (附源码)springboot篮球场地预约系统 毕业设计 345655
  4. 鸿蒙系统应用数据库,鸿蒙(HarmonyOS)-Fa应用级轻量存储(数据库)
  5. ajax获取接口数据
  6. 2018年年度业绩发布会举行,神州数码调整姿态再赢数字化新机遇
  7. [Ljava.lang.Object 是什么
  8. 真相 | 两个前端大神给我的启示
  9. SpringBoot初级
  10. 十大流氓软件完全卸载方案