今天我们来讲讲Hive中最常用的 select from 语句知识要点。Hive系列文章主要讲数据分析中最基础的SQL技能。

今天我们来讲讲Hive中最常用的 select from 语句知识要点。

Hive系列文章预计10-20篇,主要讲数据分析中最基础的SQL技能。

01-查询表中的内容

查询指定的某一列或某几列,命令如下:

SELECT 列名1,列名2,…… FROM 表名;

查询表中的所有字段时,可以使用*代表所有字段。星号(*)是选取所有列的快捷方式。命令如下:

SELECT * FROM 表名;

如果我们想查询表 t_od_use_cnt 中的所有的user_id和use_cnt,具体命令如下:

SELECT user_id ,use_cnt
FROM app.t_od_use_cnt;

备注:app是数据库名,如果当前查询表与当前使用数据库一致,可以省略不写

02-Hive严格模式

在Hive中这样写虽然语法正确(不加分区),但在实际工作中这样写很可能会报错。

因为Hive中的表一般数据量极大,为了防止用户误操作进行全表扫描,可以设置为查询分区表时必须加入分区限制。比如这里我们的分区字段是date_8这个日期字段,工作中的表会要求我们必须限定查询哪几天的分区数据。这里我们可以输入设置参数进行模拟,命令如下:

hive (app)> set hive.mapred.mode;
hive.mapred.mode=nonstrict
hive (app)> set hive.mapred.mode=strict;
hive (app)> set hive.mapred.mode;
hive.mapred.mode=strict

然后我们重新执行上面的查询语句,报错如下:

hive (app)> SELECT user_id >       ,use_cnt > FROM app.t_od_use_cnt;
FAILED: SemanticException [Error 10041]: No partition predicate found for Alias "t_od_use_cnt" Table "t_od_use_cnt"
hive (app)>

如下使用where语句限定分区即可解决这个问题:

SELECT user_id ,use_cnt
FROM app.t_od_use_cnt
WHERE date_8 = '20210420';

03-limit限制查询返回行数

上面的查询语句会返回查询到的所有数据,但有时候我们只是要确认一下表中的数据内容,或者要指定行数据,比如只要100行,这时只需要在查询语句后加上(limit 数字)即可。

查询表t_od_use_cnt中前5行数据,命令如下:

SELECT user_id ,use_cnt
FROM app.t_od_use_cnt
WHERE date_8 = 20190101 Limit 5;

运行结果如下:

hive (app)> SELECT user_id >       ,use_cnt > FROM app.t_od_use_cnt > WHERE date_8 = 20210420 Limit 5;
OK
user_id  use_cnt
10000  6
10001  49
10002  23
10003  1
10004  29
Time taken: 0.829 seconds, Fetched: 5 row(s)
hive (app)>

04-列四则运算

在查询时可以对数值类型的字段进行加减乘除和取余等四则运算

下面我们将表t_od_use_cnt中use_cnt列和is_active列相乘得到一个新列,其他用法依次类推。

hive (app)> SELECT user_id >       ,use_cnt >       ,is_active >       ,use_cnt * is_active > FROM app.t_od_use_cnt > WHERE date_8 = 20210420 Limit 5;
OK
user_id  use_cnt  is_active  _c3
10000  6  1  6
10001  49  1  49
10002  23  1  23
10003  1  0  0
10004  29  1  29
Time taken: 0.124 seconds, Fetched: 5 row(s)
hive (app)>

05-列别名

可以看到上面的例子中我们通过两个列相乘人为制造出一个新列,系统默认将其列名起为_c3。通常有必要给这些新产生的列起一个别名。已有列的列名如果含义不清晰也可以通过起别名的方式进行更改。不过别名只在本条SQL语句中生效,不影响原表中的字段名。

这里顺便介绍一下字段命名规则:

1.不能和已有字段重复

2.只能包括小写字母(a-z)、数字(0-9)、下划线(_)

3.以字母开头

4.单词之间用下划线_分割

这里我们将别名起为active_use_cnt,在列后面加 AS active_use_cnt即可。另AS可以省略,只用空格分隔别名也可以生效

hive (app)> SELECT user_id >       ,use_cnt >       ,is_active >       ,use_cnt * is_active AS active_use_cnt > FROM app.t_od_use_cnt > WHERE date_8 = 20210420 Limit 5;
OK
user_id  use_cnt  is_active  active_use_cnt
10000  6  1  6
10001  49  1  49
10002  23  1  23
10003  1  0  0
10004  29  1  29
Time taken: 0.239 seconds, Fetched: 5 row(s)
hive (app)> 

SQL-Hive中的Select From解析相关推荐

  1. SQL语句中的select高级用法

    #转载请联系 为了更好的了解下面的知识点,我们先创建两张表并插入数据. # 学生表 +----+-----------+------+--------+--------+--------+------ ...

  2. SQL server中的SELECT查询语句执行顺序

    各位大牛们好第一次写博客有点小激动!以后我会把自己的心得分享给大家,求各种评论 SQL server 中SELSECT查询语句的执行顺序如下: (8) SELECT   (9) DISTINCT (1 ...

  3. 如何从SQL Server中的SELECT语句更新

    In this article, we will learn different methods that are used to update the data in a table with th ...

  4. 如何从SQL Server中的SELECT更新?

    在SQL Server中 ,可以使用SELECT语句insert表中: INSERT INTO Table (col1, col2, col3) SELECT col1, col2, col3 FRO ...

  5. 如何从 SQL Server 中的 SELECT 更新?

    问题描述: 在 SQL Server 中,可以使用 INSERT- SELECT 语句将行插入到表中: INSERT INTO Table (col1, col2, col3) SELECT col1 ...

  6. [转载]sql(hive)中变量的使用

    文章来源:https://zhuanlan.zhihu.com/p/89062863 我们在学 Python 或者其他编程语言的时候都应该有学过变量这么一个东西,可是 Sql 这种查询语言中怎么也有变 ...

  7. golang中的select原理解析

    基本用法 检查 ch 中有没有数据 select {case d <- ch:default: } 读取已经被 close 掉的 ch 时会返回零值,不会报错.因此在使用for + select ...

  8. 如何在SQL Server中的SELECT TOP 中使用变量

    在 TOP 中使用变量 以下示例使用变量获得 AdventureWorks 数据库的 dbo.Employee 表中列出的前 10 个雇员. USE AdventureWorks ; GO DECLA ...

  9. hive中json格式字段解析及map使用

    json 如果hive表中有扩展字段,那么扩展字段格式最常见的就是json格式,所以如何解析json字符串相对繁琐(虽然没啥技术

最新文章

  1. JAVA《第一次作业》
  2. 时间立即同步命令_Redis复制:主从同步
  3. 微信小程序实现图片是上传、预览功能
  4. 在redis取数据若存在直接取,不存在在db中取,并放到缓存中
  5. Java 并发编程之可重入锁 ReentrantLock
  6. panic与recover函数
  7. HTML5---offline application(application cache)
  8. GDAL\OGR读取数据示例 C#版本
  9. dubbo和zookeper使用_Dubbox与Zookeeper简介及入门小案例
  10. 微波遥感SNAP(三)——检测地表沉降(1)自动化处理(Graph Builder)
  11. Jmeter下载安装详细步骤(最新)
  12. 《数据挖掘:理论与算法》习题 + 期末考试+答案 + 2021年【完整/完结】
  13. Spring中bean的生命周期
  14. snipaste滚动截图方法_【软件工具】超强干货|不同级别的截图工具,快来按需领取吧...
  15. 解读swarm最新资讯,主网8.2号开始产BZZ
  16. 迈克菲实验室:2018五大网络安全威胁
  17. Java导入Excel文档到数据库
  18. 罗技F710 无线手柄在ROS下的配置使用总结
  19. android九宫格切图,拼图九宫格切图app
  20. 薅资本主义羊毛新姿势,英伟达K80免费用

热门文章

  1. GitHub 热榜:中国博士开发可交互全球疫情地图,登上柳叶刀!
  2. 如何用 Python 分析 14 亿条数据?
  3. 美多商城之验证码(短信验证码2)
  4. 爬虫之常见的验证码的种类
  5. Debug常用命令 精简版本
  6. 国内外有哪些漏洞信息发布平台?
  7. 图像超分辨率网络:RCAN
  8. 算法理解|从头开始理解梯度提升算法
  9. 剑指offer java版(三)
  10. 冰箱温度调到这个数值,就能节省超过35万吨食物