hive partition
partition是hive提供的一种机制:用户通过指定一个或多个partition key,决定数据存放方式,进而优化数据的查询
一个表可以指定多个partition key,每个partition在hive中以文件夹的形式存在。
实例(static partition):
编辑文件:/home/work/data/test3.txt; /home/work/data/test4.txt;
$ cat /home/work/data/test3.txt
1,zxm
2,ljz
3,cds
4,mac
5,android
6,symbian
7,wp
$ cat /home/work/data/test4.txt
8,zxm
9,ljz
10,cds
11,mac
12,android
13,symbian
14,wp
建表:
hive> create table student_tmp(id INT, name STRING)
> partitioned by(academy STRING, class STRING)
> row format delimited fields terminated by ',';
OK
Time taken: 6.505 seconds
id,name是真实列,partition列academy和class是伪列
load数据:(此处直接load数据进partition,在hive 0.6之前的版本,必须先创建好partition,数据才能导入)
hive> load data local inpath '/home/work/data/test3.txt' into table student_tmp partition(academy='computer', class='034');
Copying data from file:/home/work/data/test3.txt
Copying file: file:/home/work/data/test3.txt
hive partition相关推荐
- Hive partition prune Failed
昨天发现线上的HiveQuery: select * from db1.t1where dt between to_char(getdate('variables','-40'),'yyyymmdd' ...
- hive partition简介
一.背景 1.在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作.有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念. 2.分区表指的是在创建表 ...
- hive partition insert时候设置动态分区
hive 种实现类似 这种 (hive中不支持) insert overwrite table ******** partition(dt = date_add('{date}',3)) select ...
- hive常用参数配置设置
hive.exec.mode.local.auto 决定 Hive 是否应该自动地根据输入文件大小,在本地运行(在GateWay运行) true hive.exec.mode.local.auto ...
- hive 配置参数说明
hive.exec.mode.local.auto 决定 Hive 是否应该自动地根据输入文件大小,在本地运行(在GateWay运行) truehive.exec.mode.local.auto.in ...
- java hive配置_Hive配置项的含义详解(1)
一个hive任务,如何才算是优化的任务,hadoop job config里哪些配置能影响hive的效率.看看hive的详细配置我们可以略知一二. hive的配置: hive.ddl.output.f ...
- flume avro java 发送数据_flume将数据发送到kafka、hdfs、hive、http、netcat等模式的使用总结...
1.source为http模式,sink为logger模式,将数据在控制台打印出来. conf配置文件如下: # Name the components on this agent a1.source ...
- flume将数据发送到kafka、hdfs、hive、http、netcat等模式的使用总结
1.source为http模式,sink为logger模式,将数据在控制台打印出来. conf配置文件如下: # Name the components on this agent a1.source ...
- Hive配置文件中配置项的含义详解(收藏版)
这里面列出了hive几乎所有的配置项,下面问题只是说出了几种配置项目的作用.更多内容,可以查看内容 问题导读: 1.hive输出格式的配置项是哪个? 2.hive被各种语言调用如何配置? 3.hive ...
最新文章
- javascript2秒后再执行_停车后5秒,车祸发生了!高速公路上你别再这样做了!| 一线微观...
- C++:迭代器(STL迭代器)iterator详解
- python 学习笔记day03-python基础、python对象、数字、函数
- c++11- Alias Template
- java B2B2C 仿淘宝电子商城系统-eureka 基础
- 【组件】大数据框架安装功能来划分
- 横版网页游戏【一骑当先】地图原画资源
- 解决php保存文件时文件名乱码问题
- python中match函数的用法_python repython re.match函数怎么来使用
- iPS细胞移植最新进展
- w2ui 复选框功能
- 解决: 在路径为[/StudentManagerWeb]的上下文中,servlet[LoginServlet]的Servlet.service()引发异常 java.lang.NullPointe
- 怎么开发联机小游戏_微信小游戏创意大赛火热进行中,小游戏联机对战引擎免费用...
- uni-APP 联系我们
- 【阅读笔记】Towards Personalized Federated Learning个性化联邦综述
- 【软考软件评测师】2019综合知识历年真题
- 51单片机入门学习小结(流水灯与数码管)
- 程序员的半衰期只有15年
- 双网卡“在 TCP 网络上检测出有重复名称”错误
- 滴滴轮回--顺风车带有明显的性暗示
热门文章
- NVIDIA AGX Xavier散热风扇开启及开机自启风扇
- 中秋慰问送真情 暖暖关爱伴孤童——唐山孝和孤困儿童志愿服务团海港团队中秋节慰问活动
- CH582-BLE-Peripheral-控制LED开关
- Skype for Business+企业通讯录+Outlook 三位一体是一种什么样的体验?
- 什么是数据库中的一对多关系?
- python爬虫使用代理ip_python爬虫如何设置代理ip
- 静态html左侧导航菜单代码,Html+Css+Jquery实现左侧滑动拉伸导航菜单栏的示例代码...
- mysql orm .net_.NET(C#)有哪些主流的ORM框架,SqlSugar,Dapper,EF还是...
- 【外行也能看懂的RabbitMQ系列(四)】—— RabbitMQ进阶篇之通过插件实现延迟队列(内含实现代码及rabbitmq_delayed_message_exchange安装)
- getElementsByTagName()获取某些元素