partition是hive提供的一种机制:用户通过指定一个或多个partition key,决定数据存放方式,进而优化数据的查询
一个表可以指定多个partition key,每个partition在hive中以文件夹的形式存在。

实例(static partition):
编辑文件:/home/work/data/test3.txt; /home/work/data/test4.txt;
$ cat /home/work/data/test3.txt
1,zxm
2,ljz
3,cds
4,mac
5,android
6,symbian
7,wp

$ cat /home/work/data/test4.txt
8,zxm
9,ljz
10,cds
11,mac
12,android
13,symbian
14,wp

建表:
hive> create table student_tmp(id INT, name STRING)
      > partitioned by(academy STRING, class STRING)
      > row format delimited fields terminated by ',';
OK
Time taken: 6.505 seconds
id,name是真实列,partition列academy和class是伪列

load数据:(此处直接load数据进partition,在hive 0.6之前的版本,必须先创建好partition,数据才能导入)
hive> load data local inpath '/home/work/data/test3.txt' into table student_tmp partition(academy='computer', class='034');
Copying data from file:/home/work/data/test3.txt
Copying file: file:/home/work/data/test3.txt

hive partition相关推荐

  1. Hive partition prune Failed

    昨天发现线上的HiveQuery: select * from db1.t1where dt between to_char(getdate('variables','-40'),'yyyymmdd' ...

  2. hive partition简介

    一.背景 1.在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作.有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念. 2.分区表指的是在创建表 ...

  3. hive partition insert时候设置动态分区

    hive 种实现类似 这种 (hive中不支持) insert overwrite table ******** partition(dt = date_add('{date}',3)) select ...

  4. hive常用参数配置设置

    hive.exec.mode.local.auto  决定 Hive 是否应该自动地根据输入文件大小,在本地运行(在GateWay运行)  true hive.exec.mode.local.auto ...

  5. hive 配置参数说明

    hive.exec.mode.local.auto 决定 Hive 是否应该自动地根据输入文件大小,在本地运行(在GateWay运行) truehive.exec.mode.local.auto.in ...

  6. java hive配置_Hive配置项的含义详解(1)

    一个hive任务,如何才算是优化的任务,hadoop job config里哪些配置能影响hive的效率.看看hive的详细配置我们可以略知一二. hive的配置: hive.ddl.output.f ...

  7. flume avro java 发送数据_flume将数据发送到kafka、hdfs、hive、http、netcat等模式的使用总结...

    1.source为http模式,sink为logger模式,将数据在控制台打印出来. conf配置文件如下: # Name the components on this agent a1.source ...

  8. flume将数据发送到kafka、hdfs、hive、http、netcat等模式的使用总结

    1.source为http模式,sink为logger模式,将数据在控制台打印出来. conf配置文件如下: # Name the components on this agent a1.source ...

  9. Hive配置文件中配置项的含义详解(收藏版)

    这里面列出了hive几乎所有的配置项,下面问题只是说出了几种配置项目的作用.更多内容,可以查看内容 问题导读: 1.hive输出格式的配置项是哪个? 2.hive被各种语言调用如何配置? 3.hive ...

最新文章

  1. javascript2秒后再执行_停车后5秒,车祸发生了!高速公路上你别再这样做了!| 一线微观...
  2. C++:迭代器(STL迭代器)iterator详解
  3. python 学习笔记day03-python基础、python对象、数字、函数
  4. c++11- Alias Template
  5. java B2B2C 仿淘宝电子商城系统-eureka 基础
  6. 【组件】大数据框架安装功能来划分
  7. 横版网页游戏【一骑当先】地图原画资源
  8. 解决php保存文件时文件名乱码问题
  9. python中match函数的用法_python repython re.match函数怎么来使用
  10. iPS细胞移植最新进展
  11. w2ui 复选框功能
  12. 解决: 在路径为[/StudentManagerWeb]的上下文中,servlet[LoginServlet]的Servlet.service()引发异常 java.lang.NullPointe
  13. 怎么开发联机小游戏_微信小游戏创意大赛火热进行中,小游戏联机对战引擎免费用...
  14. uni-APP 联系我们
  15. 【阅读笔记】Towards Personalized Federated Learning个性化联邦综述
  16. 【软考软件评测师】2019综合知识历年真题
  17. 51单片机入门学习小结(流水灯与数码管)
  18. 程序员的半衰期只有15年
  19. 双网卡“在 TCP 网络上检测出有重复名称”错误
  20. 滴滴轮回--顺风车带有明显的性暗示

热门文章

  1. NVIDIA AGX Xavier散热风扇开启及开机自启风扇
  2. 中秋慰问送真情 暖暖关爱伴孤童——唐山孝和孤困儿童志愿服务团海港团队中秋节慰问活动
  3. CH582-BLE-Peripheral-控制LED开关
  4. Skype for Business+企业通讯录+Outlook 三位一体是一种什么样的体验?
  5. 什么是数据库中的一对多关系?
  6. python爬虫使用代理ip_python爬虫如何设置代理ip
  7. 静态html左侧导航菜单代码,Html+Css+Jquery实现左侧滑动拉伸导航菜单栏的示例代码...
  8. mysql orm .net_.NET(C#)有哪些主流的ORM框架,SqlSugar,Dapper,EF还是...
  9. 【外行也能看懂的RabbitMQ系列(四)】—— RabbitMQ进阶篇之通过插件实现延迟队列(内含实现代码及rabbitmq_delayed_message_exchange安装)
  10. getElementsByTagName()获取某些元素