至少在Sqoop 1.4.5中存在支持orc文件格式的hcatalog集成(以及其他).

例如,您可以选择

--hcatalog-storage-stanza

可以设置为

stored as orc tblproperties ("orc.compress"="SNAPPY")

例:

sqoop import

--connect jdbc:postgresql://foobar:5432/my_db

--driver org.postgresql.Driver

--connection-manager org.apache.sqoop.manager.GenericJdbcManager

--username foo

--password-file hdfs:///user/foobar/foo.txt

--table fact

--hcatalog-home /usr/hdp/current/hive-webhcat

--hcatalog-database my_hcat_db

--hcatalog-table fact

--create-hcatalog-table

--hcatalog-storage-stanza 'stored as orc tblproperties ("orc.compress"="SNAPPY")'

hdfs orc格式_hdfs – Sqoop导入为OrC文件相关推荐

  1. 【hive】hive常见的几种文件存储格式与压缩方式的结合-------Parquet格式+snappy压缩 以及ORC格式+snappy压缩文件的方式

    一.使用Parquet存储数据 数据使用列存储之前是普通的行存储,下面是行存储的的文件大小,这个HDFS上的数据 使用parquet列存储,可以将文件的大小减小化.下面具体讲parquet存储数据的代 ...

  2. HIVE Parquet格式+snappy压缩及ORC格式+snappy压缩文件的方式

    一.使用Parquet存储数据 数据使用列存储之前是普通的行存储,下面是行存储的的文件大小,这个HDFS上的数据 使用parquet列存储,可以将文件的大小减小化.下面具体讲parquet存储数据的代 ...

  3. hdfs orc格式_hive中orc格式表的数据导入

    Hive系列文章 hive创建orc格式表不能像textfile格式一样直接load数据到表中,需要创建临时textfile表,然后通过insert into 或者insert overwrite到o ...

  4. hdfs orc格式_HIVE存储格式ORC、PARQUET对比

    hive有三种默认的存储格式,TEXT.ORC.PARQUET.TEXT是默认的格式,ORC.PARQUET是列存储格式,占用空间和查询效率是不同的,专门测试过后记录一下. 一:建表语句差别 crea ...

  5. linux怎么看文件是否orc格式,hive文件存储格式orc,parquet,avro对比

    orc文件存储格式 ORC文件也是以二进制方式列式存储的,所以是不可以直接读取,ORC文件也是自解析的,它包含许多的元数据,这些元数据都是同构ProtoBuffer进行序列化的.文件结构如下 ORC文 ...

  6. MapReduce 读取ORC格式文件

    1.创建orc格式hive表: create table test_orc(name string,age int) stored as orc 2.查看表结构: show create table ...

  7. Hive中text格式和orc格式表的索引性能相关总结

    Hive中text格式和orc格式表的索引性能相关总结 text表索引的使用: 建表: create table aa (O_ORDERKEY int, O_CUSTKEY int, O_ORDER ...

  8. 【hive-3.1.3】ORC 格式的表和 text 格式的表,当分区的字段数量和表的字段数量不一致,检索结果不相同

    ORC 格式的表,和 text 格式的表,如果分区的字段数量和表的字段数量不一致,则 select 的结果不一致. 1. 测试内容 1.1 ORC 格式的表 CREATE EXTERNAL TABLE ...

  9. sqoop从orc文件到oracle,Sqoop import as OrC file

    问题 Is there any option in sqoop to import data from RDMS and store it as ORC file format in HDFS? Al ...

最新文章

  1. JAVA语法基础 3
  2. 设置按钮不可见_华为手机居然有【3种录屏方法】,很多人都不知道,真的太实用了...
  3. Part2_3 正则表达式、Excel表格相关操作
  4. 【数据处理】python数据评估常用指标:ks、fpr、tpr
  5. 3DSlicer17:Logics
  6. OpenCV为轮廓创建边界旋转框和椭圆
  7. 牛客-小w的魔术扑克【并查集】
  8. php 发送短信 sms,php 调用百度sms来发送短信的实现示例
  9. linux下启动某个进程
  10. 乌班图系统修改服务器时间的命令,ubuntu 修改系统时间无效
  11. vue安装axios以及如何使用axios
  12. 图论专项shortest_paths:UVa 10246
  13. 打车日记 - 上班迟到
  14. 中断的概念和机制————(清华大学慕课记录)
  15. 三次方分解因式重要公式
  16. 阿里云服务器储存空间不足解决方案
  17. 五句话介绍计算机英语,日常必备的英语口语句子3篇
  18. 清理服务器多余的图片(文件、数据)
  19. 5.随机输入一个整数,判断输入的数是正数、负数还是0,如果是正数那么我们输出,”刚刚输入的一个正数”,如果是负数,那么我们输出,”刚刚输入的那个数是负数”,如果我们输入的0的话,那么我们出输,”刚刚输
  20. Activiti工作流查询待办和已办

热门文章

  1. 15. Linux系统日志管理
  2. python(计时器)
  3. dB、dBm、dBW、W 四者的关系
  4. 网络经济学——第二章 网络外部性
  5. [网鼎杯 2020 朱雀组]phpweb-反弹shell
  6. SSRF中利用到的协议
  7. python批量裁剪图片尺寸
  8. 红帽 Red Hat Linux相关产品iso镜像下载【迅雷快传】【更新7.0】
  9. 关于VS code ESP-IDF 提示“loading ‘build.ninja‘: 系统找不到指定的文件” 的解决方案
  10. 做最好的自己(zz)