今天就说说hive多个分隔符的问题。

多分隔符(列)这个问题,也是之前同事给我一份文件我才发现的...

这份文件上列分隔符是@#|

hive建表时,ROW FORMAT DELIMITED FIELDS TERMINATED BY '@#|' 直接用@#|,发现输出的字段和文件不一致。

CREATE EXTERNAL TABLE IF NOT EXISTS hjx_temp_ua_190605

(

id String,ua_cut String,user_num String,ua String

)

ROW FORMAT DELIMITED FIELDS TERMINATED BY '@#|'

LINES TERMINATED BY '\n'

location '/user/jfa5d/hjx_temp/ua_temp/';

查了资料,hive创建表指定分隔符时,不支持多个字符作为分隔符(只支持单个)。

Hive多分隔符支持

CREATE EXTERNAL TABLE IF NOT EXISTS hjx_temp_ua_1906052

(

id String,ua_cut String,user_num String,ua String

)

ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe' WITH SERDEPROPERTIES ("field.delim"="@#|")

stored as textfile location '/user/jfa5d/hjx_temp/ua_temp2/';

关键语句为:

ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe' WITH SERDEPROPERTIES ("field.delim"="@#|")

stored as textfile location '/user/jfa5d/hjx_temp/ua_temp2/';

好了,菜鸡埋坑结束..

hive分隔符_Hive踩过的坑-hive多个分隔符的问题相关推荐

  1. hive的load踩过的坑

    load: hive中load命令的使用语法 LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITI ...

  2. hive创建分区表 指定分隔符_HIVE 对于分区表的操作

    CREATE EXTERNAL TABLE IF NOT EXISTS data_zh( ROWKEY STRING, STATION INT, YEAR INT, MONTH INT, DAY IN ...

  3. hive创建分区表 指定分隔符_hive建表语句行分隔符

    如何生成hive的建表语句 hivesql sql - 获取指定hive表或指定文件中所有hive表的DDL,如果有按天的分区则默认执行最近7天的分区DDL.同时,table支持符合sql语法的正则表 ...

  4. Hive安装中遇到过的坑

    实现说明每一个用户的环境都有细微的不一致,所以这里只是个人经过这些坑的处理,但是不意味着所有处理都是这样的操作,仅作为参考. 第一个坑 数据库安装,数据库最好装在Linux上,一直出了很多错,这里有一 ...

  5. ubutun安装MySQL hive配置_Hive安装以及部署(Ubuntu-MySql)

    下载Hive安装包 http://hive.apache.org/downloads.html 根据需求下载相应的安装包解压安装 默认的数据存放路径hdfs:/user/hive/warehouse/ ...

  6. java hive配置_Hive配置项的含义详解(1)

    一个hive任务,如何才算是优化的任务,hadoop job config里哪些配置能影响hive的效率.看看hive的详细配置我们可以略知一二. hive的配置: hive.ddl.output.f ...

  7. hive遍历_Hive解析流程-抽象语法树生成

    HiveQL解析流程: Hive根据Antlr定义的词法.语法规则完成词法.语法分析将HQL解析为AST Tree: 遍历AST Tree,抽象出查询的基本组成单元Query Block: 遍历Que ...

  8. hive on tez集成完整采坑指南(含tez-ui及安全环境)

    hive on tez 介绍 tez是hive官方推荐的一个有向无环图的执行引擎,从测试结果来看,相对于mr是数量级上的提升 使用版本 hadoop 3.1.1 hive 3.1.0 tez 0.9. ...

  9. excel文件导入hive乱码_hive 从Excel中导入数据

    拿到Excel表后将数据保留,其他的乱七八糟都删掉,然后另存为txt格式的文本,用nodepad++将文本转换为UTF-8编码,此处命名为cityprovince.txt 将cityprovince. ...

最新文章

  1. 2022图神经网络5篇最新的研究综述:双曲/图分类/联邦/等变/异质性
  2. Android+NDK+OpenGLES开发环境配置
  3. 二叉排序树(完整案例与完整C语言代码)
  4. Android小测验感受
  5. 【离散数学中的数据结构与算法】九 鸽巢原理
  6. [连载型] Neutron 系列 (15): OpenStack 是如何实现 Neutron 网络 和 Nova虚机 防火墙的...
  7. 卷积神经网络CNN(8)—— Pix2Pix Application -- Aerialmap Lane Line Detection (Pix2Pix应用:航拍图车道线检测)
  8. 没有规则可制作目标modules_Modules简介
  9. oracle 数据为当前月 查询结果为累计到当前月的数据_Oracle里的执行计划——使用explain plan命令...
  10. Weka算法Classifier-tree-J48源代码分析(一个)基本数据结构和算法
  11. 暗通道去雾及C++实现
  12. 【BZOJ】1901: Zju2112 Dynamic Rankings(区间第k小+树套树)
  13. c语言调用函数时二维数组实参,C语言函数调用二维数组,指针问题
  14. CSAPP Lab5--Writing a Dynamic Storage Allocator
  15. CCF系列题解--2018年3月第三题 URL映射
  16. (一)ArcGIS JS 发布动态地图服务
  17. linux下删除文件夹的命令
  18. 软件工程导论课程总结
  19. css direction属性
  20. MAC修改jar包并打包

热门文章

  1. 计算机组成原理面试总结
  2. 华为机试:最大岛屿体积
  3. 【java毕业设计】基于java+SSH+jsp的物资租赁系统设计与实现(毕业论文+程序源码)——物资租赁系统
  4. 读书笔记-第一本Docker书:Docker简介
  5. 如何将chatGpt接入企业微信
  6. python装饰器functools
  7. 上海交通大学计算机学院郑欣,上海交通大学计算机科学与工程系(CSE)
  8. 自学软件测试,现在年薪30w,我骄傲了吗?
  9. Java标识符及关键字
  10. win7-win7电脑无线网变身WiFi热点