最近遇到Hive底层数据文件变化后,元数据库中的统计信息没有发生改变的情况。导致在Hive中使用count函数的时候统计出来的数据量不对,在此记一下解决方法。

外部表

Hive中运行ANALYZE TABLE 表名 COMPUTE STATISTICS;

分区表

Hive中运行ANALYZE TABLE 表名 PARTITION (需要重新计算的分区) COMPUTE STATISTICS;
根据实际情况运行以上两个命令对表进行重新统计计算。

也可以运行或者配置set hive.compute.query.using.stats=false;,但是这种方式会影响查询效率。

在其他地方看到的MSCK REPAIR TABLE 表名其作用是修复分区,把数据加载到分区中。但还是不会重新统计。

Hive分区表重建分区或数据文件变化更新表的统计信息相关推荐

  1. hive分区用2个字段有何限制_关于Hive使用动态分区插入数据详解

    1.创建一个单一字段分区表 hive>  create table dpartition(id int ,name string ) partitioned by(ct string  ); 2 ...

  2. hive之动态分区插入数据及其参数配置

    hive使用动态分区插入数据详解 往hive分区表中插入数据时,如果需要创建的分区很多,比如以表中某个字段进行分区存储,则需要复制粘贴修改很多sql去执行,效率低.因为hive是批处理系统,所以hiv ...

  3. oracle移动表空间的数据文件,移动Oracle表空间数据文件方案

    方案一:移动常规表空间(非系统表空间)数据文件 /**************数据库服务器某个磁盘空间不足时移动常规表空间数据文件******** 方案一:移动常规表空间(非系统表空间)数据文件 /* ...

  4. oracle为表空间增加数据文件,创建Oracle表空间,增加数据文件的步骤

    经过长时间学习创建Oracle表空间,于是和大家分享一下,看完本文你肯定有不少收获,希望本文能教会你更多东西. 1.先查询空闲空间 select tablespace_name,file_id,blo ...

  5. oracle analyze分区表,PostgreSQL Analyze分区表:主表与子表的统计信息问题

    最近在PostgreSQL的Mail List中参与讨论了一个问题: ANALYZE'ing table hierarchies. 网友认为在Analyze分区表的时候,只能看到主表的analyze日 ...

  6. Spark 调用 hive使用动态分区插入数据

    spark 调用sql插入hive 失败 ,执行语句如下 spark.sql("INSERT INTO default.test_table_partition partition(prov ...

  7. shell脚本练习,创建数据文件注册用户并将用户信息存入文件内,用于模拟登录时使用...

    创建文件首先判断文件是否存在 如果不存在才去创建 注册用户名 首先判断用户名是否存在 运行结果如下 转载于:https://www.cnblogs.com/lijianjie/p/9903113.ht ...

  8. oracle数据表空间与数据文件,oracle的表空间及数据文件

    一.默认表空间 Oracle 安装时会自动创建几个默认表空间,可以在 dba_tablespaces 这张表查看到默认表空间 : 说明: SYSTEM:管理任何其他表空间.它包含数据字典,有关数据库管 ...

  9. oracle表空间追加数据文件,oracle数据库表空间追加数据库文件方法

    mysql优化(初学) 写的时候遇到了SQL语句的优化问题,在网上搜了一些学习.http://blog.csdn.net/kennyrose/article/details/7532032 索引: 1 ...

最新文章

  1. 应用在大规模推荐系统,Facebook提出组合embedding方法 | KDD 2020
  2. ant导入Zookeeper到Eclipse错误path contains invalid character
  3. 国产360等浏览器安装完flash升级程序不起作用的解决方案
  4. Rtx userlist.php,【图片】【C语言】【控制台】提取腾讯通用户信息(id,用户名,手机)【erbi_lucifer吧】_百度贴吧...
  5. 剑指offer(一):二维数组中的查找
  6. ppt课堂流程图_4个超实用的PPT制作技巧:开学提升备课质量,资深老师都在用
  7. 05NumPy--5.2创建NumPy数组
  8. python中的chardet模块
  9. H5唤醒Android App
  10. Linux UOS 防火墙安装
  11. python制作ico图标_Python 批量 png 转 ico
  12. python%是什么意思_%在Python中是什么意思?
  13. 12 WebGL移动、旋转和缩放中的平移
  14. 网站地图(sitemap)如何优雅生成?
  15. 华为openEuler(EulerOS)系统 设置yum源
  16. 人脸识别技术在智慧城城市建设中的深度应用
  17. android 画图便宜,10个最好用的绘画App,赶紧mark
  18. 路由器和交换的本质区别解析
  19. 使用Qt二次开发周立功CAN(一)
  20. 电磁学学习三__通量、散度、旋度

热门文章

  1. linux 基本命令初学,Linux基本命令学习二
  2. yolov5之voc数据集转yolo标准数据集
  3. 即构科技冼牛:微信小程序的视频直播实践
  4. Three.js系列: 写一个第一/三人称视角小游戏
  5. 台达变频器vfb—d参数表_台达变频器维修CF3故障原因及维修措施
  6. 报错:struts之invalid field value for field
  7. 你和云的距离只缺数据库服务器的一场大火
  8. 女性收入最高的20个工作一览
  9. 复旦微的 FMQL45T900+ARM
  10. HCIA-数通学习总结4