Hudi--mor表 VS cow表
一、mor表和cow表官方解释
不赘述,请移步官网了解:
Hudi Table Types
二、time cost
- 环境准备:相同规模、配置的cow表、mor表各一份(分区键为date)
- 相同的操作逻辑准备:
- 分区更新:update .... where date = ***
- 无分区更新:update .... where {anything}
- 结果展示:
- 分区更新cow的耗时:
- 分区更新mor的耗时:
- 无分区更新cow的耗时:
- 无分区更新mor的耗时:
- 分区更新cow的耗时:
- 结论:
- mor表的更新时间 < cow表的更新时间
三、written cost
- 环境准备:同-二
- 逻辑准备:同-二
- 结果展示:
- cow表
- mor表
- cow表
- 结论:
- cow表:
- Total Records Written >= Total Update Records Written
- 适合分区更新的场景,即cow逻辑中Total Records Written = Total Update Records Written的场景(或略大于)
- mor表:
- Total Records Written = Total Update Records Written
- 适合无分区更新的场景,即cow逻辑中Total Records Written >> Total Update Records Written的场景
- cow表:
四、选型
- cow表
- 更新分区大量数据的场景
- mor表
- 除【四-1-1】的场景
- cow表资源浪费
上图除【红色框】和【cost=0】的场景外,均为资源浪费。
Hudi--mor表 VS cow表相关推荐
- 云原生大数据架构中实时计算维表和结果表的选型实践
简介: 随着互联网技术的日渐发展.数据规模的扩大与复杂的需求场景的产生,传统的大数据架构无法承载. 作者 | 志羽 来源 | 阿里技术公众号 一 前言 传统的大数据技术起源于 Google 三架马车 ...
- 设有一数据库,包括四个表:学生表(Student)、课程表(Course)、成绩表(Score)以及教师信息表(Teacher)。...
一. 设有一数据库,包括四个表:学生表(Student).课程表(Course).成绩表(Score)以及教师信息表(Teacher).四个表的结构分别如表1-1的表(一)~表( ...
- JavaScript 表单与表单验证
JavaScript 表单 JavaScript 表单验证 HTML 表单验证可以通过 JavaScript 来完成. 以下实例代码用于判断表单字段(fname)值是否存在,如果存在,则弹出信息,否则 ...
- postgres默认安装后有哪些表_Greenplum 行存、列存,堆表、AO表的原理和选择
行存和列存的原理 什么时候选择行存 什么时候选择列存 堆表和AO表的原理 什么时候选择堆表 什么时候选择AO表 测试对比行存deform和列存的性能差别 如何查看表的存储结构 Greenplum支持行 ...
- date类型_06076.1.0如何将ORC格式且使用了DATE类型的Hive表转为Parquet表
温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图. Fayson的github: https://github.com/fayson/cdhproject 提示 ...
- python数据库建表_mysql数据表如何创建
在 MySQL 中,可以使用 CREATE TABLE 语句创建表.其语法格式为:CREATE TABLE <表名> ([表定义选项])[表选项][分区选项]; 其中,[表定义选项]的格式 ...
- MySQL如何判别InnoDB表是独立表空间还是共享表空间
InnoDB采用按表空间(tablespace)的方式进行存储数据, 默认配置情况下会有一个初始大小为10MB, 名字为ibdata1的文件, 该文件就是默认的表空间文件(tablespce file ...
- mysql关系表控制_mysql表关系
一.表的详细操作 1.修改表名 alter table 旧表名 rename 新表名; 2.修改表的引擎与字符编码 alter table 表名 engine="引擎名" ch ...
- 数据结构与算法--线性表(顺序表)
本图文主要掌握以下问题: 1. 什么是线性表,线性表有哪些操作? 2. 如何利用顺序结构实现线性表?
最新文章
- 整数展示分数和整形数的四则运算
- 苹果x可以双卡吗_苹果12支持双卡吗
- 数据库-左外连接-右外连接
- redhat7.1安装mysql_redhat7.1 安装mysql 5.7.10步骤详解(图文详解)
- C++生成简单WAV文件(一)
- Qone 自动删除说说脚本
- 反射(一)动态加载类
- Docker数据持久化与容器迁移
- pythoncad标注教程,AotuCAD国标字体和标注设置技巧图文教程
- 程序员必备的25个好网站汇总
- Win10怎么合并磁盘分区 合并磁盘的操作方法
- Abp 添加阿里云短信发送
- HDU 6164 Dying Light(计算几何)
- 计算机组成原理唐朔飞第二版答案第六章,计算机组成原理第六章部分课后题答案(唐朔飞版)...
- 离线环境遇到Problems loading reference..Unable to load schema from https-解决篇
- 【电力电子】【2011.08】通过谐波电流注入改善三相整流器输入功率因数
- 无源无线测温 无线测温装置
- Android APP性能及专项测试(学习笔记)
- 从零开始学习Linux运维,成为IT领域翘楚(十)
- 终于有人把Java程序员必学知识点整理出来了,令人有如醍醐灌顶
热门文章
- idea2022.1版本创建maven项目没有src文件夹
- 立即报名 | 云原生技术交流 Meetup 广州站已开启,8 月 6 号与你相遇!
- 魔坊APP项目-17-种植园,商城页面、服务端提供商品api,解决App打包编译以后的跨域限制、客户端获取商品列表并进行展示,集成Alipayplus模块完成支付
- PHP在线发邮件 无需服务端软件
- 牛客小白月赛23(A、B
- 国防科大 linux教程,操作系统国防科大罗宇
- 云南省初中计算机说课稿,云南省实验教材《信息技术》说课稿范文(9页)-原创力文档...
- ssm博客系统-博主登陆功能实现(shiro支持)
- 淘宝数据库,主键如何设计的?
- jenkins安装和配置(一):ubuntu 20.04 jenkins安装