1. chanelog模式

在以hudi的MOR表作为flink cdc的源时,出现了一些并非预期的效果。hudi自身支持ChangelogModes#FULL & ChangelogModes#UPSERT 两种模式,从它们支持的RowKind来看,还以为数据写入与读取时 RowKind是一致的,其实不然;另外,如果读写分别使用了不同的模式,那又会产生什么后果,我们应该怎么使用它。

  • 当changelog.enable=true时,为FULL模式,包含的RowKind有:INSERT , UPDATE_BEFORE , UPDATE_AFTER , DELETE
  • 当changelog.enable=false时,为UPSERT模式,包含的RowKind有:INSERT , UPDATE_AFTER , DELETE

2. FULL模式

2.1 写数据

在该模式下,sink端会完整接收上流所有RowKind类型的数据,在hudi内部通过往行记录中增加元数据字段_hoodie_operation,并将该字段的值设置为RowKind的名称(+I,-U,+U,-D),通过查看生成的rt表和ro表结构,多了一列。

org.

hudi系列-changelog的读写相关推荐

  1. 「Hudi系列」Hudi查询写入常见问题汇总

    点击上方蓝色字体,选择"设为星标" 回复"面试"获取更多惊喜 八股文教给我,你们专心刷题和面试 阅读本文前必读: 1. 「Apache Hudi系列」核心概念与 ...

  2. STC15系列单片机EEPROM读写示例

    STC15系列单片机EEPROM读写示例

  3. STM32F4系列 HAL Flash 读写

    前言 注意:F0F1系列和F4系列的Flash读写操作不相同 一.STM32CubeMX怎么查看芯片的Flash分布? 二.擦除F4系列Flash 本例程使用的是F411CEU6的型号芯片 1.擦除F ...

  4. 外部jar包_大数据系列之PySpark读写外部数据库

    本文以MySQL和HBASE为例,简要介绍Spark通过PyMySQL和HadoopAPI算子对外部数据库的读写操作 1.PySpark读写MySQL MySQL环境准备参考"数据库系列之M ...

  5. hudi系列-文件归档(archive)

    1. 简介 hudi会不断生成commit.deltacommit.clean等类型的Instant从而形成活跃时间轴(ActiveTimeline),随着时间增长,时间轴变长,.hoodie元数据目 ...

  6. hudi系列-upsert写过程

    环境 hudi upsert写过程最为复杂,流程上有一个桶分配的环节,当以flink state为索引时,流程变得更长,所以写入性能较差. hudi 0.13.0 mor表+insert/upsert ...

  7. Hudi系列3:Hudi核心概念

    文章目录 Hudi架构 一. 时间轴(TimeLine) 1.1 时间轴(TimeLine)概念 1.2 Hudi的时间线由组成 1.3 时间线上的Instant action操作类型 1.4 时间线 ...

  8. hudi系列-流式增量查询

    1. 简介 hudi的两大特性:流式查询和支持upsert/delete,hudi的数据变更是基于timeline的,所以时间点(Instant)就成为了实现增量查询的依据.在与flink集成中,当开 ...

  9. BLE芯片DA145XX系列:OTP读写、OTP Header

    Dialog的BLE芯片基本都有OTP(One-Time-Programmable)存储器,即一次性写入的存储器,一旦写入之后,就无法修改.如DA14531,有32KB的OTP存储器.主要用来写入固化 ...

最新文章

  1. R语言ggplot2可视化:使用热力图可视化dataframe数据
  2. JVM内存GC的骗局——JVM不抛出OOM但内存已经泄露
  3. 动环监控系统的组成都有什么呢?
  4. so加载报错:dlopen failed: couldn't map ... Permission denied
  5. UriComponentsBuilder 拼接URL、解析URL
  6. WPF DataGrid 通过自定义表头模拟首行固定
  7. mysql定时增量备份_Mysql日常自动备份和增量备份脚本
  8. 系统备份是对计算机硬件进行维户吗,计算机系统维护毕业论文_精品.doc
  9. JVM性能分析与定位
  10. Struts向JSP中传值
  11. ECNU 3263 丽娃河的狼人传说(差分约束)
  12. c语言状态机实现坐标切换,C语言状态机最优模式(转)
  13. hexo next 主题安装 livere 评论插件
  14. word 的使用(六)—— 常用功能
  15. [长文科普]浅谈数据湖的应用与安全
  16. MLOps- 吴恩达Andrew Ng Data Definition and Baseline Week3 论文等资料汇总
  17. 安卓系统手机如何用作电脑摄像头使用及解决方法
  18. 常用服务器查询日志命令(持续添加)
  19. 视觉数据集是基于物体和风景标记的巨大的图像库
  20. python爬虫爬取漫画(仅供学习)

热门文章

  1. [个人笔记]EME Solver自学笔记---参照lumerical官网视频
  2. JAVA实现Excel照相机功能_Excel2010中的照相机功能如何使用?
  3. 二月天:输入年可以获取当前年的二月有多少天
  4. 怎么理解CPU与显卡的关系
  5. 0x011.Python学习-网络编程、PortScan
  6. Win10系统简体繁体切换
  7. word中 插入好看高亮的java/c++代码
  8. Spacebuilder可以做什么?
  9. 如何用计算机管理员权限,计算机管理员权限如何获得【图解】
  10. 转转三合一验机源码+验机报告