Apache DolphinScheduler 补数功能应用
Apache DolphinScheduler是一个分布式和可扩展的开源工作流协调平台,具有强大的DAG可视化界面。
目录
准备数据
Apache DolphinScheduler 测试:
1、设置全局参数:
2、补数一天:
3、补数一段时间:
准备数据
-- hive建表
-- 来源数据表
drop table if exists test.test_ds_bushu_detail;
create table test.test_ds_bushu_detail
(
rank int comment '排名',
complement_date string comment '日期',
etl_time string comment '执行时间'
)
COMMENT "测试数据"
stored as textfile
location '/opt/user/test/warehouse/test/test_ds_bushu_detail'
;-- 造数据
insert into table test.test_ds_bushu_detail
select 1,'2023-02-01',from_unixtime(unix_timestamp(), 'yyyy-MM-dd HH:mm:ss')
;-- 补数目标结果表
drop table if exists test.test_ds_bushu;
create table test.test_ds_bushu
(
amount int comment '排名',
complement_date string comment '补数日期',
etl_time string comment '执行时间'
)
COMMENT "测试ds补数功能"
stored as textfile
location '/opt/user/test/warehouse/test/test_ds_bushu'
;
Apache DolphinScheduler 测试:
1、设置全局参数:
prop:指定一个参数名称
value:自己设置即可,$[yyyy-MM-dd] 默认获取当前日期
代码内数据时间:全局参数 ${complement_date}
insert into table test.test_ds_bushu
select rank,complement_date,from_unixtime(unix_timestamp(), 'yyyy-MM-dd HH:mm:ss')
from test.test_ds_bushu_detail
where complement_date = '${complement_date}' -- 接收全局参数获取的时间
;
2、补数一天:
1、直接从主界面点击执行,配置启动参数
2、选择补数功能
3、执行方式根据自身场景选择
4、调度日期:补数日期范围,先用一天测试
5、参数的value根据自身需求设置
未开启补数时,$[yyyy-MM-dd] :默认获取当前日期.
开启补数功能,$[yyyy-MM-dd] :获取的是,序号4位置所设置的调度日期
可以看见,2023-02-01的数据已经进来!!!
3、补数一段时间:
1、前面步骤同上面
2、假如想补 2023-02-05 —— 2023-02-09 的数据
3、将调度时间设置为 2023-02-05 —— 2023-02-09
4、串行执行补数逻辑:
○ 点击运行,传入 2023-02-05 执行一遍 test_ds_bushu 里面所有的 job
○ 执行完成传入 2023-02-06 执行一遍
○ 以此类推,直至传入 2023-02-09 执行一遍结束
根据场景自行选择(可以参考截图)
单纯个人记录和分享, 希望得到支持和鼓励。
如果对您有帮助,可以点赞评论鼓励一下!
如果有更优的的建议或方法,可以在评论区留下见解!
Apache DolphinScheduler 补数功能应用相关推荐
- Dolphinscheduler补数功能
以增量同步数据为例,补数功能的实现如下: 增量 select 字段一,字段二,.....字段N, from 表名 WHERE DATE_FORMAT(update_time, '%Y-%m-%d') ...
- 工作流任务调度系统:Apache DolphinScheduler
1 概述 Apache DolphinScheduler(目前处在孵化阶段)是一个分布式.去中心化.易扩展的可视化DAG工作流任务调度系统,其致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数 ...
- 工作流调度系统Apache DolphinScheduler介绍和设计原理
1 概述 Apache DolphinScheduler(目前处在孵化阶段)是一个分布式.去中心化.易扩展的可视化DAG工作流任务调度系统,其致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数 ...
- Apache DolphinScheduler 诞生记
Apache DolphinScheduler 诞生记 DolphinScheduler,简称"DS", 中文名 "小海豚调度"(海豚聪明.人性化,又左右脑可互 ...
- Apache DolphinScheduler 是如何诞生的
作者 | 代立冬,李岗 排版 | 开源之道小助理 Apache DolphinScheduler,简称"DS", 中文名 "小海豚调度"(海豚聪明.人性化,又左 ...
- 议题征集令 | Apache DolphinScheduler Meetup 2021 来啦,议题征集正式开启!
点击上方 蓝字关注我们 社区的小伙伴们,经过精心筹备,我们很高兴地宣布,Apache DolphinScheduler Meetup 2021 将于 2021 年 11 月 27 日到来! 在 Mee ...
- 从 Airflow 到 Apache DolphinScheduler,有赞大数据开发平台的调度系统演进
点击上方 蓝字关注我们 作者 | 宋哲琦 ✎ 编 者 按 在不久前的 Apache DolphinScheduler Meetup 2021 上,有赞大数据开发平台负责人 宋哲琦 带来了平台调度系统 ...
- 日均处理 10000+ 工作流实例,Apache DolphinScheduler 在 360 数科的实践
点击上方 蓝字关注我们 从 2020 年起,360 数科全面将调度系统从 Azkaban 迁移到 Apache DolphinScheduler.作为 DolphinScheduler 的资深用户,3 ...
- 我与Apache DolphinScheduler的成长之路
关于 Apache DolphinScheduler社区 Apache DolphinScheduler(incubator) 于17年在易观数科立项,19年3月开源, 19 年8月进入Apache ...
最新文章
- Python轻松爬取Rosimm写真网站全部图片
- 一文读懂2019年IT及大数据行业趋势
- Serverless 实战 —— Funcraft + OSS + ROS 进行 CI/CD
- createprocess失败代码2_极客战记[森林]:边地之叉-通关代码及讲解
- 2013年国家计算机一级考试试题,2013年计算机一级的考试试题.doc
- 小鱼比可爱(洛谷-P1428)
- 工业相机选型_工业相机与镜头的选型方法
- [译]Selenium —— 怎样使用FireBug和FirePath
- 编译原理学习笔记 4.5 自底向上分析方法
- python爬取奇书网小说
- 淘宝商品历史价格接口/商品历史价走势接口对接代码分享
- 想学开服技术,先了解服务端的组成
- 基于ASP的房屋租售信息管理系统的设计与实现
- 如何快速实现增长App用户量?
- Java—求绝对值(选择结构)
- 微信官方开发者工具如何导入小程序源码demo
- 2021年中国压力-容积回路系统市场趋势报告、技术动态创新及2027年市场预测
- [附源码]java毕业设计在线视频网站
- 基于角色、标记及BLP模型的多级访问控制-B/S架构OA系统应用
- 不愧java_JAVA高手请进
热门文章
- html2canvas.min.js 截图 多行文字错位 ;截图不全不完整
- 如何在百度云平台上执行Hadoop MapReduce程序
- 如何给电脑桌面添加便签,电脑便签适合日常办公
- MacOS - Mac电脑能用Windows键盘吗?
- SDI,ASI,HDMI,DP等接口的区别
- spring拦截器不生效
- 北京2021唐诗童高考成绩查询,2021北京高考成绩查询时间:6月下旬可查,6月27日起填报本科志愿...
- 动不动就跳槽转行转岗,大好青春就是这样被浪费掉的!
- CSS布局盒子模型(复习巩固)
- 解决Shiro中报错:Caused by: java.lang.IllegalArgumentException: Odd number of characters.