kettle案例——数据转换(多数据源合并)
1.数据准备
假设,某公司旗下有两个子公司,分别为A公司和B公司,且这两个子公司均在销售手机,其中A公司的手机日销售情况存储在CSV文件中,即文件company_a.csv;B公司的手机日销售情况存储在数据库的数据表中,即数据表company_b,具体内容如下图所示
2.打开Kettle工具,创建转换
使用Kettle工具,创建一个转换company_merge,并添加CSV文件输入控件、表输入控件、字段选择控件、排序合并控件、增加序列控件、表输出控件以及Hop跳连接线,具体如图所示。
3. 配置CSV文件输入控件
单击【浏览】按钮,选择要抽取的CSV文件company_a.csv;单击【获取字段】按钮,Kettle自动检索CSV文件获取字段名称,并对文件中字段的类型、格式、长度、精度等属性进行解析。
单击【预览】按钮,查看文件company_a.csv的数据是否抽取到CSV文件输入流中,具体效果如图所示
4.配置字段选择控件
在“选择和修改”选项卡的“字段”处手动添加CSV文件输入控件输出的所有数据字段,也可以单击【获取选择的字段】按钮,Kettle工具自动检索并添加CSV文件输入控件输出的所有数据字段。
选择“元数据”选项卡,切换到“元数据”选项卡界面。添加需要改变元数据的字段,将“字段选择”流中的字段进行一致性处理,即单击【获取改变的字段】按钮,获取要改变的字段,并在“Binary to Normal”一列的下拉框中,选择为“是”,使得CSV文件company_a.csv中数据的字段类型与数据表company_b中数据的字段类型一致。
5.配置表输入控件
单击【新建】按钮,配置数据库连接,配置完成后单击【确认】按钮。MySQL数据库连接的配置,如下所示。
在图中的SQL框中编写查询数据表company_b的SQL语句,然后单击【预览】按钮,查看数据表company_b的数据是否成功从MySQL数据库中抽取到表输入流中,具体如图所示。
6.配置排序合并控件
双击“排序合并”控件,进入“排序合并”配置界面,并在字段框中,指定按字段id进行升序排序。
7.配置字段选择2控件
双击“字段选择2”控件,进入“选择/改名值”界面。在“选择和修改”处选择和修改要输出的字段,具体如图所示。
8.配置表输出控件
单击目标表右侧的【浏览】按钮,指定输出目标表,即数据表company(该表需提前创建,这里不作演示);勾选“指定数据库字段”复选框,用于将数据表company的字段与“字段选择2”控件输出流中的字段进行匹配,如图所示。
单击“数据库字段”选项卡;再单击【输入字段映射】按钮,弹出“映射匹配”对话框;依次选中“源字段”选项框的字段和“目标字段”选项框对应的字段,再单击【Add】按钮,将一对映射字段添加至“映射”选项框中。
9.保存并运行,成功后截图如下
10.查看数据表company中的数据
kettle案例——数据转换(多数据源合并)相关推荐
- kettle实例--数据转换-多数据源合并
1.使用Kettle工具,创建一个转换company_merge,并添加CSV文件输入控件.表输入控件.字段选择控件.排序合并控件.增加序列控件.表输出控件以及Hop跳连接线,具体如图所示. 2.配置 ...
- kettle案例4.1.1--抽取文本数据---TSV文件的抽取
kettle案例4.1–抽取文本数据-TSV文件的抽取 在数据清洗中,数据抽取主要是从一个或多个数据源中获取所需的数据.数据抽取的数据源可以是文本数据.Web数据以及数据库数据. 4.1 抽取文本数据 ...
- pandas——数据移位、数据转换、数据合并、数据导出和日期数据的处理,时间序列等
pandas统计分析(下) 本文主要介绍使用pandas进行数据移位.数据转换.数据合并.数据导出和日期数据的处理,时间序列等. 数据移位 数据移位就是在分析数据时,需要移动到上一条,在pandas中 ...
- lawson算法_案例研究:Lawson合并后整合架构的新方法
lawson算法 介绍 在当今的并购时代,解决方案架构师面临的一个普遍问题是以提供一致的用户体验的方式集成产品线. 当Lawson Software,Inc.(Lawson®)与Intentia In ...
- 6.1Kettle多数据源合并
目录 一.数据准备 二.建立转换添加控件 三.配置控件 1."CSV文件输入"控件配置 2."字段选择"控件配置 3."表输入"控件配置 4 ...
- 【Kettle】 数据转换的基本操作
前言 我们在真实的业务场景中经常会遇到一些数据的操作,今天我就来介绍一下kettle这款ETL工具的基本操作 csv - excel 在Kettle中新建转换 拖拽一个CSV输入组件.一个Excel输 ...
- kettle案例——综合案例(构建DVD租赁商店数据仓库)
一.案例概述 (一)案例背景 sakila样本数据库是MySQL官方提供的一个模拟DVD租赁商店管理的数据库.本次就是要对数据库sakila中的数据进行清洗操作,从而构建一个DVD租赁 ...
- AngularJS $q 和 $q.all 单个数据源和多个数据源合并(promise的说明)
这篇文章讲的不错, angular $q 和 promise!! -------------------------------------------------------------- 通过调 ...
- MySQL高级 - 案例 - 系统性能优化 - 数据源配置
实现方式 db.properties jdbc.write.driver=com.mysql.jdbc.Driver jdbc.write.url=jdbc:mysql://192.168.142.1 ...
最新文章
- 为什么Eureka比ZooKeeper更适合做注册中心?
- 查看当前svn账户_SVN-基础教程学习
- 基于Elasticsearch实现搜索推荐
- mysql开启慢查询方法(转)
- 学妹问我,并发问题的根源到底是什么?
- 你想知道的Spring框架配置使用流程和依赖注入!
- 什么是MircoPython?
- 城市平乱 (dijkstra模板题)
- 微技能|几分钟搭建网站内容平台
- 用c语言写贪吃蛇(简易)(适用初学者)(保姆级)
- 案例| 公司信息化建设规划方案
- 数据介绍与描述性分析——以NBA球员薪酬影响因素分析为例
- 杭电数据结构课程实践-重言式判别
- 山石岩读丨一文读懂区块链安全:区块链会带来哪些冲击?
- 爱奇艺2018届C++校招笔试
- 韶关python培训班_《韶》字意思读音、组词解释及笔画数 - 新华字典 - 911查询
- 萝卜书摘显示服务器正在维护,萝卜书摘
- 一加手机可以刷鸿蒙系统吗,朋友想把1+手机安装鸿蒙系统,老板收费350,大家千万别被骗了!...
- 离散数学考前复习:(四)关系
- vmware上ubuntu虚拟机调整分辨率
热门文章
- XXE(XML外部实体注入)漏洞
- 2021年中国二次元游戏行业发展现状分析:销售收入达284.25亿元,同比增长27.43%[图]
- Markdown设置文本样式
- 老板一定要知道的4个财税知识,很多老板还没意识到
- VMware虚拟机启动后出现黑屏解决方案
- spacemacs使用emms播放视频和音乐
- LODOP实现每个页面都有表头(有注释)
- 漫步者蓝牙自动断开_EdiCall通话降噪黑科技-漫步者蓝牙耳机技术有多强?
- CUGBACM2022校新生选拔赛总结
- 『津津乐道播客』#035. 签证和被拒签的那些事儿