目录

一.XML文件介绍

二.XML文件的主要用途

三.案例介绍

数据准备

四.案例实现

1.建立转换

2.配置控件

3.保存运行转换


一.XML文件介绍

XML是一种可扩展标记语言,也是一种元标记语言,所谓“元标记”就是开发者可根据自己的需要自定义标记。XML是一种很像HTML的标记语言,但是它们也有很大的区别,譬如XML被设计出来主要用于传输和存储数据,其焦点是数据的内容,而HTML被设计出来主要用于显示数据,其焦点是数据的外观;XML中的标签是没有被预定义的,都是由XML文档的创作者发明的,HTML中的标签是预定义的,其文档中使用的标签必须是在HTML标准中定义过的,对于用户自己定义的标签是不可使用的。

二.XML文件的主要用途

XML应用于Web开发的多个方面,但常用于简化数据的存储和共享。XML的主要用途,具体介绍如下: XML可以将数据从HTML中分离、 XML可以简化数据传输 、XML可以简化数据共享、 XML简化平台变更 、XML可以使数据充分利用、 XML可用于存储数据、 XML可以用于创建新的互联网语言。

三.案例介绍

通过Kettle工具抽取XML文件xml_extract.xml中的数据并保存至数据库extract的数据表xml中。

数据准备

现有一个XML文件名为xml_extract.xml ,该文件的内容如图所示。

注意:涉及到数据库操作,提前在kettle里面连接好数据库。

四.案例实现

1.建立转换

2.配置控件

Get date from XML控件:双击控件进入配置界面,点击浏览,找到需要处理的文件

xml_extract.xml,并点击增加,具体如下。

点击内容选项卡,单击【获取XML文档的所有路径】选择循环读取路径,

即/AllRows/Rows/Row。

点击字段选项卡,添加要抽取的字段,具体如下:

点击预览数据:

表输出控件:双击进入表输出控件(前提一定要连接好数据库),选择目标表xml,具体如下:

勾选下方指定数据库字段后,点击下方数据库字段,切换到数据库字段界面后,点击右侧输入字段映射按钮,进行映射匹配,具体如下。

3.保存运行转换

XML文件的数据抽取相关推荐

  1. pymavlink 源码剖析(一)之XML文件的数据解析

    文章目录 1 引言 2 pymavlink 的代码自动生成方法 3 XML 文件的数据解析 3.1 XML 文件预处理 3.2 解析 XML 的数据 3.2.1 依据协议版本初始化一些版本特征变量 3 ...

  2. Java 使用poi导入excel,结合xml文件进行数据验证的例子(增加了jar包)

    ava 使用poi导入excel,结合xml文件进行数据验证的例子(增加了jar包) 假设现在要做一个通用的导入方法: 要求: 1.xml的只定义数据库表中的column字段,字段类型,是否非空等条件 ...

  3. 使用xml文件存储数据使用xpath查询

    使用xml存储数据也是一种方式,使用起来更加灵活.如下面的xml文件 <?xml version="1.0" encoding="UTF-8"?> ...

  4. BI神器Power Query(9)-- PQ从XML文件导入数据

    XML(可扩展标记语言,其全称为Extensible Markup Language),是一种标记语言.XML是由SGML(The Standard Generalized Markup Langua ...

  5. Android解析xml文件获取数据练习

    前几天单词app中,已经可以显示单词了,对比有道词典的单词表,主要是有单词备注的功能,可以进行联想记忆,而且程序占用空间小,没有太多的通知信息. 以前使用有道词典的单词保存了一些单词,有道里的单词可以 ...

  6. 根据定制的 XML 文件进行随机抽取节

    此类库中的两个类可以达成这一的一些效果:每次打开网页展现不同的标语.问候语,根据语录内容随机出题,随机显示新闻等等.当然XML格式的定制或者根据不同的XML文件适当修改类字段还是必要的. using ...

  7. JSON 文件的数据抽取

    1.打开kettle文件,创建转换. 打开Kettle创建转换json_extract,并且添加JSON input控件,"表输出"控件以及HOP连接线. 2.配置JSON inp ...

  8. delphi基于html页面和xml实现表单填写,如何从xml文件读取数据,并以delphi语言显示在文本框中...

    看看Delphi自己的TXMLDocument组件,例如: procedure TForm1.FormCreate(Sender: TObject); var Vehicle: IXMLNode; b ...

  9. JAVA 通讯录 —— 实现对XML文件数据的增删改查

    心血来潮,带着好奇写了人生中第一篇博客,哈哈哈哈 ~ 嗝 ~ ~   这篇文章主要就是分享自己做的一次项目作业,一是为了分享,二是用另外一种方式保存自己的代码 嘻嘻嘻 ~.还是个编程萌新,所以有啥写的 ...

最新文章

  1. ISME:中国林科院亚林所袁志林组揭示盐碱地根系深色有隔内生真菌种群基因岛的正向选择机制...
  2. JSON与JavaScript的转换
  3. 哪些书你看之前以为很枯燥,结果一看却欲罢不能的?
  4. 网络编程懒人入门(二):快速理解网络通信协议(下篇)
  5. [python作业AI毕业设计博客]比Selenium IDE更好用的录制工具: Katalon Recorder
  6. Java的clone方法
  7. Java基础-控制流程-3. 确定循环
  8. mid制作乐谱_乐谱编辑(在线简谱制作软件)
  9. 《精通linux设备驱动程序开发》——USB
  10. 示例项目:简单的六足步行者
  11. xp的ie显示无服务器,WinXP系统IE无法打开站点怎么办?
  12. 高效能人士的七个习惯 读书笔记
  13. 【Visual C++】游戏开发笔记四十七 浅墨DirectX教程十五 翱翔于三维世界 摄像机的实现
  14. 第56章 SQL UCASE() 函数教程
  15. 极客大学算法训练营笔记
  16. 使用 Ghidra 分析 phpStudy 后门
  17. 快手市值万亿、炒股如同炒币,资本市场正在币圈化?
  18. 文件打开方式更改为原本的计算机程序
  19. VB.NET 计时器 时分秒
  20. H5+搭建移动端应用

热门文章

  1. 功能位置KKS编码批量创建
  2. AbpZero之企业微信---登录(拓展第三方auth授权登录)---第二步:开始逐步实现企业微信登录...
  3. USRP B210 软件定义的无线网络(SDR)支撑设备
  4. 知道大学生心理健康2023春见面课1,2答案
  5. 在正方体的某一个面上随机一个点——最白话,手把手教你做系列。
  6. scrapy爬取昆工信自院导师信息
  7. 基因组变异检测SNPcalling(GATK)
  8. 解决Win10出现“你不能访问此共享文件夹,因为你组织的安全策略阻止未经身份验证的来宾访问” - 开启局域网文件共享
  9. 用Python多线程实现低速处理器和高帧率摄像头的并行运行
  10. 联想rd650管理口地址_MegaRAID Storage Manager RAID管理工具基本操作