如何使用数据工厂分析业务数据

目录

数据工厂 1

背景需求 3

解决方案 3

产品介绍 3

方案验证 3

前期准备 3

数据工厂部署流程 4

收益 11

常见问题 11

背景需求

某个房企业务公司收集云中的业务客户所生成的万兆字节的业务客户日志。
该公司的目的是通过分析这些日志,了解客户偏好、人口统计信息和使用行为。
该公司的另一个目的是确定向上销售和交叉销售机会、开发极具吸引力的新功能、促进企业发展,并为其客户提供更好的体验。

为了分析这些日志,该公司需要使用参考数据,例如位于本地数据存储中的客户信息、业务客户信息和市场营销活动信息。
公司想要利用本地数据存储中的这些数据,将其与云数据存储中具有的其他日志数据结合在一起。

解决方案

Azure 数据工厂是解决此类数据方案的平台。 它是基于云的 ETL
和数据集成服务,可让创建数据驱动型工作流用于大规模协调数据移动和转换数据。
可以使用 Azure
数据工厂创建和计划数据驱动型工作流(称为管道),以便从不同的数据存储引入数据。

产品介绍

Azure 数据工厂是 Azure 的云 ETL 服务,用于横向扩展无服务器数据集成和数据转换。
它提供了无代码的 UI,以用于直观创作和集中式监视与管理。 还可以将现有 SSIS
包直接迁移到 Azure,并在 ADF 中运行它们(二者完全兼容)。 SSIS Integration
Runtime 提供完全托管的服务,因此无需担心基础结构管理。

方案验证

前期准备

  1. 创建SSISDB数据库(可以使用SQL数据库,托管实例,Blob存储等)用于存储数据

    关于SQL数据库,托管实例在SSIS IR的区别可以访问链接:

    https://docs.microsoft.com/zh-cn/azure/data-factory/create-azure-ssis-integration-runtime#comparison-of-sql-database-and-sql-managed-instance

  2. 确认你的数据库服务器还没有 SSISDB 实例。 预配 Azure-SSIS IR
    时不支持使用现有的 SSISDB 实例。

  3. 创建数据工厂

数据工厂部署流程

  1. 进入Azure数据工厂管理门户:adf.azure.cn

  2. 创建链接服务,将本地数据库链接到数据工厂。

  3. 创建Azure-SSIS IR

  4. 配置集成运行时

    对于“节点大小”,请选择集成运行时群集中的节点大小。 仅显示支持的节点大小。
    如果需要运行多个计算密集型或内存密集型包,请选择较大的节点大小(纵向扩展)。

    对于“节点编号”,请选择集成运行时群集中的节点数。 仅显示支持的节点数。
    如果需要并行运行多个包,请选择包含许多节点的大型群集(横向扩展)

···选择SSISDB存储SSIS包文件

  1. 创建管道

拖拽“执行SSIS包”

选择刚创建好的SSIS IR 及 SSISDB信息

  1. 创建触发器

    根据需求,设置计划执行时间

  2. 监测SSIS IR

    可以点击SSIS IR名称,查看详细信息

收益

通过使用数据工厂优化其用户配置文件分析并将其与业务目标匹配,房企公司可快速部署上线收集使用模式并分析其营销活动的效果。

常见问题

  1. 问题描述
    无法启动集成运行时,错误消息:因为出现自定义安装程序故障

    解决方案
    Azure-SSIS IR 需要配置MySQL ODBC,安装驱动需要与集成运行时包同一版本,如32位、64位。

  2. 问题描述
    Azure-SSIS IR加入虚拟网络后无法启动

    解决方案
    如果Azure SQL数据库使用专用终结点,需要对专用终结点配置DNS解析

  3. 问题描述
    执行SSIS包失败,无法连接本地数据源

    解决方案:
    排查本地防火墙设置,如本地数据库有防火墙,需要对Azure SQL所在虚拟网络配置白名单。

  4. 问题描述:
    执行集成运行时包报错,错误代码:Failed to acquire connection(用户有权限)
    解决方案:
    创建运行包时,不支持EncryptAllWithUserKey保护级别,请选择EncryptSensitiveWithUserKey保护级别。

如何使用数据工厂分析业务数据相关推荐

  1. 软件测试实验--数据工厂DataFactory+MySQL数据构造

    数据工厂---DataFactory+MySQL数据构造 显示成功,但测出来的是啥...

  2. 数据可视化分析票房数据报告_票房收入分析和可视化

    数据可视化分析票房数据报告 Welcome back to my 100 Days of Data Science Challenge Journey. On day 4 and 5, I work ...

  3. 探索数据可视化,业务数据是核心

    数据作为新生产要素的重要性正在被越来越多的企业认同,数据可视化就是其中之一.不少的企业做了尝试,归根结底放到整个信息架构上来看,业务数据才是核心. 为此,这里分享南华糖业在信息化方面的实践,原文是洋浦 ...

  4. 数据分析之数据质量分析和数据特征分析

    1.数据质量分析 数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是数据挖掘分析结论有效性和准确性的基础,没有可信的数据,数据挖掘构建的模型将是空中楼阁. 数据质量分析的主要任务 ...

  5. UCI数据集数据的分析 ——葡萄酒数据

    1.前言 葡萄酒是一种成分复杂的酒精饮料,不同产地.年份和品种的葡萄酒成分不同,这也是导致质量差异过大的重要因素.至今,质量评价主要还是依靠专家的感官.味道是最难理解的一种感官,因此用味蕾评价葡萄酒也 ...

  6. 数据工厂---DataFactory+MySQL数据构造

    介绍: DataFactory(数据工厂)是一种快速生产测试数据的可视化工具,是一种强大的数据生成器,该工具支持DB2.Oracle.Sybase.SQL Server数据库,支持ODBC连接方式,且 ...

  7. 【数据相关性分析】数据相关性分析理论基础

    数据库开发草案中有这样一个要求: 学生成绩情况与学生个人发展之间的关系分析, 以此为例.思考如何进行相关性分析, 相关性分析的方法有哪些?说出你的想法 相关分析的方法很多,初级的方法可以快速发现数据之 ...

  8. python数据包分析_packet_analysis: 数据包分析工具

    功能 读取pcap包,打印详细的icmp/tcp/udp协议 读取pcap包或网络接口 1. 打印详细的tcp会话/udp报文数据,目前支持mysql/pgsql/smtp/ftp/redis/mon ...

  9. Wireshark数据包分析之数据包信息解读

    *此篇博客仅作为个人笔记和学习参考 数据包概况 Frame:物理层的数据帧概况; EthernetⅡ:数据链路层以太网帧头部信息; Internet Protocol Version 4:互联网层IP ...

最新文章

  1. 利用 Python 打造一个语音合成系统
  2. native react 常用指令_React-Native 常用命令
  3. 淘宝面试:说一下 ThreadLocal 的原理?网友:现在面试不看源码不行啊~
  4. 每天最少编码1000行
  5. FileNotFoundError: Could not find module 'xxx.dll'. Try using the full path with constructor syntax.
  6. flask-01-http通信的回顾
  7. 计算机控制系统笔记,计算机控制系统复习笔记.doc
  8. vscode右键没有open in browser
  9. 你不知道的javascript_为什么前端要学JavaScript?JS都有哪些逆天的功能?
  10. 在TortoiseSVN使用clean up
  11. C调用系统命令ping崩溃日志
  12. [C++] 关于delete和delete[]
  13. dubbo+zookeeper下生产者和消费者配置(基于springboot开发)
  14. python微博爬虫程序_基于Python的新浪微博爬虫程序设计与研究
  15. UE4中的Spline用法
  16. Python网络爬虫开发实战,ADSL 拨号代理
  17. 刘冲 擦干你的泪水 试听,刘冲 擦干你的泪水歌词
  18. 农村饮用水项目微信支付完整代码
  19. JavaWebDay7
  20. 分布式ssh_使用SSH的分布式管理

热门文章

  1. 骨传导耳机有外音吗?骨传导耳机的优点
  2. ubuntu-jupyter环境搭建
  3. C++ 编写一个函数,把字符串中的数字字符、英文字母字符和其它字符分开。
  4. FFplay源码分析-avformat_open_input
  5. 【面经】2022社招软件测试面试(3)-腾讯CSIG云网络测试开发
  6. 企业用什么留住人才???
  7. 炫界 (302) -(查动简)_原302张鸿飞主任在哪出诊呢?一位乙肝“准妈妈”的困惑...
  8. 在vs code中运行C语言
  9. 数字IC-1.1 CMOS管原理(集成电路)
  10. java-net-php-python-jspm学生服务系统计算机毕业设计程序