数据仓库解决什么问题

文章目录

  • 数据仓库解决什么问题
    • 前言
    • 问题
    • 操作型数据库和信息型数据库
    • 数据仓库的作用
    • 数据仓库的用户
    • 小结
    • 公众号
    • 参考

前言

在准备学习一项新的技术时,我觉得首先应该先整理清楚:

  • 这项技术是干什么用的?
  • 解决什么问题?
  • 在什么场景下去使用?
  • 给谁用的?
  • 为什么要用它?

其核心其实都是一个问题,这项技术或者产品它的定位是什么?

做数据仓库这块也有一两年了,回想起来,刚开始确实想法也是挺简单的:工作要用,学起来用就得了,管那么多干嘛!

现在想来觉得确实需要回到起点,抱着这一个问题,从《Building the Data Warehouse Fourth Edition》 这本书中寻找一下答案,William H. Inmon 凭借这本书获得“数据仓库之父”的殊荣。

问题

面对当今竞争日趋激烈与瞬息万变的市场,各级管理人员迫切需要根据企业的现状和历史数据做出判断和决策。

因此,各级管理人员希望能够从企业信息系统中获取有效的、一致的决策支持信息,及时准确地把握市场变化的脉博,做出正确有效的判断和抉择。

也就是说,数据处理的重点应该从传统的业务处理扩展到在线分析处理,并从中得到面向各种主题的统计信息和决策支持信息。

随着企业事务处理系统的运行和建立,数据量越来越大,企业数据源越来越多。这种需求就比以往任何时候都更加迫切,也更加难于实现。

数据仓库技术就是针对上述问题而产生的一种技术解决方案,它是基于大规模数据库的决策支持系统环境的核心。

操作型数据库和信息型数据库

早期的大多数数据库系统主要集中于操作型的日常事务处理。

近年来,出现了一种更高级的数据库观念,即一种数据库服务于操作型需求,而另一种数据库服务于信息型或分析型需求

将操作型数据库和信息型数据库分离开,是出于以下原因

  • 服务于操作型需求的数据在物理上不同于服务于信息型或分析型需求的数据。
  • 支持操作型处理的技术从根本上不同于支持信息型或分析型需求的技术。
  • 操作型数据的用户群体不同于信息型或分析型数据所支持的用户群体。
  • 操作型环境的处理特点与信息型环境的处理特点从根本上是不同的。

由于这些原因(以及很多其他很多原因),当今建立系统的方法是将操作型处理及其数据与信息型或分析型处理及其数据分离开来。

什么是分析型、信息型处理?

  • 这种处理服务于决策支持过程中的管理需求,一般称为 DSS(Decision Support System 决策支持系统) 处理,要在大量的数据中分析处理探索趋势

操作型处理 VS 分析型处理:

  • 访问数据量:不同于只查找 1~2 条数据记录(如操作型处理),当 DSS 分析人员进行分析型处理时,需要访问大量的数据记录。
  • 数据修改频率:DSS 分析人员很少修改数据。而在操作型系统中,数据在个体记录层次上经常修改。在分析型处理中,需要经常访问记录,收集来的记录内容用于分析的需要,但很少或不需要对单个的记录进行更改。
  • 响应时间:相对于传统的操作型处理,在分析型处理中,响应时间的要求大大放宽。分析型处理的响应时间可以是30分钟到24小时。这样的响应时间标准对于操作型处理而言是一个巨大的灾难。
  • 用户规模:服务于分析型用户群体的网络比服务于操作型用户群体的网络的规模要小得多。通常情况下,分析型网络的用户比操作型网络的用户少很多。
  • 技术需求:与应用于分析型环境的技术不同,操作型环境中的技术必须将技术本身与数据和事务锁定、数据争用、死锁等因素结合起来考虑。

这样,在操作型环境和分析型环境之间存在许多重大的区别。

数据仓库的作用

由于有了数据仓库,获取信息的代价在急剧降低。

对于混乱的遗留系统环境,管理人员最终有了一种可行的解决方案。

企业第一次拥有了可用的企业范围内的历史数据“存储方式”。整个企业的数据集成真正成为可能,这在多数情况下还是第一次。

许多企业正在学习如何从数据获取信息,以获得竞争优势。简而言之,数据仓库技术极大地冲破了技术的束缚。

或许数据仓库最吸引人的东西是数据仓库构成了许多其他各种形式处理的基础。可以改造和重复使用数据仓库中的各种粒度的数据。如果存在一个关于数据仓库永恒而深刻的真理,那就是:数据仓库为许多其他形式的信息处理提供了理想的基础。

这个基础如此重要,有许多原因,比如:

  • 真理只有单个版本。
  • 如果需要,可以重新调整数据。
  • 可以为新的、未知的应用随时提供数据。

最后,数据仓库技术降低了企业获取信息的代价。有了数据仓库,获取数据将不再昂贵,数据访问也将更加快捷。

数据仓库的用户

数据仓库的用户也称为 DSS 分析员,他首先是个商务人员,其次才是技术人员。

DSS 分析员的主要工作是定义和发现在企业决策中使用的信息

了解 DSS 分析员的想法及他们对数据仓库使用的理解是很重要的。

DSS 分析员有一种想法即“给我看一下我想要的东西,然后我才能告诉你我真正想要什么。”换句话说, DSS 分析员在发现模式下工作。只有在看到报表屏幕上的数据时,他们才开始探讨是否有必要进行 DSS 分析。DSS 分析员常说:“哈,现在我知道了什么是可行的,我能告诉你,我真正想要什么东西了。但如果我不知道这些,我根本无法明确地告诉你我要什么。”

小结

企业的经营决策不是由企业管理人员拍脑袋决定的,一般都要基于企业自身的经营状况、外部市场环境、竞争对象等因素综合评估,再制定相应的战略、计划等经营决策的;也就是说企业的经营决策是需要很多的数据来支撑的。

现在我们再来回顾一下之前的问题:

数据仓库有什么用?

  • 数据仓库技术降低了企业获取信息的代价。
  • 数据仓库为许多其他形式的信息处理提供了理想的基础。

数据仓库解决什么问题?

  • 企业管理人员迫切需要根据企业的现状和历史数据做出判断和决策。
  • 各级管理人员希望能够从企业信息系统中获取有效的、一致的决策支持信息,及时准确地把握市场变化的脉博,做出正确有效的判断和抉择。
  • 数据处理的重点扩展到在线分析处理,并从中得到面向各种主题的统计信息和决策支持信息。
  • 数据仓库技术就是针对上述问题而产生的一种技术解决方案,它是基于大规模数据库的决策支持系统环境的核心。

数据仓库在什么场景下去使用?

  • 在分析型、信息型环境下 进行 信息型或分析型处理;
  • 信息型或分析型处理 :服务于决策支持过程中的管理需求,也称 DSS(Decision Support System 决策支持系统) 处理,要在大量的数据中分析处理探索趋势。

数据仓库给谁用?

  • DSS 分析人员,主要工作是定义和发现在企业决策中使用的信息。

为什么要用它(数据仓库)?

  • 对于混乱的遗留系统环境,管理人员最终有了一种可行的解决方案。
  • 企业第一次拥有了可用的企业范围内的历史数据“存储方式”。整个企业的数据集成真正成为可能,这在多数情况下还是第一次。
  • 许多企业正在学习如何从数据获取信息,以获得竞争优势。简而言之,数据仓库技术极大地冲破了技术的束缚。

公众号

参考

《Building the Data Warehouse Fourth Edition》 《数据仓库 第四版》 William H. Inmon

1.数据仓库到底是解决什么问题的?相关推荐

  1. 数据中台到底是解决什么问题的

    数据中台到底是解决什么问题的 文章目录 数据中台到底是解决什么问题的 概述 让数据用起来 业务数据化,数据业务化 企业发展与信息化建设中的痛点 企业数字化转型 数据中台的出现 数据资产管理 数据中台 ...

  2. 深度详解ResNet到底在解决一个什么问题?

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 https://www.zhihu.com/question/64 ...

  3. 玩具租赁到底在解决用户什么痛点?

    最近在给孩子买玩具,了解到了玩具租赁模式,打算尝试一下,可能和自己的职业习惯有关,我就先在36kr,百家和app市场上搜索了一番,看了一些玩具租赁产品的报道,庆幸共享经济范围越来越广泛了,以后可以越来 ...

  4. ResNet详解:ResNet到底在解决什么问题?

    原作者开源代码:https://github.com/KaimingHe/deep-residual-networks 论文:https://arxiv.org/pdf/1512.03385.pdf ...

  5. 让作者告诉你DirectX修复工具到底能解决什么问题

    DirectX修复工具从发布至今已经过去整整一年的时间了,通过大家的反馈及交流我发现有一部分人并不清楚DirectX修复工具到底可以解决什么问题.虽说网上有众多网友的解释,但毕竟不是很全面,都只介绍了 ...

  6. 中台是什么,到底要解决什么问题?

    一.背景 中台这个概念早期是由美军的作战体系演化而来的,技术上所说的"中台"主要是指学习这种高效.灵活和强大的指挥作战体系.电商经过十几年的发展,组织已经庞大而复杂,业务不断细化拆 ...

  7. 数据仓库:如何解决ODS数据零点漂移问题

    本篇文章讲解的是从业务库同步数据至数仓导致的零点漂移,查看flume+kafka同步数据导致的零点漂移参考该文章:业务数据采集_零点漂移处理方法(Flume+Kafka+HDFS) 一.数据零点漂移概 ...

  8. 学习这么多算法到底在解决哪些问题?深度学习之外,我们要选择谁?

    CSDN 出品的<2018-2019 中国人工智能产业路线图>V2.0 版即将重磅面世! V1.0 版发布以来,我们有幸得到了诸多读者朋友及行业专家的鼎力支持,在此表示由衷感谢.此次 V2 ...

  9. 第一百一十三期:去伪存真,区块链应用到底能解决什么实际问题?

    区块链技术仍然在发展初期,实践应用也停留在试水阶段.就金融等领域而言,区块链究竟意味着什么?今后实践应用的前景何在?在Libra的倒逼下,全球央行数字货币又将如何发展? 作者:第一财经 两周前,区块链 ...

最新文章

  1. Linux--Ubuntu12.04下安装JDK
  2. linux命令后面常见的/dev/null 和 21 的含义
  3. poj 1077 eight
  4. 企业 MySQL 优化实施方案
  5. (1.3)HarmonyOS鸿蒙启动程序运行流程
  6. php数据库创建文件失败怎么回事,安装zblogPHP提示“创建c_option.php失败”解决方法...
  7. mysql 排序1.1.1_mysql中字符串1.1/1.2/1.2.2/1.2.5排序问题
  8. dedeCMS 文件路径、全局替换(待续···)
  9. (一)phoneGap之环境搭建教程及其example分析
  10. 八皇后问题的非递归解法
  11. python入门--字典的特点
  12. 中海达数据怎么转rinex_Ashtech格式转换RINEX
  13. python DataFrame获取行数、列数、索引及第几行第几列的值
  14. 用友2003年度NC_SCM项目经理/高级顾问认证考试试题及答案
  15. java 定时任务表达式(网络总结)
  16. 语音提示倒计时小工具
  17. 【每日随笔】飞书云文档使用 ( 注册飞书云文档账号 | 创建云文档 | 分享云文档 )
  18. java 计算农历_java计算农历日期
  19. 老男孩MySqI DBA周末班(三期)
  20. python用户管理系统

热门文章

  1. 音量调整工具有哪些?我推荐下面几款音量调整软件给你
  2. Ubuntu20.04服务器重装系统后从头进行环境配置
  3. 如何在面试中找到优秀的程序员(转载)
  4. MobileWeb适配(二)
  5. CentOS7 安装code::Blocks
  6. 如何使用 rmdir 命令删除目录?
  7. Node.js 服务器端的JavaScript脚本新秀:Node.js
  8. android逆向基础教程三
  9. 离散傅里叶变换(DFT)与三角插值法
  10. 【Electron-vue】构建桌面应用(33)- spawn EACCESS