数据仓库的数据体系和数据加工链路
数据仓库的数据体系和数据加工链路
1. 数据体系
数据仓库的数据体系主要分为数据采集、数据计算、数据服务和数据应用。
1)数据采集层数据采集体系包括web端日志采集技术方案和app端日志采集技术方案。数据采集分为日志采集和数据库数据同步两部分。对大数据系统而言,数据同步指数据从业务系统同步进入数据仓库和数据从数据仓库同步进入数据服务和数据应用两个方面。
2)数据计算层
数据计算层包括Maxcompute离线计算平台、Streamcompute实时计算平台、Onedata数据整合及管理体系。从数据计算频率的角度,数据仓库可以分为离线数据仓库和实时数据仓库。离线数据仓库主要是指传统的数据仓库的概念数据计算频率主要以天(包括小时、周、月)为单位;
3)数据服务层:当数据已被整合和计算好之后,需要提供给产品和应用进行数据消费。数据服务可以使应用对底层数据存储透明,将海量数据方便高效开放给应用使用。
数据服务层对外提供数据服务主要通过统一的数据服务平台,数据服务平台以数据仓库整合计算好的数据作为数据源,主要提供数据查询服务、复杂数据查询服务和实时数据推送服务。
4)数据应用层
数据应用表现在搜索、推荐、广告、金融等。
2.数据加工链路
数据加工链路:
stg(卸数区)、
odm(操作数据层)、idm(整合明细层)、sdm(共性加工层)。
公共层建设包括操作数据存储层ODM层、整合明细曾IDM层和公共明细层SDM层。
数据仓库的数据体系和数据加工链路相关推荐
- 有别于BATJ,滴滴的中台数据体系建设怎么另辟蹊径?
来自:DBAplus社群 本文根据张茂森老师在[2019 DAMS中国数据智能管理峰会]现场演讲内容整理而成. 讲师介绍 张茂森,滴滴首席工程师,负责滴滴数据平台建设和数据产品商业化工作.致力于企业级 ...
- 数据仓库物理分层_大数据之数据仓库分层
大数据之数据仓库分层 什么是数据分层? 数据分层的好处 一种通用的数据分层设计 举例 各层会用到的计算引擎和存储系统 分层实现 数据分层的一些概念说明 7.大数据相关基础概念 1. 什么是数据分层? ...
- 商圈生产展示数据体系购物圈居住圈工作圈POI商圈
通常,多个商场.购物中心聚集或超大型独立商业体都会形成一定的商业聚集效应,他们集中了区域范围内的商业价值,把握着城市商业的热度风向,呈现出别具风格的商业面貌,形成人气旺盛的购物商圈. 我们在使用智图全 ...
- 数据中台=大数据平台+数据资产管理平台+数据服务平台
数据中台到底是什么?几年过去了,也一直众说纷纭. 笔者认为数据中台不应该是一个单纯的系统或者是一个软件工具,而应该是一套架构.一套数据流转模式. 数据中台需要采集数据作为原材料进行数据加工.数据建模, ...
- 月均数据_月均收入15k的数据产品经理=数据+产品经理?
现在,越来越多的招聘岗位要求产品经理会数据分析.甚至有公司更加过分,直接发出招聘岗位:诚招"数据策略经理". 数据策略经理到底是怎样的存在? 带着好奇,找到了对数据策略经理的岗位职 ...
- 数据产品经理=数据+产品经理?
最近被数据策略经理刷屏了,越来越多的招聘岗位要求产品经理会数据分析.甚至有公司更加过分,直接发出招聘岗位:诚招"数据策略经理". 数据策略经理到底是怎样的存在? 带着好奇,找到了对 ...
- 数据仓库amp;数据指标amp;数据治理体系搭建方法论
数据仓库的基本概念 数据仓库概念 英文名称为Data Warehouse,可简写为DW或DWH.数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support).它 ...
- 大数据理论体系总结--数据仓库管理与全链路数据体系
前言 就这样,大数据领域蓬勃发展了好几年,有很多伙伴执迷于技术,成为了分布式计算与存储的领域专家.也有很多伙伴执迷于数据,成为了行业的数据研发专家.当然还有很多小伙伴,热衷于工具系统开发,成为了数据技 ...
- 大数据体系构建数据仓库
大数据时代,数据仓库向大数据体系升级换代很常见,也是个不错的机会.如果是想系统研究大数据体系的数据仓库设计,个人比较推荐滴滴(前)架构师的视频分享课:http://t.cn/EJ07vua主要是干货比 ...
最新文章
- oracle精度制的数据类型,ORACLE 中NUMBER 类型 低精度转换成高精度
- Rundeck crontab格式
- c++如何对结构体作为形参设置默认值
- AI:PR的数学表示-传统方法PR
- 掌握AI核心技术没有秘籍,能自己创造就是王道
- C语言实实验步骤,C语言教程学习方法攻略
- php cli获取参数,php cli模式下获取参数的方法
- php小程序 b支付回调视频教程,Laravel教程: 3分钟实现小程序微信支付接入(下)——回调发货逻辑...
- 上下求索——基于双向推理的多跳知识库问答技术
- RTD\RTK\PPK\PPP\DGPS\地基增强系统\星基增强系统
- 神通数据库分页查询sql
- 后端工程师的前端之路系列--小程序学习
- ATT加入Verizon与KT的合作圈,共同开发SDN/NFV/5G
- 茄子用水泡过10分钟后变成蓝色
- css3中的属性选择器有哪些,CSS3中属性选择器使用方法详解
- 人工智能之集束搜索Beam Search Algorithm
- 我也来说说“自学IT能走多远” 肖舸
- roadflow 企业微信 工作流程引擎的配置与使用
- R语言 1:2 1:n 倾向性评分匹配法PSM 一个病例多个对照 MatchIt包
- sun java学习_Java学习笔记 -- yaml文件配置