一、文章概述

数据数据建设的生命周期中,有必要做出一套关于建表、字段、总线矩阵的规范。数据表和和字段的总原则是采用英文缩写加下划线的方式来命名。

二、中台表命名规范

2.1 数据主题域

数据主题域主要是为了方便我们主题的划分,同时有必要对主题进行统一维护、命名、编码等。

在数据主题域中定义业务过程,需要系统化维护,保证同一业务范围的业务过程在数据中台中只创建一次。

数据域

缩写

业务过程

2.2 数据表类型

表类型

中文名

英文名

英文缩写

事实表

事务性事实表

transaction

trans

事实表

周期快照事实表

periodic

perid

事实表

累计快照事实表

accumulating

accum

维度表

审计类型维度表

audit

audit

维度表

分析类维度表

analyse

anly

2.3 应用说明

采用简单的英文单词简写描述表的用途

2.4 更新频率

MM/H/D/W/M 【分钟/小时/天/周/月】

2.5 更新方式

I/A 【增量/全量】

2.6 事实表命名规范

1 数据明细层(DWD)事实表命名规范

dwd_{主题域}_{应用说明}_[事实表类型_]_{更新频率+更新方式}

2 一致性数据汇总层(DWS)事实表命名规范

dws_{主题域}_{应用名称}_[事实表类型_]_{更新频率+更新方式}

3 个性化数据汇总层(AWS)事实表命名规范

ads_{主题域}_{应用名称}_{业务方}_[事实表类型_]_{更新频率+更新方式}

2.7 维度表命名规范

1 公共一致性维度表

dim_pub_{维度定义}_{维度层级数}_{更新频率+更新方式}

2 应用型维度表

dim_{业务方编码}_{维度定义}_{维度层级数}_{更新频率+更新方式}

3 审计维度表

dim_{audit}_{维度定义}_{维度层级数}_{更新频率+更新方式}

2.8 字段命名规范

字段前缀(1)

行为名称

行为英文名称(2)

英文缩写(3)

样例

修饰语_

维度键

dimension key

key

样例:(1)_(2)_key,必须保证key后缀

系统统一编码识别符

system

sys

(1)_(2)_sys

业务修饰语_统计对象_

数量

count

cnt

(1)_(2)_cnt

次数

times

times

金额

amount

amt

PV

page view

pv

UV

unique visitor

uv

业务修饰语_

成功

success

succ

完成

finish

finish

支付

pay

pay

address

addr

订单

order

ord

渠道

channel

chl

日期

date

date

时间

time

time

系统自动编码

identify

id

操作流水号

number

no

业务编码

code

code

名称

name

name

数据仓库总线矩阵规范

维度总线矩阵

维度建模的数据总线矩阵,提炼出公共一致性维度。无论是主事实表,还是隶属于主事实表的子事实表都统一在总线矩阵中体现出来,这样我们能够准确提炼真正的公共一致性维度。

业务过程

原子粒度

度量

公共维度

日期

房源

地域

店面

经纪人

其他维度

提交支付订单

每个购买订单一行

每个购买订单数量和价格

商品库存

清单每项一行

每个库存的数量

店面库存

清单每项一行

每个店面房屋的数量

业务过程

机会/利益型矩阵

可以利用同一个业务过程勾画出不同的矩阵,但需要用维度列替换业务功能。例如,销售计划、市场、店面操作以及金融等。按照不同的功能的需要,包含不同的矩阵元素表明哪些业务过程对哪些业务功能有需求。在以过程为中心的行被确定为项目时,也可以用于识别需要哪些组参与更详细的需求、维度建模和BI的应用需求。

业务过程

利益相关方

销售计划

市场

店面操作

后期保障

财务

其他维度

提交支付订单

商品库存

店面库存

业务过程

维度事实表样例

创建事实表和维度表要遵循一定的规范,维度表通常是一个大宽表,包括尽可能多的维度描述信息,维度表和事实表的key值,都需要添加_key的后缀,这样方便查找维度信息。事实表和微博表都需要描述清楚自己的来源信息。具体可以参考下面的样例。

需求优先级

不可能一次迭代就能完成所有需求,因此有必要和团队的负责人、业务方协商优先级。可以考虑按照“潜在的业务价值”和“需求可行性”两个方面综合考虑优先级。

维度表创建规范_【数据仓库篇】数据中台建设规范相关推荐

  1. 【数据仓库】数据仓库建模方法及企业数据中台建设

    一.数据仓库建模方法 每个行业有自己的模型,但是 不同行业的数据模型,在数据建模的方法上,却都有着共通的基本特点. 什么是数据模型? 数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体 ...

  2. 数据中台建设(规划篇)

    作者介绍 @蒙佳恩 某大厂数据中台产品经理: 专注于数据产品和数据管理,并持续学习中: "数据人创作者联盟"成员. 一 什么是数据中台 1.1 数据中台的定义 数据中台不是数据平台 ...

  3. 大数据_数据中台建设五步走

    目录 概要 第一步:数据资源的盘点与规划:启动过程组 第二步:数据应用规划与设计:规划过程组 第三步:数据资产建设:规划过程组.执行过程组 第四步:数据应用的详细设计与实现:执行过程组.监控过程组.不 ...

  4. 惟客数据解读:数据湖、数据仓库、数据中台究竟区别在哪儿?

    数字化转型浪潮卷起各种新老概念满天飞,数据湖.数据仓库.数据中台轮番在朋友圈刷屏,有人说"数据中台算个啥,数据湖才是趋势",有人说"再见了数据湖.数据仓库,数据中台已成气 ...

  5. 浅谈数据库,数据仓库,数据中台

    数据库,数据仓库,数据中台这些关于数据的概念性的东西,对于初学者来讲,非常容易混淆. 在使用计算机的过程中,我们经常会遇见需要进行数据存储的场景,比如,通讯录数据,进销存数据.在数据量不是特别大的时候 ...

  6. 大数据_什么是数据中台?

    目录 一.数据中台的定义 二.数据中台必备的是个核心能力 三.数据中台VS业务中台 四.数据中台VS数据仓库 五.数据中台VS现有信息架构 六.数据中台的业务价值与技术价值 一.数据中台的定义 数据中 ...

  7. 数据仓库、数据中台、数据湖都是什么?

    相信很多人都在最近的招聘市场上看到过招聘要求里提到了数据仓库.数据中台,甚至还有数据湖,这些层出不穷的概念让人困扰.今天我就来跟大家讲一讲数据仓库.数据中台以及数据湖的概念及区别. 数据库 在了解数据 ...

  8. 爱奇艺数据中台负责人马金韬:数据中台建设与应用

    中生代技术 链接技术大咖,分享技术干货 接力技术,链接价值 本文根据马金韬老师在[deeplus直播第233期]线上分享演讲内容整理而成.首发于公众号dbaplus,经授权转载(文末有获取本期PPT& ...

  9. 爱奇艺数据中台建设组合拳:日志投递、统一数仓、大数据平台

    本文根据马金韬老师在[deeplus直播第233期]线上分享演讲内容整理而成.首发于DBAplus社群,经授权转载(文末有获取本期PPT&回放的方式,不要错过) 马金韬 爱奇艺数据中台负责人 ...

最新文章

  1. 有没有可以翻译c语言程序的软件下载,程序员秒懂!分享一款很优雅的翻译软件...
  2. 创业公司用到的技术列表
  3. [译] 这可能是 2018 年最好的一篇 PHP 性能测评(包含 5.6 到 7.2,以及 HHVM)
  4. 0-1背包问题详解(DP分支限界回溯三种方法)
  5. 没有php_pdo.dll,php_pdo.dll,下载,简介,描述,修复,等相关问题一站搞定_DLL之家
  6. Struts2之文件上传
  7. idea 配置maven一直停留在loading archetype list
  8. java I O类大全_Java I/O —— File类
  9. 由alpha matte生成trimap
  10. linux文件共享加锁,Linux共享数据管理——文件锁定
  11. android 监听短信并发送到服务器
  12. OpenHarmony 简介:使用鸿蒙操作系统,开发者能做的是啥呢,学习NodJS,可以开发应用了。后续慢慢学习,赶紧去加星星。
  13. 每日一题#10-22 Ransomware
  14. 【题解】天梯赛练习集 L1-059 敲笨钟
  15. 中兴校招软件测试面试题,中兴软创笔试题_中兴软创软件测试笔试题
  16. 30+项目经理,少奋斗5年的职业规划路线
  17. SQL 中判断条件的先后顺序,会引起索引失效么?
  18. PHP,POST页面无法传值跳转,请大神帮助。
  19. 台大机器学习基石上_lesson 2
  20. AI把你打造成时尚界宠儿

热门文章

  1. Hadoop学习笔记之修改主机名IP地址
  2. 项目实战——旅行社导航页
  3. 语不惊人死不休(59)因果
  4. FPGA的设计艺术(10)HDL是软件还是硬件?
  5. 如何用 Excel 做出专业的甘特图?详细来了!
  6. 沐川中学2021级高考成绩查询,四川沐川中学2021年排名
  7. 王道计算机考研机试指南自用刷题笔记-自用6
  8. 解决VirtualBox分辨率太小及VBoxGuestAdditions.iso下载地址
  9. 重庆大学c语言期末考试试卷,重庆大学网院2018年C语言程序设计 ( 第3次 )答案参考...
  10. 马里奥游戏HTML的源码