前言

指标,只要做业务或者做数据,没有不知道的。但是,近年来,随着数据中台推出,数据标签、用户画像等时髦热词涌现,突然间,人们不太讲指标了,仿佛一切又都变成只要有标签就万事搞定。

实际上,标签和指标是两码事,标签和指标的作用场景有重合,但是更有区别。举个例子,我们常说“贴标签”,生动的说明了一个场景,就是给一个事物或者对象进行标记,说明我们对它的分类,用于后面的各种筛选。指标不同,指标不是“贴”上去的,指标是数字化的反映业务过程的发生、发展情况。对于被考核一方而言,盯着指标“做指标”;对于管理者而言,盯着指标“控指标”,这个和标签管理不是一个概念。

同时,我们也注意到,虽然从企业第一天就有指标,但是对指标的管理却并不一定体系化、科学化。很简单的道理就是,能否在一个地方看到全部的数据指标?能否有一套管理手段和系统来保证指标之间不要出现重叠、冲突、矛盾?能否快速的了解一个指标的口径和编制者?很遗憾,过去和相当程度上,我们可能只是知道“报表”。在一些管理过程中,我们可能也只是知道一些“查询功能”。我们并不能很快的回答上面的问题。

因此,指标体系的建设就非常必要,某种意义上讲,指标体系的建设对经营管理的数字化是基础性的。既然是体系,就必须有自己的理论基础和管理机制。就指标体系的理论基础而言,并不复杂。常规的总结就是:原子指标+派生指标+组合指标。就指标体系的管理机制而言,无非是几个过程的管理:需求阶段的管理、开发过程的管理、使用过程的管理。

在推进数据治理的过程中,尤其是数据梳理清理工作和数据中台建设工作的实施,我们也日益关注这个方面的工作。以下是我们的一些思考和实践。

一 背景

在没有数据指标体系之前,往往由业务人员作为指标的提出方和使用方,同时成为指标的管理方。但由于业务不同条线之间的不互通和对指标管理缺乏整体概念,往往导致以下各类问题层出不穷。

在数字化转型的背景下,需要不断缩短数据供应和数据应用之间的距离,让每一个业务人员都能自主使用数据。而指标体系正是连接基础数据和数据应用之间的桥梁,它可以随着业务扩展而同步,随着应用建设逐步完善,统一数据业务口径,不但提升业务数据服务准确性,而且从被动服务变成主动服务,实现数出同源、人人用数的目标。

二 指标与标签的区别

标签是根据业务场景需求,通过对目标对象(含静态、动态特性)运用抽象、归纳、推理等算法得到的高度精炼的特征标识,用于差异化管理和决策。由此可见标签是体现目标对象特征的标识,往往集中在客户、产品等具有营销价值的目标对象上,且不局限于描述数量特征,还包括属性特征等。而指标描述的是目标对象的数量特征,是能表征企业某一业务活动中业务状况的数值指示器,对可描述目标对象范围更广。

三 建立指标体系的流程

1.盘点现有指标

现有指标是企业数据资产的重要组成部分,是企业级指标体系建设过程中必须要考虑的部分。目前指标分散在各个系统中,用户很难知道这些指标的含义、口径、应用场景,这样的指标很难满足用户数据分析的要求。在盘点的过程中,需要明确指标的名称、业务含义、业务口径、应用场景、主管部门、创建日期、最近更新日期、来源、权限等信息。考虑大部分指标存在于分析管理类系统中,因此可以考虑先从这类系统入手。盘点结果需要及时导入数据治理平台,使用指标应用工具,实现“可搜索、可分析”。当指标应用工具可以满足业务需求的场景下,完全不需要总行开发,直接在指标应用工具中实现需求。

2.建立指标标准

指标是衡量目标总体特征的统计数值,一般由指标名称和指标数值两部分组成。指标名称及其含义体现了指标在质的规定性和量的规定性两个方面的特点;指标数值反映了指标在具体时间、地域、条件下的数量表现。

根据指标计算逻辑,可以将指标分为原子指标、派生指标、组合指标三种类型。

维度是人们观察事物的角度,可以反映业务的一类属性,这类属性构成一个维度。一般常用的维度包括时间维度、渠道维度、地域维度等。当原子指标加上维度后,便可以形成派生指标,相当于某一维度上限定了一个值,则形成原有数据的一个切片,如果对多个维度进行限定,每个维度限定为一组取值范围,则是原有数据的一个切块。

常见维度如下表:

从上表我们可以发现维度是有层次结构的,可以认为它是一个树形结构,它具有自下而上收敛或自上而下分解的特点。

在建立符合企业自身情况的指标标准时,需要根据指标盘点的结果,对现有指标进行分解,得到目前业务场景涉及到的所有原子指标与维度,以此作为最基础的指标标准。

下面我们举几个例子来说明指标分解步骤:

例一:资产负债类指标

例二:营销类指标

例三:风控类指标

例四:监管类指标

有了基础指标标准后,随着业务的不断开展,势必会有新的指标需求不断出现,因此建议在需求环节增加对指标的管控。

首先,业务部门提交的需求说明书中应包含专门的数据需求章节,数据需求章节需包括以下内容:

(1)数据指标,标签等内容的基本信息

中文名称 业务定义 业务规则 主管部门 更新周期
…… …… …… …… ……

(2)补充要求,包括:历史数据保留要求、数据时效性要求、数据安全要求、数据质量校验等内容。

(3)需求原因:业务优化,专项整改(例如业务优化,专项整改(例如EAST问题整改、人行基础信息报送等)等。

其次,在需求分配环节区分出需求类型,涉及指标变更或新增的需求必须提交指标管理团队进行分析,协同业务部门与技术部门,对指标进行标准化,最终纳入指标资产统一管理。

由此可见,指标体系建设是一个循序渐进、不断完善的过程,是技术手段与管理手段相互协作的产物。

3.结合建模工具

传统的建模工具主要是面向设计,而新一代的建模工具将数据治理理念融入其中,把数据治理流程推进到开发流程中,从而在开发态的源头进行治理,解决了指标标准落地的问题,可以从根本控制增量的数据问题。

建模工具与数据标准、指标标准进行融合,在建模的时候可在线查询、智能推荐,提高标准的覆盖率,提升模型质量,又一定程度减轻了模型设计的工作量。

4.加强指标监控

前面我们提到指标由指标名称和指标数值两部分组成,因此当指标上线后,需要对指标数值进行监控。指标监控有两种,一种是基于风控要求,当指标出现异常波动,超出合理的阈值时的监控和预警,另一种是为了检查指标数值的准确性进行的监控,本文主要说的是第二种。

主要包含以下四个方面的监控:

(1)缺失值检查

对指标缺失率进行统计,对于缺失率过高的指标,需要确认是开发引起的还是口径有误,因为过高的缺失率说明有部分信息缺失,影响后续数据分析结果的可靠性和稳定性。

(2)倾斜率检查

所谓倾斜率是指指标数值的结果相对集中在某几个特定值或特定区间中,这种情况同样需要特别关注,因为如果指标数值是准确的,那么该指标的分析价值可能不大。

(3)异常值检查

异常值一般指处于特定范围之外的数值,当出现异常值的时候,需要对业务场景进行分析,它往往代表在业务发生的环节中出现了特殊情况。

(4)勾稽关系检查

勾稽关系是指报表中有关数字之间存在的,可据以相互考察、核对的关系。例如总账的期末余额等于各分户账期末余额之和。勾稽关系检查是最常用的指标检查手段,可以最快发现数据质量问题,但是需要在指标需求中提供检查公式。

如何建设数据指标体系?相关推荐

  1. 数据指标体系建设思考(二)

    一.数据指标体系搭建原则 我们在搭建数据指标体系时不能只是简单地堆积指标,也不仅仅会罗列指标.这可能以往有很大一部分人都会犯的通病. 那么我们在搭建数据指标体系时需要考虑的因素有哪些,或者从常规的方法 ...

  2. 快手如何搭建一个好的数据指标体系?

    导读:本篇文章源自钱英男老师在『快手大数据|数据内容建设交流会』上的演讲,相关视频回放可用快手APP搜索"快手大数据"观看. 一个好的数据指标体系可以助力业务快速的解构业务.理解业 ...

  3. 网易传媒数据指标体系建设实践

    什么是指标体系?为什么建设指标体系?如何使用OSM模型和AARRR模型搭建指标体系?本文将为大家带来网易传媒数据指标体系建设的实践分享. 1 什么是指标体系? 百度百科的定义:指标体系是指由若干个反映 ...

  4. 7000字,讲透数据指标体系的建设

    全文共6982个字,建议阅读13分钟 来源:数据科学家联盟 几乎所有的数据分析工作都会提到一个词--"建立数据指标体系",虽然这个词对于大家来说并不陌生,但是数据指标到底是什么以及 ...

  5. 永洪Desktop实例分享|星巴克数据指标体系建设及炫酷可视化大屏搭建

    点击上方蓝字关注我们 在很久以前分享过一篇用Excel制作炫酷动态看板的文章,很多小伙伴看了之后直呼Excel这种操作极为炫酷,也想实践下这类操作.但是到了真正上手的时候,却发现利用Excel作动态看 ...

  6. 游戏行业应该如何建设数据中台?

    责编 | 晋兆雨 来源 |智领云科技 封图 | CSDN 下载自视觉中国 随着网络世界的迅猛发展,"游戏"进入了前所未有的蓬勃发展期.根据Newzoo数据显示,2019年全球游戏市 ...

  7. 从“人、货、场”搭建数据指标体系,助力电商增长

    大家好,我是蜜芽宝贝的技术总监曾昶,今天分享的主题是"基于客户数据平台( CDP )的电商增长实践",主要包括电商数据指标体系的搭建和客户数据平台( CDP )的建设与应用. 可直 ...

  8. 网易传媒数据指标体系搭建实战!

    什么是指标体系?为什么建设指标体系?如何使用OSM模型和AARRR模型搭建指标体系?本文将为大家带来网易传媒数据指标体系建设的实践分享. 1 什么是指标体系? 百度百科的定义:指标体系是指由若干个反映 ...

  9. 如何构建公司级的数据指标体系

    如何构建公司级的数据指标体系 最近打算给公司开发一个数据可视化平台,建设数据可视化平台首当其冲的问题是建立数据指标体系,可以说数据指标体系是数据可视化平台的核心,也是数据可视化平台能用.易用.可用的保 ...

最新文章

  1. centos7 yum 安装 redis
  2. Spring ShedLock指南
  3. dart语法中list相关详解
  4. 弹出框 每次打开 滚动条置顶_微信置顶文字怎么弄?微信置顶一句话教程
  5. 吴恩达机器学习笔记三之逻辑回归
  6. 操作系统之进程管理:13、吸烟者问题
  7. 计算机专业内卷严重,考研,这6个专业“内卷”严重,竞争较为激烈!
  8. zookeeper基本原理
  9. 【时间序列预测】基于matlab麻雀算法优化LSTM时间序列预测【含Matlab源码 JQ001期】
  10. 25_多易教育之《yiee数据运营系统》OLAP平台-画像分析篇
  11. 微服务网关 gateway
  12. 我在华为度过的 “两辈子”(学习那些在大厂表现优秀的人)
  13. java等额本息、等额本金计算 记录一下
  14. Win10 打开heu kms activator工具进度条到70%闪退(未解决)
  15. 基于SSM(Spring+SpringMVC+MyBatis)的外卖点餐管理系统
  16. 2022-05-08 基于卷积神经网络ResNet的车型识别(实验)
  17. 微信小程序canvas简单使用
  18. Auto CAD三维图怎么画?cad三维图怎么画教程
  19. Telephony之TelephonyRegistry(原)
  20. 华为招聘Java程序员笔试试卷(一)

热门文章

  1. 高级软件工程第九次作业:东理三剑客团队作业-随笔3
  2. AVM环视:一.相机标定及原理
  3. TFTP文件传输协议
  4. 请问你们学校有计算机教室吗英语翻译,我们家有电脑。英语翻译
  5. Windows中文键盘消失
  6. 胡喜:蚂蚁金服十五年技术架构演进之路
  7. 蚂蚁金服胡喜:自主研发不是用来捏在手里,是用来开放的
  8. BLOB图像处理技术
  9. 《大数据》第七章 聚类 K-means算法 BFR算法 CURE算法
  10. Java8新特性----Lambda表达式详细探讨