“熵”是热力学第二定律的核心概念,熵其实就是指的“混乱程度”,简单来说熵是衡量我们这个世界中事物混乱程度的一个指标。在一个孤立系统中它的总混乱度(熵)是不会减小的,也就是说如果不做任何管控,事物往往会不断的向无序发展。
其实数据也是一个不断熵增的过程,随着时间的推移会出现无效数据、错误数据、冗余数据、不规范数据、相冲突数据等。如果不好好进行管控,去减少我们数据中的“熵”,我们最后会得到一些无序低价值的数据。
如何化“熵增”为“熵减”,数据质量管理尤为重要。

下定义:解读数据质量管理
数据质量管理是对数据从计划、获取、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高。数据质量管理是循环管理过程,其终极目标是通过可靠的数据提升数据在使用中的价值,并最终为企业赢得经济效益。
所以,数据质量是保证数据应用的基础,而要评估数据是否达到预期设定的质量要求,需要有专业权威的评价标准来约束。目前为止,最权威的标准是由全国信息技术标准化技术委员会提出的数据质量评价指标(GB/T36344-2018 ICS 35.24.01)

理框架:数据质量管理系统框架
数据质量很重要,我们知道数据存在的问题,我们也知道数据质量要符合6大评价标准,但是我们要怎么系统化建设和管理呢?数据质量管理一般以数据标准为数据检核依据,以元数据为数据检核对象,将质量评估、质量检核、质量整改与质量报告等工作环节进行流程整合,形成完整的数据质量管理闭环。

方法论:数据质量管理的四个阶段
然而,我们需要按照什么流程来对数据质量进行有效的管控,从而提升数据质量,释放数据价值?一般来讲,数据质量控制流程分为4个阶段:启动、执行、检查、处理。在管控过程中这4个阶段需不断循环,螺旋上升。

如何化“熵增”为“熵减”,数据质量管理尤为重要相关推荐

  1. 人活着就是在对抗熵增 | 熵增启示录

    "人活着就是在对抗熵增定律,生命以负熵为生."(薛定谔<生命是什么>) "努力很辛苦,但躺下真的好舒服." 薛定谔说:人活着就是在对抗熵增定律,生命 ...

  2. [创业之路-73] :如何判断一个公司或团队是熵减:凝聚力强、上下一心,还是,熵增:一盘散沙、乌合之众?

    目录 前言: 一盘散沙.乌合之众: 凝聚力强.上下一心: 一.股权结构与利益分配 一盘散沙.乌合之众 凝聚力强.上下一心 二.组织架构与岗位职责 一盘散沙.乌合之众 凝聚力强.上下一心 三.战略目标 ...

  3. 知乎进化:对抗内容“熵增”胜算几何?

    文|李永华 来源|螳螂财经(TanglangFin) 内容赛道热度不减. 先是百度.字节跳动互诉,百度因疑似"搜索结果被窃取"索赔9000万,而后字节跳动"抄袭" ...

  4. 解决农业产业化“熵增”难题:智慧农业的联想答案

    文 | 曾响铃 来源 | 科技向令说 照例,新的一年开启时,宏观层面再一次强调了三农问题的重要性,在多方面进行着政策部署.而与以往不同的是,在人工智能.大数据.物联网等技术快速发展的大背景下,如今的农 ...

  5. 从熵增理论中我们到底悟到了什么……

    1. 熵增,在人生观上的启示是:越发力,越混乱. 无论努力与否,系统的熵(一种混乱程度)只增不减,这就是熵理论的大概描述. 这看似是一种"努力无效"的悲观理论,但实际上,如果你只看 ...

  6. 用开放和流动反抗熵增,生态建设终极哲学——保险生态建设...

    管理学大师彼得德鲁克说:管理要做的只有一件事情,就是如何对抗熵增.在这个过程中,企业的生命力才会增加,而不是默默走向死亡. 迈克尔•波特说:在生物有机体中,生命能量的消耗是为了维护一种精巧的秩序.一个 ...

  7. 用开放和流动反抗熵增,生态建设终极哲学——保险生态建设

    管理学大师彼得德鲁克说:管理要做的只有一件事情,就是如何对抗熵增.在这个过程中,企业的生命力才会增加,而不是默默走向死亡. 迈克尔•波特说:在生物有机体中,生命能量的消耗是为了维护一种精巧的秩序.一个 ...

  8. 信息3.0 ,让机器完成熵增中的有序

    --> 如果有一个帮助你变成某一领域专家的产品,你会不会购买? 或者有这么一款帮助你更好地完成工作的生产力工具,你会不会愿意使用? 目前生活中,有哪些场景已经有类似思想的产品?欢迎在文末留言讨论 ...

  9. 真正的高手,都有对抗“熵增”的底层思维

    在1998年亚马逊致股东信里,贝佐斯说:"我们要反抗熵(We want to fight entropy)." 管理学大师彼得·德鲁克说:"管理要做的只有一件事情,就是如 ...

最新文章

  1. backup restore On Ubuntu
  2. Java的新项目学成在线笔记-day7(二)
  3. shell中各种括号的用法
  4. Cpp 对象模型探索 / 父类和子类调用构造函数和析构函数的顺序
  5. boost::hana::make_range用法的测试程序
  6. python路径拼接os.path.join()函数和os.makedirs的用法
  7. PHP权重算法-用于游戏根据权限来随机物品
  8. 水印鲁棒性的分析matlab程序,图像数字水印+matlab程序
  9. Stylish窃取用户数据被 Firefox 和 Chrome剔除
  10. Java中截取字符串中小数点前面的字符
  11. 解析Pinterest:兴趣乐园背后的大文章
  12. 学习VIM之2014
  13. 堆栈的使用(部分学习)
  14. Java知多少(84)图形界面之布局设计
  15. sonar mysql svn_jenkins+sonarqube+svn/git踩过的坑
  16. java struts 读取文件_读取文件.txt并将其保存到c中的struct
  17. Android MTK 6763 User 版本默认打开usb调试
  18. 计算机图形学的学习心得,计算机图形学学习心得
  19. 历年考研计算机专业英语平均分,历年考研英语平均分及难度分析(截止至2020年)...
  20. jmeter ramup设置_Jmeter(2)基础知识

热门文章

  1. 货运铁路智能化方案ceaspectusR™自动化货铁路运输信息识别+数字化集装箱管理,全球No.1集装箱人工智能企业中集飞瞳打造
  2. 屏蔽系统分区默认共享及关闭smb服务
  3. c语言实战项目ppt,c语言程序设计与项目实践第5章.ppt
  4. 入行3D建模你还要学会美术?绘画?他在图你的钱啊
  5. 成都百知教育:Shopee虾皮单店铺单类目垂直和多类目垂直有什么区别?
  6. 医药采购之药品目录导入
  7. 算法提高 The Sky is the Limit
  8. 如何打造一个自己的「天空之城」,密歇根大学博士后教您虚空造物、偷天换日!...
  9. 淘宝网网上购物如何防骗
  10. 微信小程序画布Canvas组件touchend事件不触发处理