DataOps To be or NOT to be?
上回书到,越来越多的企业注意到了DataOps的理念,并在积极的尝试和实践。但还有更多的企业在观察和思考“我们为什么要去实践DataOps?”
请允许我们引用莎翁的一段话作为开头,也请诸位一起来思考一下:DataOps是 To be 还是 NOT to be。
To be, or not to be: that is the question: Whether it`s nobler in the mind to suffer the slings and arrows of outrageous fortune, Or to take arms against a sea of troubles, And by opposing end them?
发展
电子化存储阶段
20世纪60年代开始。依托于文件系统和磁盘等技术,使得数据可以进行长期保存。但在这一阶段效率是较低的。
结构化数据管理
20世纪80年代开始。依托于数据库系统,实现了对结构化数据的存储,以此为基础支撑了各类业务的开展,百花齐放。实现了一定程度上的共享性,支持了数据灵活的增删改查。
数据分析阶段
20世纪90年代开始。随着数仓技术的成熟与企业管理需求的增长。企业管理者依托于数据仓库来实现对数据的汇总、分析,从而支撑管理决策。
海量数据管理阶段
21世纪10年代开始。大数据与人工智能飞速发展。数据的战略地位越来越高,更多的企业认识到数据同样是企业的资产。各类数据库的技术越发成熟,存储的成本逐渐降低,使得各类数据都有被存储、分析的需求,除了关注历史,企业还要对未来进行预测。
挑战
毫无疑问,随着互联网、IT等技术的发展,数据的增长是爆发式的,从而倒逼着数据处理的技术不断发展,进而又产生了更多的数据。在一轮轮的技术浪潮中,企业管理者的管理从经验导向演进为数据导向。这无疑使得企业的发展更为成熟更为科学,也同样让我国的企业更具有国际竞争力。
但在这一轮数据浪潮中,企业随着数据能力的建设发展,越来越多的问题也涌现出来。例如:
- 数据孤岛林立
- 数据建设维护高成本
- 数据准备阶段低效
- 数据的“可用不可信”等问题
Experian在2019的全球数据管理调查报告中更是直言,89%的企业难以管理数据。
转机
DataOps的适时出现可以说是必然的。DataOps以其敏捷化、精益化、自动化、智能化和可信等特点,对数据的全生命周期进行了一次“洗礼”。DataOps的出现可以说就是为了突破当前企业所遇到的数据瓶颈而生的。
DataOps通过对整个数据过程的重构,实现了
- 对现有(新增)数据源进行有效的集成(不论是物理集中还是逻辑集中)
- 合理弹性的数据存算资源配置
- 随时预备的安全的离线、实时以及数据科学开发环境
- 灵活的数据编排以及可信的数据质量等
这些特性都让企业不论从效率还是质量上都得到了显著的提升,同时也大幅降低了人力与物力的成本,进而打通数据生命的“任督二脉”。
未来
回到我们开头的问题,对于是否要践行DataOps,一方面要取决于企业当前的发展阶段与未来业务的发展需求,另一方面我们也要明白DataOps的建设不是一蹴而就的,既不要担心输在起跑线上,也不要因为一时半刻未见效而放弃。
中国信通院当下正联合工商银行、招商银行、农业银行、平安银行、浦发银行、南京银行、交通银行信通卡中心、长亮科技、联通数科、新大陆、亚信科技、阿里云、腾讯云、新炬网络、中软国际、浩鲸科技、科杰科技、海南数造、美亚柏科、深算院、数梦工场、网易、新华三、海尔等30余家单位对DataOps制定相关的行业标准体系。未来我们将结合中国的数据发展情况,打造一套适合我国数据行业发展的DataOps体系。
结尾让我们引用斯大林在1931年一次名为《论经济工作人员的任务》的演说内容:“人们有时问:不能稍微放慢速度,延缓进展吗?不,不能,同志们!决不能减低速度!恰恰相反,必须竭力和尽可能加快速度。我们对苏联工人和农民所负的义务要求我们这样做。我们对全世界工人阶级所负的义务要求我们这样做。延缓速度就是落后。而落后者是要挨打的。但是我们不愿意挨打。不,我们绝对不愿意!”
那么您的企业是否已经开始践行DataOps了呢?欢迎加入我们,一起分享交流DataOps的实践经验、探讨组织遇到的切实问题。
DataOps To be or NOT to be?相关推荐
- 什么是DataOps?难道DataOps只是面向Data 的Ops吗?
DevOps 近几年可谓风生水起,这与它吸引人的使命有关 - 提升产品研发迭代的速度,当然也不能忽略历史的进程,比如虚拟化(尤其是 Docker)技术的加持! 大数据(或团队)一般在前方业务线的存在感 ...
- DAMS峰会:解读ES搜索平台、AI中台、DataOps、机器学习等大数据技术精要
近年来,因数据衍生.关联.发展起来的技术层出不穷,我们不断探索数据从资源转化为资产的方法,又面临在数据共享和互通中引发的安全隐患:我们迫切希望进行企业核心数据库的开源化.国产化替换,又碍于" ...
- DataOps 标准体系能力框架及实践
DataOps作为一种企业提升数据分析质量和效率的方法论随之兴起.基于DataOps,企业数据中台可以实现更高效的运转,优化数据质量.加快生产周期,实现更好的数据运营.管理.应用.那么,运用DataO ...
- 汇集ATJ等互联网大厂和国内外大型银行的最新数智化布局与落地实践 | DAMS上海站...
近年来,因数据衍生.关联.发展起来的技术层出不穷,我们不断探索数据从资源转化为资产的方法,又面临在数据共享和互通中引发的安全隐患:我们迫切希望进行企业核心数据库的开源化.国产化替换,又碍于" ...
- 数据中台的终点是DataOps还是DaaS?
要说近些年企业服务圈的顶流明星,非数据中台莫属.可七八年过去了,数据中台还是没有成为类似数据仓库和数据湖一样的数据基础架构. 即使身处"数据价值已经被证明"."企业数字化 ...
- DataOps、MLOps 和 AIOps,你要的是哪个Ops?
作者 | Merelda Wu 策划 | 田晓旭 如何在 DataOps.MLOps 和 AIOps 之间进行选择?大数据团队应该采取哪种 Ops? 两年前,由于笔者领导的运维团队效率低下," ...
- 2022年应用人工智能会是什么样子?
来源:ScienceAI 编辑:绿萝 在过去的 18 个月中,人工智能的采用率猛增.除了为<哈佛商业评论>撰写基础文章的 Joe McKendrick 之外,从事 AI 工作的专业人士也很 ...
- 采访了14位技术公司的创始人,他们如何看待2020年的AI行业?
来源:KDnuggets 编译:木槿.张大笔茹.楚阳 科幻元年2020年马上就要来了.对于技术行业来说,这一年会有哪些值得期待的变化? KDnuggets采访了14位科技前沿的技术公司创始人,并汇总了 ...
- 从人肉到智能,阿里运维体系经历了哪些变迁?
机器智能的前提是需要有数据,AIOps的数据从哪里来?如何利用数据代替机器决策.分析?如何利用机器学习算法与基于大数据的业务运维管理平台整合,在告警过滤.异常监测.自动修复等环节发挥效用,真正能把运维 ...
最新文章
- Java中++i和i++的区别
- Spring思维导图(MVC篇)
- 一个编译不能通过的问题的解决
- 【IBM Tivoli Identity Manager 学习文档】15 用户管理
- 定时任务四种实现方式
- maven自动化部署插件sshexec-maven-plugin
- BO QUERY BUILDER - SI_INSTANCE相关属性
- char截取字符串_字符串的排列(滑动窗口)
- shopify 开发_播客第57集:从Shopify的作家到开发人员,与Adam Hollett一起
- 3-32,3-33Pytorch与autograd中的几个重要概念
- oracle客观题题库,oralce题库及答案.doc
- 谷歌EfficientNet缩放模型,PyTorch实现出炉,登上GitHub热榜丨Demo可用
- 滑块验证码Java实现
- linux系统上不去网,linux 上不去网
- 牛人自述模拟电路学习历程
- 游戏开发如此简单?我直接创建了一个游戏场景【python 游戏实战 02】
- 北京市密云区谷歌卫星地图下载
- 计算机仿真在机械应用,机械系统计算机仿真
- 游戏服务器哪种系统稳定,游戏服务器一般用什么系统吗
- ArcGIS空间数据分析实用工具——方向分布(标准差椭圆)