嘉宾 | 阎志涛   整理 | 黄引红

出品 | CSDN云原生

现代数据栈作为与数据分析相关的技术栈,具有云原生的特性,它与传统的数据平台相比较,降低了数据使用的技术门槛,也能满足用户日益扩大的数据需求。时下,现代数据栈也繁衍出越来越多的产品。

2022年7月12日,在CSDN云原生系列在线峰会第13期“现代数据栈峰会”上,快用云科联合创始人阎志涛分享了《Data Modeling in Modern Data Stack》,他表示,企业上云是不可逆转的趋势,企业使用数据进行驱动也是不可逆转的趋势。

什么是数据建模

传统数据栈的数据,一般来源于公司或企业本身的数据库,而现代数据栈则是从各大SaaS中获取数据。现代数据技术栈通常是指构成云原生数据平台的一组技术,对比传统的数据平台,使用它们可以降低复杂度。现代数据技术栈具有以云端数仓为中心、易用设计、便宜且按使用收费的特点。

数据建模的核心逻辑是依据业务需求,分析师去理解和建模,然后工程师将模型生成出来,形成最终的数据结构。

数据模型按不同的应用层次分成三种类型:概念数据模型、逻辑数据模型、物理数据模型。整个数据建模的过程就是从概念模型到逻辑模型再到物理模型。

数据建模的具体实施过程分为数据清洗、数据转换和数据丰富。

现代数据栈中的数据建模

数据使用的场景在转变,驱动的源头也发生了变化,产生了很多由项目驱动变成运营驱动的数据建模。实际上,传统的数据建模的过程,已经不适合现代的要求。

现代数据栈是基于原始数据进行数据建模,需求更加旺盛,数据建模的重要性也得以凸显。如今,现代数据栈也繁衍出越来越多的新产品。关于现代数据建模有四种产品:Dbt、Dataform、Datameer、QuickTable。

数据建模产品

Dbt

Dbt Labs是一家数据建模产品公司,成立于2016年。其产品Dbt的目标是成为帮助数据分析师进行数据转换的工具。Dbt关键功能分为六个部分:

  • SQL代码版本控制(GitHub) ;

  • 模型化SQL;

  • 协作;

  • SQL流调度;

  • Jinja扩展;

  • Matrics商店。

Dataform

Dataform是与Dbt类似的产品。

Dataform成立于2018年,在2020年被Google收购,随后,Dataform逐渐变成GCP(Google Cloud Platform)的一部分。

Datameer

Datameer成立于2009年,经历了公司转型,最终在云上找到了自己生存的位置。Datameer产品以Hadoop云供应商Altiscale和Bigstep为特色,将大数据分析环境简化为Hadoop平台之上的单一应用程序。

Datameer通过引入智能执行来消除复杂性。智能执行是一种检查数据集特征、分析任务和可用系统资源的技术,可以智能、动态地确定并为每个工作负载使用最合适的执行框架。此选择对最终用户完全透明,不需要IT协助或额外的硬件和软件。

QuickTable

QuickTable是快用云科团队做的产品,它的功能体现在五个方面。

  • 无代码数据建模工具。QuickTable使用户只需通过简单的拖拽操作,即可交互式地构建数据模型。用户无需编写复杂的SQL和Python代码,建模结果即刻呈现。

  • 电子表格状界面。QuickTable让用户可以使用类似电子表格的界面来访问、探索、清洗、建模和转换数据。

  • 多数据库和数据仓库支持。QuickTable为本地文件、在线电子表格、主流数据仓库/数据湖、对象存储和API提供了丰富的连接器,用户可以快速轻松地访问数据。

  • 跨团队协作支持。通过QuickTable,团队成员之间可以随时随地查看、评论和编辑数据模型。

  • 自动文档支持。如果用户先建模,把文档自动生成,文档与建模实际上是一体的,这样更有利于整个企业内部的数据处理。

总结

总的来说,现代数据栈已经成为一个新的趋势,如今关于数据栈的讨论也越来越多。云的能力实际上给企业使用数据提供了很好的基础,由于SaaS本身就是在收集企业数据,现代数据栈技术上的产品能让企业低成本地完成数据驱动。

因此,在这样的趋势之下,所有传统的数据技术工具都在现代数据栈上重新被构建。从数据接入到数据建模到BI,很多传统的数据产品也在现代数据技术栈中被重新的构建。当数据建模的场景日益丰富,数据的来源更加繁杂,数据建模在场景当中变得越来越重要。

但数据建模的产品,离真正成熟还有一定的距离。需要让更多的用户在不同的场景当中使用,经历产品反复打磨的过程。相信未来在数据建模的领域,一定会有更多的优质工具产生,这值得我们共同去探索。


CSDN志愿者计划正在招募

快用云科阎志涛:现代数据栈中的数据建模相关推荐

  1. CSDN现代数据栈峰会-快用云科联合创始人阎志涛

    讯飞文本:讯飞听见 CSDN现代数据栈峰会-快用云科联合创始人阎志涛 嘉宾 |阎志涛 整理 | 黄引红 出品 | CSDN云原生 2022年7月12日,在CSDN云原生系列在线峰会第13期" ...

  2. 智云通CRM:如何经营好企业中的数据?

    爱因斯坦说过,想象力比只是更重要,因为知识是有限的,而想象力概括着世界上的一切,推动着社会进步,并且是知识进化的源泉. 企业想要更好地利用数据,就要梳理并规划好企业的数字化战略,进行企业数字化建设(制 ...

  3. ssm mysql 插入date 数据_SSM中插入数据没有报错,但是数据库没有值?报错-问答-阿里云开发者社区-阿里云...

    mybatis默认开启事务不会自动提交,只有调用了commit才会提交事务.你这种情况明显是事务成功执行了,而且自增ID也已生效,但事务本身没有提交,请调用mybatis的commit方法提交事务! ...

  4. 赛门铁克:与神州云科合作达成两大目标

    安全威胁在不断进化,作为国际著名网络安全厂商的赛门铁克,也在不断地行动中全力为用户提供更为安全的网络环境.继赛门铁克46.5亿美元并购Web安全提供商 Blue Coat后,赛门铁克再一次调整方向,紧 ...

  5. 云原生人物志 | Pulsar翟佳:社区的信任最重要

    云原生已无处不在,<云原生人物志>是CSDN重磅推出的系列原创采访,我们关注云原生中每一个技术人.公司的身影.知微见著,窥见云原生价值与趋势. 编辑 | 宋 慧 出品 | CSDN云计算 ...

  6. 伙伴云CEO戴志康:Discuz !之后,打造数字化武器,助力元气森林们做爆品

    "像元气森林CEO唐彬森这样带着做游戏的思路去做气泡水的互联网人,已经不在少数 ",伙伴云董事长戴志康说. "像元气森林CEO唐彬森这样带着做游戏的思路去做气泡水的互联网 ...

  7. 神州云科全国巡展·金融客户会北京站成功举办

    近日,神州云科全国巡展·金融客户会北京站成功举办.本次巡展以金融数字化转型"加速度"为主题,旨在稳步助力金融行业数字化转型提质增效.神州云科站在应用可持续性发展和架构战略角度,通过 ...

  8. 云原生人物志|Pulsar翟佳:社区的信任最重要

    云原生已无处不在,<云原生人物志>是CSDN重磅推出的系列原创采访,我们关注云原生中每一个技术人.公司的身影.知微见著,窥见云原生价值与趋势. 编辑 | 宋 慧 出品 | CSDN云计算 ...

  9. 云原生人物志|华为云CTO张宇昕:云原生已经进入深水区

    云原生已无处不在,<云原生人物志>是CSDN重磅推出的系列原创采访,我们关注云原生中每一个技术人.公司的身影.知微见著,窥见云原生价值与趋势. 作者 | 宋慧 出品 | CSDN云计算 头 ...

最新文章

  1. 无人配送的Nuro再融5亿美元,为啥中国复刻者们没它这么火
  2. TL-410小路由静态路由问题
  3. JS基础_使用工厂方法创建对象(了解下就行了,用的不多)
  4. 【九天教您南方cass 9.1】 08 绘制等高线及对其处理
  5. Android WebRTC 音视频开发总结
  6. 模糊PID控制算法的C++实现
  7. 笔记本电脑华硕N56VZ的几种螺丝规格
  8. G-Dezender批量解密
  9. python 大数据入门教程
  10. C语言 怎么求字符串的长度,实例讲解(简洁)
  11. 乌隆他尼皇家大学举办建校98周年校庆表彰大会
  12. VRAR概念的定义和要素以及技术定义和应用
  13. 国内计算机类期刊SCI/EI检索
  14. IIS——发布https网站显示 The connection was reset(连接被重置)
  15. mPaaS iOS框架笔记1-mPaaS APMobileFramework (以MPH5Demo_plugin为例)
  16. sql嵌套查询慢的原因
  17. Linux内核发展史和linux发行版
  18. 函数概念与特性——复合函数
  19. 自己写了一个JAVA的简单扑克牌小游戏
  20. The frontend does not match Zabbix database

热门文章

  1. 杭州首个私人会所型证券营业部低调登场
  2. 恺撒Caesar密码
  3. 怎样使用迅捷画图中的流程图模板
  4. php——tp5中前后端的数据交互
  5. Python3安装suds问题汇总
  6. mysql字符串拼接 空值_mysql字符串拼接并设置null值的实例方法
  7. 透明500mlPFA洗气瓶本底低特氟龙洗气瓶无溶出与析出耐腐蚀半导体用
  8. UI设计全家桶,0基础小白必收藏系列
  9. 图论算法之最短路径(Dijkstra、Floyd、Bellman-ford和SPFA)
  10. 我的编程之路(二十八) 回首2014