4月29日,和示说社区合作,我们举办了今年的第二场线上活动。在活动中,社区专家苑泽福(阿福)为大家详细介绍了Greenplum在运营商领域的HTAP实践,活动获得了大家的一致好评。现在让我们通过这篇文章来回顾一下活动的精彩内容。

相关视频已上传B站Greenplum中文社区频道,PPT已上传至社区中文网站cn.greenplum.org/download。欢迎自行获取。

今天要跟大家分享的是Greenplum在运营商领域的HTAP实践。在今天要分享的案例中,该运营商在选型时期因为较为看重HTAP特性,因此最终选择了Greenplum这个HTAP大数据平台。 今天的内容将被分为五个部分来进行介绍,希望能为大家在Greenplum实践上带来一些启发。

  • Greenplum HTAP架构特点介绍
  • 项目整体规划及部署架构
  • 客户选型及测试内容分享
  • 新老系统迁移及数据校验
  • 生产运维经验分享

众所周知,Greenplum是一款开源MPP数据库,自2015年开源至今,拥有了众多开源和商业用户来为自己的生产提供业务支撑。Greenplum基于PostgreSQL,但针对大数据场景和用户对性能的极致追求做了大量特性和优化。近年来,Greenplum以敏捷的方式快速升级PostgreSQL内核,持续吸收上游的新功能、优化和增强,大大提升了Greenplum的总体能力。

在Greenplum早期,OLTP能力较弱,很多用户会选择使用PostgreSQL和Greenplum一起来支撑HTAP需求。随着PostgreSQL和Greenplum的不断演进,有些客户由于数据量较小,PostgreSQL 的单机能力完全可以承担业务运行,客户会选择使用PostgreSQL做一个基础的HTAP数据库。随着数据量的增大,很多客户会迁移到Greenplum,来满足其更大的数据量分析需求。因此在HTAP数据库的选择时,我个人的建议是推荐大家根据业务来选择,如果数据量不大,有高并发查询,也有分析型处理的话,可以使用PostgreSQL。但数据量上规模后,PostgreSQL其本身的分析性能,单机的处理能力并不能满足大数据量的并行分析需求,此时Greenplum就成为了一个更好的选择。

2021年,数据库顶级国际学术会议SIGMOD在西安举行,Greenplum内核团队的论文《Greenplum:A Hybrid Database for Transactional and Analytical Workloads》成功入选,被大会收录,具体的内容欢迎通过 链接 来了解。

Greenplum在向HTAP进化的过程中,做了哪些工作呢?我为大家总结了四个点:

1

// 内核升级

正如前文提到,Greenplum一直在持续不断地优化和升级内核代码。Greenplum 2003年研发之初,其内核版本是PostgreSQL 7;2017年发布的Greenplum 5之前一直是PostgreSQL 8.2版本;2017年9月发布的Greenplum 5,内核升级到了8.3;当前广泛使用的Greenplum 6,内核升级到9.4;正在研发的Greenplum 7,内核将会升级到12。

2

//   全局死锁检测(GDD)

该功能已开源,大家可以在网上获取到相关信息。Greenplum老版本上Update使用的是表锁,性能较差,如果要做Update需要把整个表锁定。从6版本开始,Greenplum通过全局死锁检测技术,堆表上表锁降低为行级锁,性能大幅提升。GDD的基本逻辑是收集每个segment锁依赖关系图,在master上重建整个集群的锁依赖关系图,并检测是否有环,从而避免死锁问题。因此,我们如果使用Greenplum做TP的操作时,更多的选型可以多创建一些堆表,这样增删改查的性能会比AO表更好一些。

3

// 事务优化

Greenplum 从6版本后,只读事务不需要分布式快照,也不需要2PC;而单节点查询也可以对两阶段提交进行优化。

4

// 复制表

Greenplum 在6版本增加了复制表。复制表即每个segment都有表的全部数据,因而不需要网络数据传输,还可以使用索引。通过复制表,用户可以将较小的数据在每一个计算实例上都放一份,在查询过程中,如果在某一份实例上定位到数据,就不再需要进行分布式数据查询。此外,如果做一些新型模型的Join查询,就可以在本地进行,而不需要做数据shuffle相关的工作。
这四个优化使Greenplum在TP性能上有了较大的提高。还有一些其他的特性,大家都可以从网上获取到相关资料,这里将不做赘述。
关于资源组的管理,在Greenplum 4版本和5版本中使用的是Resource Queue,对整个资源的控制力度不够强,如今很多主流数据库是采用Linux底层的cgroup来控制资源,Greenplum在6版本在资源组上也进行了增强,通过cgroup来控制。通过下面对比图,大家也可以看到,现在Greenplum对资源的控制力度,包括对一些特性的支持,都要比之前的资源队列好很多。大家在生产上可以追踪事件,看看如何更好的把resource group特性利用起来。

了解完Greenplum在HTAP方面做的增强, 下面视频中,我将就运营商案例中项目整体规划及部署架构、客户选型及测试内容、新老系统迁移及数据校验进行详细讲解,并和大家分享一些生产运维经验, 欢迎大家的观看!

点击观看完整视频

点击文末“ 阅读原文 ”,获取Greenplum中文资源。

来一波 “在看”、“分享”“赞” 吧!

本文分享自微信公众号 - Greenplum中文社区(GreenplumCommunity)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“ OSC源创计划 ”,欢迎正在阅读的你也加入,一起分享。

直播内容精华:Greenplum在运营商领域的HTAP实践相关推荐

  1. 想避免宕机,数据中心运营商还要不断演练实践

     数据中心运营商需要对其设施开展练习和实践,这是数据中心成功运营中被忽视.被低估的部分. 在构建新数据中心设施时,一些数据中心所有者在完成系统测试工作后,有意在项目进度表中设立了30到60天的练习和实 ...

  2. 数据分级分类实施指南_运营商行业数据安全治理实践

    建立组织 构建大数据安全保障组 一.大数据安全保障工作组职责 1.负责制定大数据信息安全策略,明确信息安全目标. 2.组织相关平台负责人定期召开信息安全会议. 3.负责客户数据安全突发事件应急方案实施 ...

  3. 中文分词的原理与方法及其在运维领域中的实践

    # 技术黑板报 # 第八期 推荐阅读时长:13min 什么是中文分词,其原理与方法又是如何应用在智能运维中的?让我们一起来看看云智慧对此是怎样理解的. 章节目录 一.中文分词面临的问题 二.常用中文分 ...

  4. 世界杯视频直播:电信运营商的一次互联网战争

    四年一次的世界杯是球迷的狂欢,更是商家的战场.今年世界杯的视频较量并非在传统互联网三巨头--优酷.爱奇艺和腾讯之间进行,斜刺里杀出一个运营商背景的咪咕. 5月22日,在距离世界杯开幕不到一个月的时候, ...

  5. 5G时代运营商内容运营策略初探

    "4G改变生活.5G改变社会",2019年是中国5G正式商用的元年,关于5G的话题一直是近两年的热门话题. 运营商目前还处在4G网络建设的回本阶段,加上4G时代流量价格下行,不限量 ...

  6. Verizon收购雅虎:中外电信运营商坚持造梦内容产业

    自从历史的车轮碾入互联网时代之后,电信运营商从来没有停止过对"内容"掌控权的焦虑,从三十年前试图垄断.掌控互联网内容开始,到如今苦苦追逐互联网公司的脚步,试图补足自己的内容&quo ...

  7. 专访福建移动林志云: 5G使能,运营商全面进入数字化转型之路

    随着科技的进一步发展,中国的移动通信技术正在进行着一场振奋人心的赛跑.自2016年起,5G技术逐渐进入人们的视野,在产业链的共同努力下,技术标准正在加速成熟,而今年年初的平昌冬奥会开幕,标志着5G试商 ...

  8. 智能工单处理,达观数据助力运营商实现业务流程智能化改造

    智能工单处理,达观数据助力运营商实现业务流程智能化改造 https://m.sohu.com/a/466386308_383123 智能工单处理,达观数据助力运营商实现业务流程智能化改造 达观数据 0 ...

  9. 走进中国移动(宁夏)数据中心,感受不一样的运营商情怀

    文章来源:数字中国万里行 如今,移动端应用已经深入我们生活的方方面面. 想出门,"嘀"一声扫码成功,骑上自行车就出发了: 家里又该交燃气费了?随时随地登录官网,输入编码就能立刻充值 ...

最新文章

  1. php免费iphp免费idede,闲鹤草邻
  2. 笔记本电脑下载python视频教程-如何使用Python访问/下载OneNote笔记本?
  3. 经典机器学习算法系列3-k近邻算法
  4. Tinyshop前后台操作基础教程讲解
  5. 先安装证书服务(CA),再安装IIS,导致默认certsrv站点不能访问
  6. 从MVC到云原生:CBU研发体系演进之路
  7. 2018年我国视频监控市场趋势:智能视频分析进入规模化
  8. HTTPHandler有什么作用
  9. struct timeval结构体 以及 gettimeofday()函数
  10. Conditional
  11. Struts2接受页面传值过程中出现input的问题
  12. nrm —— 快速切换 NPM 源
  13. JS高级程序设计(10)
  14. c语言math库正弦余弦函数
  15. 测试移动硬盘的真实容量的软件,移动硬盘容量标识有猫腻:实际缩水99%
  16. 双网卡双线路DNS解析分析
  17. 北京林业大学matlab公选课,北林选课攻略
  18. Tomcat启动,提示 The JRE_HOME environment variable is not defined correctly 问题。
  19. 计算机学报在线阅读,计算机学报CHIN.pdf
  20. 【年终总结】我的前端之行,回顾2022,展望2023

热门文章

  1. 20个最值得一读的科技名言
  2. 决策树算法,妈妈再也不用担心我不想学机器学习了
  3. 【KD基础】Softmax With Temperature公式白话理解
  4. 788B(dfs+xjb)
  5. CUDA编程 基础与实践 学习笔记(一)
  6. H5微信支付完成后点击完成,H5页面直接关闭
  7. 第364章_显化一万年_神墓_辰东_玄幻小说
  8. mint-ui font icon
  9. Biotin-MAL I;生物素化怀槐凝集素I(MAL I)
  10. A Little Love