数据分布式存储原理,数据分布式规则?就这?怎么就数据分布式了。现在我们把MDC对应OSD数量生成的数据分布式规则交给VBS模块。

VBS是安装在用户系统中的一个代理,当用户需要存放数据在分布式存储中时,VBS会先接收用户的数据,然后对用户数据进行切块分区(一般会把数据分成1MB大小的数据分片。

例如一个1GB的视频文件需要存放在分布式存储中,则会被VBS接收后分割为1024个1MB大小的数据分片),接着对每个数据分片带有的SCSI标识进行格式转化,使之成为分布式存储系统使用的Key标识。然后对key进行哈希计算,算出每个数据分片的哈希值。

可以这样理解,其实每个数据在操作系统下发存储的时候都会带着一个介绍信(SCSI标识),操作系统告诉数据拿着这个介绍信去找大V哥开房间存放数据。

分布式存储的VBS模块就是这个大V哥,当大V哥看到这个介绍信(SCSI标识)后就告诉数据,你的这个介绍信(SCSI标识)现在用不了了,必须重新登记一下,然后VBS就根据介绍信(SCSI标识)又开了一张票(Key)给数据,然后数据拿着这张票(Key)去找大V哥的小弟,小弟就根据票(key)来分配房卡(key带入哈希函数进行计算算出哈希值),开房间存放数据(如图)。

(图 数据分片逻辑图)

数据被VBS接收后,最终数据会变成多个1MB的小数据分片,并且每一个1MB的小数据块都会带着最终的哈希值 。哈希值可以在0-232之间取整,很巧的是,MDC生成的哈希路由圆环也刚好是232份个分区,那么哈希值取整是多少,该1MB数据分片就归属于哪一个分区。

由于MDC通过对应OSD和哈希路由圆环的分区生成了一个分区对应磁盘的关系(数据分布式规则),那么最终这个数据就存放在该分区对应的磁盘中,该磁盘的OSD会将数据持久化存放在磁盘介质中。(如图)若上文假设中提到分区1-分区3对应OSD1,刚好现在有一个数据分片对应的哈希值取整后为3,则该1MB数据归属在分区3,分区3对应OSD1,则由OSD1将该1MB数据存放到该OSD对应的磁盘中,完成数据落盘。

(图 哈希全流程图)

由于哈希路由圆环所生成的分区是均分对应到OSD上的,所以当大量数据存储时,由于概率,最终数据基本会均分到各个OSD对应的磁盘中存放起来。所有磁盘是并发工作的,都可以接收数据就等同于所有磁盘对应所在的服务器都是并发且相对均衡地接收数据,最终完成数据的分布式存储。

带你了解数据分布式存储原理相关推荐

  1. 大数据分布式存储原理

    大数据基础 1.什么是大数据 短时间内快速的产生海量的多种多样的有价值的数据 2.大数据技术 2.1 分布式存储 2.2 分布式计算 ① 分布式批处理(无法实现预测) 存一段时间的数据,等到将来某一时 ...

  2. HDFS读写数据的原理

    目录 1 概述 2 HDFS写数据流程 3 HDFS读数据流程 目录 最近由于要准备面试,就把之前学过的东西好好整理下,权当是复习. 下面说下HDFS读写数据的原理. 1 概述 HDFS集群分为两大角 ...

  3. 深入了解Struts2返回JSON数据的原理及具体应用范例

    来源:http://yshjava.iteye.com/blog/1333104 早在我刚学Struts2之初的时候,就想写一篇文章来阐述Struts2如何返回JSON数据的原理和具体应用了,但苦于一 ...

  4. 大数据技术原理与应用 第一篇 大数据基础

    目录 第一章 大数据概述 一. 大数据时代 1.1 三次信息化浪潮 1.2 信息科技发展 1.3 数据产生方式的变革 1.4 大数据的影响 二. 大数据的概念 2.1 大数据的特征 2.2 大数据关键 ...

  5. 手把手教你EEG脑电数据预处理-原理篇

    目录 0. EEG data 1. 定位通道数据 2. 删除无用数据 3.滤波 4.分段 5.基线校正 6. 重参考 7. 降低采样率 8. 插值坏导 9. 独立主成分分析 10. 剔除坏段 本分享为 ...

  6. 大数据技术原理与应用—课后题答案(第一章)

    大数据技术原理与应用_林子雨版_课后题答案(第一章) 1.试述信息技术发展史上的3次信息化浪潮及具体内容. 信息化浪潮 发生时间 标志  解决问题                           ...

  7. 网站统计中的数据收集原理及实现

    网站数据统计分析工具是网站站长和运营人员经常使用的一种工具,比较常用的有谷歌分析.百度统计和腾讯分析等等.所有这些统计分析工具的第一步都是网站访问数据的收集.目前主流的数据收集方式基本都是基于java ...

  8. 网站统计中的数据收集原理及实现(js埋点实现)

    网站统计中的数据收集原理及实现 网站统计 埋点 Web Openresty 网站数据统计分析工具是网站站长和运营人员经常使用的一种工具,比较常用的有谷歌分析.百度统计和腾讯分析等等.所有这些统计分析工 ...

  9. 网站统计中的数据收集原理及实现(openResty篇)

    引言: 网站数据统计分析工具是网站站长和运营人员经常使用的一种工具,比较常用的有谷歌分析.百度统计和腾讯分析等等.所有这些统计分析工具的第一步都是网站访问数据的收集.目前主流的数据收集方式基本都是基于 ...

最新文章

  1. 我的面试标准:第一能干活,第二Java基础要好,第三最好熟悉些分布式框架!...
  2. 步步为营 .NET 设计模式学习笔记 六、Adapter(适配器模式)
  3. CentOS 6安装Oracle报错解决方案
  4. phpMyAdmin 4.4.0 beta1 发布,MySQL 管理工具
  5. linux-grub修复5步搞定
  6. 粗暴,干就完了----徐晓冬似的C语言自学笔记-----实现一个链表结构
  7. KeyBlaze for mac(专业打字练习软件)激活版
  8. 如何限制计算机用户的登录时间,电脑怎么设置上网时间有限制
  9. 2核4G阿里云服务器被黑客抓鸡??然鹅一个操作就搞定
  10. PSNR-峰值信噪比
  11. 【历史上的今天】3 月 8 日:游戏机之父诞辰;搜索技术之父出生;MIT 公开演示旋风计算机
  12. Linux配置文件-limits.conf
  13. mysql ibd frm文件_mysql中frm和ibdata文件
  14. 如何在android中设置背景图片,在Android中设置窗口背景图
  15. 艾司博讯:拼多多批量发货怎么做?
  16. powermill2020错误代码1603_max2020安装提示1603
  17. 三大运营商(联通、电信、移动)的手机号正则判断
  18. 微信公众平台运营的关键是数据实时掌握——数据分析
  19. 使用blender做一个地球模型,贴上UV纹理,导出Obj格式
  20. 专利申请的步骤和材料有哪些?

热门文章

  1. java毕业设计基于网络平台个人博客系统Mybatis+系统+数据库+调试部署
  2. 中国银行软件中心(北京)2021年春招和实习招聘-信息科技岗流程分享
  3. 使用cmd命令修改系统壁纸
  4. 2018.11.10计算未来轻沙龙——听九个清华大神聊大数据
  5. 司马懿为什么比诸葛亮略胜一筹?
  6. linux mint安装vs code,在Ubuntu 18.04/Linux Mint 19下安装Visual Studio Code的方法
  7. FPGA学习笔记_Quartus II_In system sources and probes editor(ISSP)调试工具的使用
  8. 自学web前端开发能找到工作吗?
  9. 用jsp给图片添加文字(图片水印)
  10. OJ Problem D: 哪一天,哪一秒?