在服务端会经常遇到数据存储的选型问题,是选择使用关系型数据库 MySQL,还是选择内存数据库 Redis,还是选择文档数据库 MongoDB,还是选择列族数据库 HBase, 还是选择全文搜索引擎 ElasticSearch 呢?本节主要介绍如何选择合适的数据存储方案。

关系型数据库 MySQL

MySQL 是一个最流行的关系型数据库,在互联网产品中应用比较广泛。一般情况下,MySQL 数据库是选择的第一方案,基本上有 80% ~ 90% 的场景都是基于 MySQL 数据库的。因为,需要关系型数据库进行管理,此外,业务存在许多事务性的操作,需要保证事务的强一致性。同时,可能还存在一些复杂的 SQL 的查询。值得注意的是,前期尽量减少表的联合查询,便于后期数据量增大的情况下,做数据库的分库分表。

内存数据库 Redis

随着数据量的增长,MySQL 已经满足不了大型互联网类应用的需求。因此,Redis 基于内存存储数据,可以极大的提高查询性能,对产品在架构上很好的补充。例如,为了提高服务端接口的访问速度,尽可能将读频率高的热点数据存放在 Redis 中。这个是非常典型的以空间换时间的策略,使用更多的内存换取 CPU 资源,通过增加系统的内存消耗,来加快程序的运行速度。

在某些场景下,可以充分的利用 Redis 的特性,大大提高效率。这些场景包括缓存,会话缓存,时效性,访问频率,计数器,社交列表,记录用户判定信息,交集、并集和差集,热门列表与排行榜,最新动态等。

使用 Redis 做缓存的时候,需要考虑数据不一致与脏读、缓存更新机制、缓存可用性、缓存服务降级、缓存穿透、缓存预热等缓存使用问题。

文档数据库 MongoDB

MongoDB 是对传统关系型数据库的补充,它非常适合高伸缩性的场景,它是可扩展性的表结构。基于这点,可以将预期范围内,表结构可能会不断扩展的 MySQL 表结构,通过 MongoDB 来存储,这就可以保证表结构的扩展性。

此外,日志系统数据量特别大,如果用 MongoDB 数据库存储这些数据,利用分片集群支持海量数据,同时使用聚集分析和 MapReduce 的能力,是个很好的选择。

MongoDB 还适合存储大尺寸的数据,GridFS 存储方案就是基于 MongoDB 的分布式文件存储系统。

列族数据库 HBase

HBase 适合海量数据的存储与高性能实时查询,它是运行于 HDFS 文件系统之上,并且作为 MapReduce 分布式处理的目标数据库,以支撑离线分析型应用。在数据仓库、数据集市、商业智能等领域发挥了越来越多的作用,在数以千计的企业中支撑着大量的大数据分析场景的应用。

全文搜索引擎 ElasticSearch

在一般情况下,关系型数据库的模糊查询,都是通过 like 的方式进行查询。其中,like “value%” 可以使用索引,但是对于 like “%value%” 这样的方式,执行全表查询,这在数据量小的表,不存在性能问题,但是对于海量数据,全表扫描是非常可怕的事情。ElasticSearch 作为一个建立在全文搜索引擎 Apache Lucene 基础上的实时的分布式搜索和分析引擎,适用于处理实时搜索应用场景。此外,使用 ElasticSearch 全文搜索引擎,还可以支持多词条查询、匹配度与权重、自动联想、拼写纠错等高级功能。因此,可以使用 ElasticSearch 作为关系型数据库全文搜索的功能补充,将要进行全文搜索的数据缓存一份到 ElasticSearch 上,达到处理复杂的业务与提高查询速度的目的。

ElasticSearch 不仅仅适用于搜索场景,还非常适合日志处理与分析的场景。著名的 ELK 日志处理方案,由 ElasticSearch、Logstash 和 Kibana 三个组件组成,包括了日志收集、聚合、多维度查询、可视化显示等。

选择合适的数据存储方案相关推荐

  1. 服务端指南 数据存储篇 | 选择合适的数据存储方案

    在服务端会经常遇到数据存储的选型问题,是选择使用关系型数据库 MySQL,还是选择内存数据库 Redis,还是选择文档数据库 MongoDB,还是选择列族数据库 HBase, 还是选择全文搜索引擎 E ...

  2. 如何选择一个合适的Web存储方案

    Web客户端存储是一个现代Web应用必不可少的功能,常见的有Cookie.WebStorage和IndexedDB等,如何选择一个合适的Web存储方案呢? 一. Cookie 1. 为什么要有Cook ...

  3. HBase实战 | 从MySQL到HBase:数据存储方案转型的演进

    作者介绍 杨宏志,知乎首页架构负责人,主要负责首页工程化建设.工程架构优化.性能提升等工作.知乎专栏:https://zhuanlan.zhihu.com/c_195355141 本文转载自dbapl ...

  4. 从MySQL到HBase:数据存储方案转型的演进

    一.集群化方案 1.MySQL应用的演化 MySQL与HBase说到最核心的点,是一种数据存储方案.方案本身没有对错.没有好坏,只有合适与否.相信多数公司都与MySQL有着不解之缘,部分学校的课程甚至 ...

  5. Android Learning:数据存储方案归纳与总结

    前言 最近在学习<第一行android代码>和<疯狂android讲义>,我的感触是Android应用的本质其实就是数据的处理,包括数据的接收,存储,处理以及显示,我想针对这几 ...

  6. 篇1:如何为FPGA选择合适的电源管理方案

                                        如何为FPGA选择合适的电源管理方案 0    背景 当项目中FPGA选型已确定,开始设计电路原理图时,硬件工程师面临的首要问题 ...

  7. 分布式医疗大数据存储方案研究综述

    摘要 医疗数据属于大数据的一种,具有数据量大.增长迅速.多模态.高价值.重隐私等特点.针对医疗数据特点,如何对其进行统一.高效的组织管理是目前重要的研究方向.为此,通过阐述医疗数据特点,分析其存储需求 ...

  8. tinyFlash:一种超轻量级的嵌入式单片机flash KV 数据存储方案

    tinyFlash 一种超轻量级的flash KV数据存储方案 Github 地址:https://github.com/ospanic/tinyFlash 设计原理 本方案采用两个扇区轮流使用的方法 ...

  9. 简单爬虫设计(六)——原始网页数据存储方案选择

    文章目录 为什么要存原始数据 保存原始数据是提高数据质量的前提 原始数据存储方案 题外话 小结 为什么要存原始数据 在实现一个生产环境可用的网络爬虫时,有一个问题几乎是无法绕过的,那就是网页原始数据的 ...

最新文章

  1. 【VMCloud云平台】SCO(一)规划
  2. python 数据库操作 yeild from_Python数据库连接关闭
  3. android opengl es 绘制余弦曲线,Android OpenGL ES - 绘制线、面
  4. (chap1 网络基础知识)网络的构成要素:(4-6)集线器和3层交换机
  5. 一些数学小公式/定理的证明
  6. 计算机系应用,近距离看专业 计算机专业应用篇
  7. 及部署 项目案例_盘点丨2019十大边缘计算项目
  8. 英特尔中国:截至2018年底女性员工占比33%
  9. Linux下,如何安装有互相依赖关系的RPM包[转]
  10. getshell工具下载批量ecshop4.0全版本通杀工具下载
  11. 【vbers】ibv_reg_mr|RDMA
  12. 创建型模式 - 单例模式Singleton
  13. LeetCode刷题——剑指offer深度优先搜索题目汇总
  14. 微信公众号文章采集的一些基础概念
  15. 文化中国 系列一:明朝的那些人儿
  16. Remote Procedure Calls
  17. java 函数名相同_下列方法不属于java.lang.Math类的有(方法名相同即可)【 】...
  18. Game Engine Architecture by Jason Gregory:1.6 实时游戏引擎架构
  19. mybatis 入门([尚硅谷]_张晓飞_Mybatis 学习笔记一)
  20. 音频放大电路制作记录

热门文章

  1. 比较常见的几款车的车标
  2. RabbitMQ 重置用户名和密码的方法分享
  3. 解密:404背后的故事
  4. 数据库设计原则(不错)
  5. 世界上最优秀的杀毒软件之一
  6. Qt将鼠标移动范围限定在某个区域内QCursor跨平台代码
  7. Cuda 程序设计中 Grid 和 Block 维度设置的注意事项
  8. 丽台p1000相当于什么级别的显卡
  9. WangEditor基本使用
  10. div居中方法(共8种)