MyISAM存储引擎

MyISAM引擎使用B+Tree作为索引结构,叶节点的data域存放的是数据记录的地址。下图是MyISAM索引的原理图:

这里设表一共有三列,假设我们以Col1为主键,则上图是一个MyISAM表的主索引(Primary key)示意。可以看出MyISAM的索引文件仅仅保存数据记录的地址。在MyISAM中,主索引和辅助索引(Secondary key)在结构上没有任何区别,只是主索引要求key是唯一的,而辅助索引的key可以重复。如果我们在Col2上建立一个辅助索引,则此索引的结构如下图所示:

同样也是一颗B+Tree,data域保存数据记录的地址。因此,MyISAM中索引检索的算法为首先按照B+Tree搜索算法搜索索引,如果指定的Key存在,则取出其data域的值,然后以data域的值为地址,读取相应数据记录。

MyISAM的索引方式也叫做“非聚集”的,之所以这么称呼是为了与InnoDB的聚集索引区分。

InnoDB存储引擎

虽然InnoDB也使用B+Tree作为索引结构,但具体实现方式却与MyISAM截然不同。

第一个重大区别是InnoDB的数据文件本身就是索引文件。从上文知道,MyISAM索引文件和数据文件是分离的,索引文件仅保存数据记录的地址。而在InnoDB中,表数据文件本身就是按B+Tree组织的一个索引结构,这棵树的叶节点data域保存了完整的数据记录。这个索引的key是数据表的主键,因此InnoDB表数据文件本身就是主索引。

是InnoDB主索引(同时也是数据文件)的示意图,可以看到叶节点包含了完整的数据记录。这种索引叫做聚集索引。因为InnoDB的数据文件本身要按主键聚集,所以InnoDB要求表必须有主键(MyISAM可以没有),如果没有显式指定,则MySQL系统会自动选择一个可以唯一标识数据记录的列作为主键,如果不存在这种列,则MySQL自动为InnoDB表生成一个隐含字段作为主键,这个字段长度为6个字节,类型为长整形。

第二个与MyISAM索引的不同是InnoDB的辅助索引data域存储相应记录主键的值而不是地址。换句话说,InnoDB的所有辅助索引都引用主键作为data域。例如,下图为定义在Col3上的一个辅助索引:

这里以英文字符的ASCII码作为比较准则。聚集索引这种实现方式使得按主键的搜索十分高效,但是辅助索引搜索需要检索两遍索引:首先检索辅助索引获得主键,然后用主键到主索引中检索获得记录。

了解不同存储引擎的索引实现方式对于正确使用和优化索引都非常有帮助,例如知道了InnoDB的索引实现后,就很容易明白为什么不建议使用过长的字段作为主键,因为所有辅助索引都引用主索引,过长的主索引会令辅助索引变得过大。再例如,用非单调的字段作为主键在InnoDB中不是个好主意,因为InnoDB数据文件本身是一颗B+Tree,非单调的主键会造成在插入新记录时数据文件为了维持B+Tree的特性而频繁的分裂调整,十分低效,而使用自增字段作为主键则是一个很好的选择。

InnoDB自增主键

上文讨论过InnoDB的索引实现,InnoDB使用聚集索引,数据记录本身被存于主索引(一颗B+Tree)的叶子节点上。这就要求同一个叶子节点内(大小为一个内存页或磁盘页)的各条数据记录按主键顺序存放,因此每当有一条新的记录插入时,MySQL会根据其主键将其插入适当的节点和位置,如果页面达到装载因子(InnoDB默认为15/16),则开辟一个新的页(节点)。

如果表使用自增主键,那么每次插入新的记录,记录就会顺序添加到当前索引节点的后续位置,当一页写满,就会自动开辟一个新的页。如下图所示:

这样就会形成一个紧凑的索引结构,近似顺序填满。由于每次插入时也不需要移动已有数据,因此效率很高,也不会增加很多开销在维护索引上。

如果使用非自增主键(如果身份证号或学号等),由于每次插入主键的值近似于随机,因此每次新纪录都要被插到现有索引页得中间某个位置:

此时MySQL不得不为了将新记录插到合适位置而移动数据,甚至目标页面可能已经被回写到磁盘上而从缓存中清掉,此时又要从磁盘上读回来,这增加了很多开销,同时频繁的移动、分页操作造成了大量的碎片,得到了不够紧凑的索引结构,后续不得不通过OPTIMIZE TABLE来重建表并优化填充页面。

因此,只要可以,请尽量在InnoDB上采用自增字段做主键。
转载https://blog.csdn.net/zheng0518/article/details/76302167

为什么选用自增量作为主键索引相关推荐

  1. mysql.data已拥有为,MYSQL LOAD DATA INFILE忽略重复行(自动增量作为主键)

    我使用LOAD DATA INFILE命令遇到了一些麻烦,因为我想忽略已经在数据库中的行-如果我有一个包含数据的表,如下所示, id |name |age -------------------- 1 ...

  2. MySQL面试:为什么用自增列作为主键

    1.如果我们定义了主键(PRIMARY KEY),那么InnoDB会选择主键作为聚集索引. 如果没有显式定义主键,则InnoDB会选择第一个不包含有NULL值的唯一索引作为主键索引. 如果也没有这样的 ...

  3. mysql索引(六)主键索引

    Mysql索引大概有五种类型: 普通索引(INDEX):最基本的索引,没有任何限制 唯一索引(UNIQUE):与"普通索引"类似,不同的就是:索引列的值必须唯一,但允许有空值. 主 ...

  4. 为什么不推荐使用uuid或者雪花id作为主键?

    欢迎关注方志朋的博客,回复"666"获面试宝典 一.MySQL和程序实例 1.1 要说明这个问题,我们首先来建立三张表 分别是user_auto_key,user_uuid,use ...

  5. 为什么MySQL不推荐使用uuid或者雪花id作为主键?

    点击上方"方志朋",选择"设为星标" 回复"666"获取新整理的面试文章 作者:Yrion cnblogs.com/wyq178/p/125 ...

  6. 主键需要键索引吗_MySQL 索引的知识点都在这里了,建议收藏!

    Java技术栈 www.javastack.cn 关注优质文章 数据库索引,相信大家都不陌生吧. 索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息.作为辅助查 ...

  7. 为什么MySQL不推荐使用 UUID 或者雪花id作为主键?

    作者:Yrion 来源:http://dwz.date/czf4 在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键i ...

  8. 为什么一般用自增列作为主键?

    为什么一般用自增列作为主键? 为什么一般用自增列作为主键? 如果表使用自增主键,那么每次插入新的记录,记录就会顺序添加到当前索引节点的后续位置,当一页写满,就会自动开辟一个新的页 如果使用非自增主键( ...

  9. MySQL 使用自增ID主键和UUID 作为主键的优劣比較具体过程(从百万到千万表记录測试)...

    測试缘由 一个开发同事做了一个框架.里面主键是uuid.我跟他建议说mysql不要用uuid用自增主键,自增主键效率高,他说不一定高,我说innodb的索引特性导致了自增id做主键是效率最好的,为了拿 ...

最新文章

  1. redis源码笔记-endian
  2. 干货 | 双目摄像头实现手势识别,完美还原人体运动手势
  3. 【每日一题】8月14日题目精讲 [SCOI2010]游戏
  4. php设置超链接,怎么给一个PHP密码访问页面加超链接
  5. Linux内核调试sysfs
  6. python编程能有什么用_揭秘python都能做什么?
  7. .net 序列化与反序列化
  8. python从mongodb里取出数据进行可视化_Python数据分析及可视化实例之MongoDB增删改查...
  9. (附源码)PHP疫情上报管理系统 毕业设计 170948
  10. CWE-476: NULL Pointer Dereference(空指针间接引用)
  11. 看《士兵突击》与广告〈某某PLUS〉
  12. Densepose安装教程--依据Github官方教程成功安装
  13. 【Axure高保真原型】用户详细画像可视化原型模板
  14. 初学docker理解二
  15. C++ 已知两个时间(年月日)求日期差
  16. dsp 实验c语言,dsp实验报告 实验1 ccs入门实验2(c语言的使用)
  17. 如何搭建数据指标监测体系?
  18. Python爬虫Scrapy轮子工具
  19. 支付宝新年五福新玩法,我用Python百行代码来实现!
  20. 一文读懂 5G——发展历史、应用场景

热门文章

  1. 【操作系统】—操作系统的发展与分类
  2. 零基础带你学习MySQL—Delete语句以及注意事项(九)
  3. python time模块计时_python中计时模块timeit的使用方法
  4. dataframe groupby_详解pandas中的map、apply、applymap、groupby、agg.
  5. The Number of Products
  6. 散酒到底多少钱才是纯酿的
  7. 私域经济运营能力最关键的三个指标
  8. 创业者没有周末,但有周期
  9. Qt——P10 自定义的信号和槽
  10. 数据库dba_DBA延伸数据库指南