日志的重要性

  • 日志绝对是数据库的核心.   持久化的日志记录了各种重要的信息.
  • 数据的恢复需要依赖日志。  慢查询sql语句需要用到慢查询日志。以及错误日志中保存着mysqld数据库服务端在启动过程中发生的重大错误信息...

数据库重要组成

本质上来说是一个文件系统 (两大重要组成部分如下)

  1. 数据库,数据表对应文件 (.frm 表结构文件) (.ibd 索引数据文件) 
  2. 日志文件. logfile

日志的分类

  • 错误日志

错误日志是 MySQL 中最重要的日志之一,它记录了当 mysqld 启动和停止时,以及服务器在运行过程 中发生任何严重错误时的相关信息.当数据库出现任何故障导致无法正常使用时,可以首先查看此日志。

  • 查询日志

普通查询日志和慢查询日志.  最主要的还是慢查询日志

设置慢查询时间, 开启慢查询日志, 然后可以通过慢查询日志来分析执行计划来知晓耗时的sql查询操作, 进而进行添加索引优化.   

那么此时我们可以把表分成n个小表,比如订单表按年份分成多个小表等。

慢查询日志的临界时间, 单位s秒

  • 二进制日志

二进制日志(BINLOG)记录了所有的 DDL(数据定义语言)语句和 DML(数据操纵语言) 语句,但是不包括 数据查询语句。语句以“事件”的形式保存,它描述了数据的更改过程。 此日志对于灾难时的数据恢复起 着极其重要的作用。

对于二进制日志, 我们做不到直接的查看, 直接查看看到的也只是一堆乱码, 所以对于二进制日志想要明文的查看, 我们需要借助一定的工具.                 ---  mysqlbinlog工具

  • 很明显我并没有开启二进制日志, 所以我需要在my.cnf配置文件中配置一下, 开启二进制日志相关配置, 同时重启mysqld

不晓得大家开启二进制日志的过程如何,我开启的过程可谓是颇为曲折.

  1. 权限问题. 要确认你有足够的权限访问my.cnf配置文件  chmod  644 /etc/my.cnf
  2. 我没有修改权限之前出现了如此的错误, 导致我配置文件加上的log-bin没有发挥作用
mysql: [Warning] World-writable config file '/etc/my.cnf' is ignored.

说白了就是/etc/my.cnf文件所写的配置被忽略了

没有上述这个警告之后, 我再次进入my.cnf配置文件添加上如下三行配置就OK了

sudo vim my.cnf

log-bin=mysql-bin  #设置二进制日志路径(系统默认设置)
server-id=1        #选取服务器
expire_logs_days=7 #每过七天清理一次日志

写完之后  systemctl restart mysqld.service;  #重启mysqld服务

再次show variables like '%log_bin%';  完美, 它终于开启了.

查看二进制日志: show binary logs; || show master logs;

分析二进制文件的工具, 我们直接看二进制日志看到的就是一堆乱码, 所以我们需要借助通过mysqlbinlog工具(mysql原生自带的工具)可以快速解析大量的binlog日志文件 

语法格式如下:

 mysqlbinlog --no-defaults --database=db_name --base64-output=decode-rows
-v --start-datetime='start time' --stop-datetime='end time'
mysql-bin.000001 | more

--database=数据库名称, 指定数据库.

base64-output: 指定解码方式, 为base64译码形式

start-datetime and stop-datetime: 指定查看二进制日志的时间段, 不指定默认查看全部时间段更改.

mysql-bin.000001 指定解析查看的二进制日志

可以看到如上这样一条插入语句

  • @1 @2 @3指的是三个字段
  • server id: 表示我们在my.cnf中配置的id, 标识
  • at 400 指的是事务在binlog中记录的位置

二进制日志的两个重要的应用场景:主从复制、数据恢复

对于日志的开启, 我们需要在my.cnf数据库配置文件中书写日志文件相应的配置. 然后进行mysqld的restart重启操作即可
systemctl restart mysqld.service;

  • undo log 和 redo log 

redo log 和 undo log日志

数据落盘

  • 定义: 将内存缓冲区中的数据刷新到磁盘上的操作叫做数据落盘, 数据落盘才是真正的持久化. 才是持久化的核心关键
  • 磁盘上的数据才是掉电之后还在的. 内存上的数据都是临时的.
  • 缓冲区的概念:缓冲区完全就是减少和磁盘交互的次数. 提高效率. 平衡CPU和磁盘硬件交互的速度差异性。

redo log:重做日志, 用于记录事务操作的变化, 确保事务的持久性.  redo log事务开始就开始记录。不论是否提交都会记录下来, 在提交的时候将一次完整的事务刷新到磁盘上. 当数据库出现异常的时候 (掉电等等) 就会根据redo log物理日志恢复到掉电前的时刻, 保证数据的完整性. 

redo log buffer 持久化到磁盘上的时机:commit时刻 或者 定时数据落盘

数据落盘是异步落盘的》  并非是同步实时刷新落盘的, 而是一种另外开启新的线程专门用于异步数据落盘的.    -----》   另外开启的线程作用: 要么通过轮询,或者定时检测什么事件进行处理. 此处就是关注数据落盘,  

下图是借鉴的别人的. 

undo log: 回滚日志

undo log 版本链条: 功能: 1.事务回滚操作      2. MVCC的RC和RR隔离级别下面的readview快照读 (RC: 每一条select语句都产生新的快照数据readview. readview快照数据可根据最新版本更新。   RR: 一个事务创建一个readview, 并且是按照第一次select*的数据产生的. 故而重复度不变, 每次都是最开始的readview快照.)

事务回滚场景:   

1. 事务执行过程中出现了error错误,进行回滚操作

2. 掉电后的数据恢复, 先redo log恢复, 再undo log 回滚

数据更新操作到持久化的过程.

怎么说:  脏数据在写入脏数据缓冲区之前首先需要先完成redo log undo log日志相关的缓存操作.

然后redo log在合适(commit 或者1s)的时机完成数据落盘.   

  • 明确第一点: 持久化核心是redo log,重做日志的事情.   undo log的持久化也只是基于redo log实现的. 将undo log的跟新信息写入到redo log中. 

所以:  持久化保存最重要的是redo log日志, undo log的持久化也是基于redo log的.             

自然写日志肯定就是先写redo log日志缓存, 然后就是写的sql究竟是什么, 与什么是强相关的?

肯定是先写old 老数据恢复相关的, 再写新数据恢复相关的. 所以写redo log缓存的时候先写undo log相关的. 再写sql操作新数据恢复相关的 redo log   

日志记录是从什么时候开始的?

事务开启即开始记录相应的日志记录到内存缓冲区. 

undo log 进行数据落盘了吗?  undo log数据落盘的时机是什么?

MySQL中的Undo Log严格的讲不是Log,而是数据,因此他的管理和落盘都跟数据是一样的

上述回答我是借鉴的知乎上的一则回答. 所以既然跟数据落盘管理机制一样,自然落盘也就是

undo log和脏页按照checkpoint进行落盘。

说白了undo log先于数据落盘的办法采取的是记录相应的redo log用于undo log先于数据的落盘保证.  也是对于undo log和数据掉电未持久化到磁盘上恢复的保证.

Mysql的undo log的落盘机制是什么样的? - 知乎

掉电了, 宕机了,如何实现掉电前的脏数据页的恢复?

  1. 重启
  2. 使用redo log恢复数据(恢复脏页数据)
  3. 使用undo log进行事务回滚 (回滚还未commit但是通过redo log操作恢复的数据)

事务执行COMMIT操作时,会将本事务相关的所有redo log都进行落盘,只 有所有redo log落盘成功,才算COMMIT成功. 否则需要进行rollback操作. 也就是使用undo log事务回滚。

小总结: 

  1. 事务进行过程中,每次DML sql语句执行,都会记录undo log和redo log,然后更新数据形成脏数据页
  2. 先写日志缓存, 再写数据缓存
  3. 先写undo log旧数据恢复相关的redo log, 再写新数据恢复相关的redo log
  4. 先写好内存上的缓冲区缓存.   真正的数据落盘, 都是另外开启线程在一定的时机将数据落盘到磁盘上.    脏数据的落盘并不那么紧要, 只要redo log日志实现了落盘. 就完成了真正的持久化, 哪怕脏数据页还没有数据落盘掉点了. 下一次启动还可以根据redo log恢复数据, 以及undo log回滚回到掉电之前的结果      

MySQL日志(undo log 和 redo log 实现事务的原子性/持久性/一致性)相关推荐

  1. 必须了解的MySQL三大日志:binlog、redo log和undo log

    点击上方"方志朋",选择"设为星标" 回复"666"获取新整理的面试文章 作者: 六点半起床 juejin.im/post/68602522 ...

  2. mysql重做日志与binlog日志区别_MySQL日志之binlog、redo log、undo log

    1. binlog(二进制日志) 1.1 binlog介绍 binlog记录了对数据库执行更改的所有操作(不包括查询),还包括了执行数据库更改操作的时间和执行时间等信息.binlog主要有两个作用:恢 ...

  3. [转]MySQL日志——Undo | Redo

    本文是介绍MySQL数据库InnoDB存储引擎重做日志漫游 00 – Undo Log Undo Log 是为了实现事务的原子性,在MySQL数据库InnoDB存储引擎中,还用Undo Log来实现多 ...

  4. 如何解决 bin log 与 redo log 的一致性问题

    如何解决 bin log 与 redo log 的一致性问题 为什么说 redo log 具有崩溃恢复的能力 MySQL Server 层拥有的 bin log 只能用于归档,不足以实现崩溃恢复(cr ...

  5. oracle安装 redo log,Oracle Redo Log 及Logmnr配置使用

    三.日志文件组.日志切换和日志归档 -------------Member 默认情况下,Oracle数据库实例创建完成以后就已创建了3组日志组.每组有两个日志文件(每个日志文件称为Member),每个 ...

  6. 原创 MySQL探秘(八):基于Redo Log和Undo Log的MySQL崩溃恢复流程(一致性)

    黑盒下的更新数据流程 当我们查询数据的时候,会先去Buffer Pool中查询.如果Buffer Pool中不存在,存储引擎会先将数据从磁盘加载到Buffer Pool中,然后将数据返回给客户端:同理 ...

  7. oracle日志重建,在线重建redo log日志组

    -------8月在gx行做的,按照行内标准,实现了将原50M每组共5个redolog日志组重建成100M每组共10组. 1 查看目前的redolog日志组,得知在用的为group4 SQL> ...

  8. oracle redo log恢复,REDO LOG 丢失恢复方法小结

    一.在shutdown immediate情况下 1.SQL> shutdown immediate 数据库已经关闭. 已经卸载数据库. ORACLE 例程已经关闭. 2.删除所有联机日志文件 ...

  9. oracle 误删 log文件,Redo log文件被删除恢复

    1. Redolog file是CURRENT的时候被删除, 清除日志时报错:ORA-01624: SQL> startup mount ORA-32004: obsolete or depre ...

最新文章

  1. idea 配置多个jdk
  2. linux如何ARP嗅探 Linux下嗅探工具Dsniff安装记录
  3. 2017年第八届蓝桥杯 —— 训练题目 —— 空瓶换汽水
  4. Azure Stack运维工具Azure Stack Tools的使用及实战
  5. SegmentFault 美团云采访实录
  6. 《Java设计模式》之代理模式 -Java动态代理(InvocationHandler) -简单实现
  7. (转)汉字转拼音码缩写
  8. logistic 回归分析
  9. 单片机很简单?我们来聊聊如何进阶
  10. freebsd上运行hpool
  11. 项目管理中的冰山理论
  12. 下手重了,我把同事小刘的腿打断了...
  13. Panabit存在命令执行漏洞
  14. TNS-12555 permission denied
  15. Linux启动阶段Grub损坏修复
  16. 输入两个正整数m和n,求出[m,n]区间的所有素数。
  17. HistoryDAO:重塑历史的记录方式
  18. 机器学习--特征降维方法总结
  19. 2023 目标,与君共勉
  20. Django----做一个简单网页的教程(适合初学者)

热门文章

  1. 1046错误mysql_数据库实例:如何解决mysql 1046错误
  2. 【KMP】Radio Transmission(最小循环子串)
  3. 学会Python如何利用业余时间赚外快?分享几个接单途径
  4. Shell编程中的数组定义、遍历
  5. hive URI ${systemjava.io.tmpdir%7D$%7Bsystemuser.name%7D
  6. 实训日志03-学生信息管理系统功能模块(增加,修改,删除,查找)
  7. LWN:万维网之外的选择!
  8. BI技巧丨近两年及当年月份数据汇总
  9. 自动控制原理-频率特性 G(jw ) 定义
  10. IO流的详解,彻底了解IO流