前言

DB2的锁管理机制一直为DB2应用开发人员和DBA所诟病。对其锁机制不理解的直接后果就是导致锁超时和死锁的发生。所以监控并分析锁超时和死锁,应是每个DB2 DBA的居家必备生存技能。本文记录了公司生产环境数据库发生锁超时后的分析、处理过程,如有表述不当之处,欢迎指正。

数据库环境

DB2 pureScale V10.5 FP5。

问题背景

我司生产环境某数据库每天下午15:40~15:50会报锁超时。经查明,问题发生时间正好是每日集中跑批时间。

DB2锁超时设置

为了能抓到锁超时的Requestor和Owner,需要对数据库进行适当配置。

设置TIMEOUT注册变量

db2set DB2_CAPUTRE_LOCKTIMEOUT=ON

一旦发生锁超时,会在~/sqllib/db2dump/DIAG000{0,1}/路径下面生成 db2locktimeout.1.5493.2017-05-25-15-49-01 文件。

设置db2cos

仅有db2locktimeout*文件中的信息不足以定位Lock Requestor的具体语句。因此,我们在生产环境还启用了db2cos脚本,捕获更详细的应用信息。该脚本位于 ~/sqllib/bin/db2cos中。

我们对触发命令进行了改造,以便抓取更多信息:
转存失败重新上传取消
“#”号注释的命令为原始命令,此处替换成下一行的新内容。

修改完脚本后,执行以下命令使脚本生效:

db2pdcfg -catch 911,68 count=255

一旦发生锁超时,便会触发db2cos脚本,在DIAG目录下面生成捕获的文件,
格式为:$pid.$eduid.$dbpart.db2pd.${database}.txt
例如:202484.5493.001.db2pd.PTSMGMDB.txt

分析锁超时报告

首先分析db2locktimeout.1.5493.2017-05-25-15-49-01 报告的内容:
转存失败重新上传取消
转存失败重新上传取消
报告里描述了Lock Requestor和Lock Owner详细信息,包括锁超时发生时间,锁类型(Table lock)和加锁的资源ID(obj={4;136})。通过表和表空间ID,我们可以执行以下语句定位被锁的表名:
转存失败重新上传取消
Lock Requestor应用程序名称为db2bp,它是CLP后端进程的名称。但是在db2locktimeout文件中,我们看不到Requestor的语句,这个可以通过查看db2cos脚本抓到的202484.5493.001.db2pd.PTSMGMDB.txt文件得到。

再来看Lock Owner,显示占用表的应用是package,可以知道package的名字PTSDAYOFFPUB和版本号V1.1.0_P25,并且当时执行了两条SQL语句11和12,可以通过SYSCAT.STATEMENTS查找执行语句内容,但是因为此查询可能会导致尝试更新SYSCAT.STATEMENTS目录视图的其他应用程序发生竞争,所以查询时最好使用UR隔离级别。
转存失败重新上传取消
可以发现只有编号位11的查询table是T_BASE_QWDZLSB ,因此可以确定该语句导致了对表加锁,其隔离级别为CS,会产生一个IS锁。

再来看下202484.5493.001.db2pd.PTSMGMDB.txt,定位Lock Requestor语句,原始文件中内容很多,我们对其进行了剪裁,提取出关键部分。

首先看Locks:段的信息:
转存失败重新上传取消

TranHdl 287的Sts为G,表明占有锁;TranHdl 272的Sts为W*,表明正在等待。接着根据Locks being waited on:段映射TranHdl和AppHandl,知道272的AppHandl为111774 。
转存失败重新上传取消

而111774 当前执行语句信息为C-AnchID和C-StmtUID为781和1,根据这两个值定位到Dynamic SQL Statements:段
转存失败重新上传取消

可以发现执行语句为LOCK TABLE t_base_qwdzlsb IN EXCLUSIVE MODE 。

同样可以在Application:段中查看更详细信息:
转存失败重新上传取消
转存失败重新上传取消

至此,可以总结导致锁超时的root cause:

PTSDAYOFFPUB执行了SELECT * from T_BASE_QWDZLSB语句,对表加了IS锁;而后在CLP中又执行了LOCK TABLE t_base_qwdzlsb IN EXCLUSIVE MODE语句(之后发现由IMPORT操作引起),请求一个X表锁。而IS和X锁是不兼容的,X锁会一直等待IS锁释放,超过系统设置的30秒超时时间,从而发生锁超时。
转存失败重新上传取消
转存失败重新上传取消

总结

1、定位造成锁超时的语句后,我们让项目组修改了package中的查询游标,加上WITH UR,但是锁超时依旧在报?这是为什么呢?

因为虽然显式地指定了SQL 语句的隔离级别为UR,但是,由于DB2中的游标是模糊游标 (没有显式地声明游标是只读的还是可更新的),因而系统会默认地将这个模糊游标当成可更新游标处理,在 UR 下,可更新游标的工作方式就像隔离级别为CS一样。要避免这种升级,可以采用以下办法:

修改应用程序中的游标,使游标变成非模糊游标。将 SELECT 语句更改为SELECT * from table_name FOR READ ONLY WITH UR子句。

2、在报告中看到了Lock Requestor的LOCK TABLE语句,未在脚本或程序里发现,是什么引起的?

经过分析,发现该语句是由IMPORT Utility引起。

IMPORT支持两种表锁定方式:脱机或ALLOW NO ACCESS方式;以及联机或ALLOW WRITE ACCESS方式。ALLOW NO ACCESS方式会阻止并行应用程序访问表数据,ALLOW WRITE ACCESS方式允许并行应用程序同时对导入目标表进行读写访问。如果未显示指定任何方式,那么IMPORT默认为ALLOW NO ACCESS,同时,默认情况下会使用RS绑定数据库,因此可以改造IMPORT语句:

 
  1. IMPORT FROM xx.ixf of ixf ALLOW WRITE ACCESS COMMITCOUNT 5000 INSERT INTO table_name

如上所述分析锁超时的步骤还是很繁琐的,而且需要一定的技巧和概念基础,需要:

  • 知道如何抓取锁超时
  • 了解不同隔离级别的区别
  • 了解DB2锁机制
  • 掌握IMPORT,CURSOR等基本操作

但只要多分析,多查资料,就可以将整个分析过程进行流程化,后期就能和自动化运维工作结合起来。

DB2数据库锁超时问题的分析与排查相关推荐

  1. 达梦数据库锁超时问题处理

    模拟问题场景:创建了一张表,在表中插入数据,未提交,开启另一会话创建索引,提示锁超时. 解决办法: 1.select * from v$lock(查询数据库表的锁的情况) 2.select * fro ...

  2. 达梦数据库锁超时的解决办法

    1.锁超时的报错 2.解决办法 select * from v$lock(查询数据库表的锁的情况) select * from sysobjects(查询对象信息) select * from v$s ...

  3. Dm数据库锁超时报错

    Dm数据库锁超时 Dm数据库中内置表结构: 1.select * from v$lock(查询数据库表的锁的情况) 2.select * from sysobjects(查询对象信息) 3.selec ...

  4. 如何对DB2数据库做性能分析?

    如何对DB2数据库做性能分析? 第一步 操作系统级别性能 CPU监控: ps -elf | sort +5 -rn | more 第6列代表CPU使用的计数器 I/O使用率: iostat -D 收集 ...

  5. 达梦数据库删除表提示锁超时问题

    1.问题描述 在执行删除表操作的时候,提示锁超时问题: 2.问题分析 经分析,出现该问题的一般是该表还有其他用户在进行增删改操作,可以通过查看阻塞会话.可以通过查杀阻塞会话后再进行删除表的操作. 3. ...

  6. Db2数据库中常见的堵塞问题分析与处理方法

    Db2 数据库堵塞怎么办 作为一个数据库管理员,工作中经常会遇到的一个问题:当数据库出现故障的情况下,如何快速定位问题和找到解决方案.尤其是在运维非常重要系统的时候,解决问题恢复服务是分秒必争.Db2 ...

  7. informix 数据库锁表分析和解决方法

    informix 数据库锁表分析和解决方法 参考文章: (1)informix 数据库锁表分析和解决方法 (2)https://www.cnblogs.com/kongzhongqijing/arti ...

  8. DB2中使用事件监控器抓取锁超时、死锁信息

    锁事件监控器可以抓取死锁.锁超时事件,包含这些事件发生时应用正在执行的SQL语句. 具体的介绍可以参考下面的官方文档: http://www.ibm.com/developerworks/cn/dat ...

  9. DM达梦数据库删除表时提示锁超时的解决方法

    DM 达梦数据库删除表时提示锁超时的问题 1. 问题描述 达梦数据库删除表时,删除失败,提示的报错信息是 锁超时 2. 解决方法 查询所删除表对应的SESS_ID,sql语句如下: select a. ...

最新文章

  1. 电脑记事本_办公便签记事本
  2. VS2005中重构的用法
  3. java 重载 : 1.参数个数不同,2.参数类型不同
  4. 苹果证实收购Drive.ai自动驾驶汽车初创公司
  5. 青茶什么时候拆_为什么铁观音这么香?到底有没有添加香精?看完你就知道了...
  6. 阿里云服务器Debian11系统安装Linux宝塔面板 搭建WordPress个人博客
  7. Ubuntu下安装最新版QQ
  8. 关于产品与数据该如何结合的一点想法(一)
  9. Project Chameleon Work In Progress 12
  10. ASP.NET MVC - 用户验证和权限验证
  11. 高低温试验箱的11点使用注意事项说明
  12. 模拟一个简单的购房商贷月供计算器,按照以下公式计算总利息和每月还款金额:总利息=贷款金额×利息。 每月还款金额=(贷款金额×总利息)÷ 贷款年限。
  13. 全角空格可复制粘贴,解决字符对齐问题
  14. 计算基因组外显子长度
  15. 一个父亲对新婚女儿的自白
  16. Storm Windowing(翻译)
  17. PhpSpreadsheet 基本使用和导入 导出 模版生成Excel文件
  18. Linux环境下二进制安装PostgreSql
  19. 超简单的页眉页脚设置(摘要、目录页眉不同、页脚页码连续)
  20. 我的物联网项目(三十一) 分销模式电商平台

热门文章

  1. ipa在线安装搭建_iOS 13.6.1 插件首次兼容,掉签教你临时安装
  2. 在电脑上如何下载多御安全浏览器到桌面?
  3. 罗永浩出售锤子空气净化器业务;Tim Cook 推特名改为 Tim Apple ;Windows 10 设备超过 8 亿 | 雷锋早报...
  4. python实现五子棋续
  5. Css 实现漂亮弧形
  6. LeetCode题解(1533):找到最大整数的索引(Python)
  7. gvim(win7版)和vundle,配置各种插件
  8. 3.1 相关系数(person与spearman)
  9. 高手进阶,终极内存技术指南——完整/进阶版 sdram内部原理
  10. 炫酷的流动爱心最近很火 来吧 代码已奉上