GoldenGate故障案例一则:

抽取进程无法无法捕获数据

⒈ 背景

某软件开发商自己维护的一套Goldengate环境,一共有5个抽取进程,所有的抽取进程状态都为running,但其中的一个抽取进程无法捕获数据变化,该抽取进程所对应的trail文件大小没有任何增长。

开发商无力解决该故障,最终希望我们帮忙看看这个故障。

2. 分析过程

1、首先查看GoldenGate的ggserr.log日志,在日志文件中,没有看到任何的异常日志。

2、对比正常进程和异常进程的配置文件,没有发现任何配置层面的问题。

3、查看异常检查抽取进程的检查点信息,检查点信息如下所示。

GGSCI (ceshi2) 25> info E_CQ,showch

EXTRACT    E_CQ   Last Started 2022-04-14 16:00   Status RUNNING

Checkpoint Lag       01:26:24 (updated 00:00:16 ago)

Log Read Checkpoint  Oracle Redo Logs

2022-04-14 14:33:43  Seqno 416, RBA 127790608

SCN 4038.4242876625 (17347320817873)

Current Checkpoint Detail:

Read Checkpoint #1

Oracle Redo Log

Startup Checkpoint (starting position in the data source):

Thread #: 1

Sequence #: 416

RBA: 127790096

Timestamp: 2022-04-14 14:33:42.000000

SCN: 4038.4242876623 (17347320817871)

Redo File: +DG_DATA/shengchan/onlinelog/group_1108.488.1100857375

Recovery Checkpoint (position of oldest unprocessed transaction in the data source):

Thread #: 1

Sequence #: 416

RBA: 127790096

Timestamp: 2022-04-14 14:33:42.000000

SCN: 4038.4242876623 (17347320817871)

Redo File: +DG_DATA/shengchan/onlinelog/group_1108.488.1100857375

Current Checkpoint (position of last record read in the data source):

Thread #: 1

Sequence #: 416

RBA: 127790608

Timestamp: 2022-04-14 14:33:43.000000

SCN: 4038.4242876625 (17347320817873)

Redo File: +DG_DATA/shengchan/onlinelog/group_1108.488.1100857375

Write Checkpoint #1

GGS Log Trail

Current Checkpoint (current write position):

Sequence #: 1

RBA: 0

Timestamp: 2022-04-14 14:33:05.962312

Extract Trail: ./dirdat/xa

Trail Type: EXTTRAIL

(略……)

从检查点信息可以看出,Recovery Checkpoint和Current Checkpoint已经基本上一致,那说明GoldenGate恢复已经基本上完成。同时也可以看到当前trail文件写的情况,写EXTTRAIL并没有写入,Sequence #: 1,RBA: 0,这说明这个抽取进程应该是刚刚创建。

4、查看异常进程的当前状态,信息如下。

可以看出,该进程的当前状态为:recovery[2] :at EOF,这说明这个抽取进程还没有完成恢复工作,当然也就不会进行数据抽取了。

查看GoldenGate官方文档,对进程的恢复状态进行了说明。

在异常终止事件后的Extract恢复期间出现符号。当Extract在恢复过程中不断更改其日志读取位置时,您可以跟踪其进展。

◆In recovery[1](在恢复[1])——提取正在恢复到其事务日志中的检查点。

◆In recovery[2](在恢复[2])——提取是恢复从其检查点到trail文件结束。

◆Recovery complete(恢复完成)——恢复完成,将恢复正常处理。

该进程一直卡在这个状态,那基本上可以判断与该进程所对应的trail文件有关,所以马上去看下dirdat文件下以xa开头的trail文件,发现当前以xa开头的文件为xa234255,这就很奇怪了,既然这是一套新环境,dirdat目录下怎么会有这些trail文件?

5、找到软件开发商,希望了解更多的细节。经过沟通才了解到新环境的GoldenGate是从老环境中拷贝过来的,他们在新环境中只是重建了抽取进程,但dirdat目录下的文件没有清理掉。

6、至此,应该已经找到问题的所在了。新环境中存在残余的信息,导致抽取进程恢复工作无法完成。把残余的trail文件删除,重启抽取后进程,应该就可以解决故障。

3. 解决方案

在新环境中,删除GoldenGate软件中dirdat目录下存在的残余信息,并重启抽取进程,该抽取进程立刻工作,可以正常抽取数据。

恢复后查看进程信息:

进程当前状态:Recovery complete:at EOF,恢复完成,该进程开始正常处理数据。

GGSCI (ceshi2) 36> info E_CQ,showch

EXTRACT    E_CQ   Last Started 2022-04-14 16:20   Status RUNNING

Checkpoint Lag       00:00:00 (updated 00:00:05 ago)

Log Read Checkpoint  Oracle Redo Logs

2022-04-14 17:43:13  Seqno 416, RBA 380195328

SCN 4038.4243052302 (17347320993550)

Current Checkpoint Detail:

Read Checkpoint #1

Oracle Redo Log

Startup Checkpoint (starting position in the data source):

Thread #: 1

Sequence #: 416

RBA: 127790096

Timestamp: 2022-04-14 14:33:42.000000

SCN: 4038.4242876623 (17347320817871)

Redo File: +DG_DATA/shengchan/onlinelog/group_1108.488.1100857375

Recovery Checkpoint (position of oldest unprocessed transaction in the data source):

Thread #: 1

Sequence #: 416

RBA: 380194832

Timestamp: 2022-04-14 17:43:13.000000

SCN: 4038.4243052302 (17347320993550)

Redo File: +DG_DATA/shengchan/onlinelog/group_1108.488.1100857375

Current Checkpoint (position of last record read in the data source):

Thread #: 1

Sequence #: 416

RBA: 380195328

Timestamp: 2022-04-14 17:43:13.000000

SCN: 4038.4243052302 (17347320993550)

Redo File: +DG_DATA/shengchan/onlinelog/group_1108.488.1100857375

Write Checkpoint #1

GGS Log Trail

Current Checkpoint (current write position):

Sequence #: 1

RBA: 12637521

Timestamp: 2022-04-14 17:43:15.541947

Extract Trail: ./dirdat/xa

Trail Type: EXTTRAIL

(略。。。。。。)

可以看到当前写的位置,写入trail文件,RBA: 12637521,多做几个可以看到rba是在变化,trail文件也在增加。

- END -

GoldenGate案例一则:抽取进程无法捕获数据相关推荐

  1. ogg sqlserver2012 抽取不到日志_ogg抽取进程与数据字典的关系

    01疑惑的源头 从Oracle Goldengate 11.2开始,oracle引入了一种新的capture mode,称为Integrated Capture Mode.传统的capture mod ...

  2. windows下手把手教你捕获数据包

    希望通过这一系列的文章,能使得关于数据包的知识得以普及,所以这系列的每一篇文章我都会有由浅入深的解释.详细的分析.以及编码步骤,另外附上带有详细注释的源码 文章作者:nirvana 经常看到论坛有人问 ...

  3. 手把手教你捕获数据包

    原文链接:http://blog.csdn.net/piggyxp/article/details/24444 前   言 经常看到论坛有人问起关于数据包的截获.分析等问题,幸好本人也对此略有所知,也 ...

  4. 利用WinPcap技术捕获数据包

    前言  随着网络入侵的不断发展,网络安全变得越来越重要,于是网络入侵取证系统的研究也变得日益重要.在网络入侵取证系统中,对网络上传送的数据包进行有效的监听即捕获包是目前取证的关键技术,只有进行高效的数 ...

  5. 进程锁、事件、进程队列、进程间共享数据、生产者消费者模型

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 进程锁(Lock) 锁的基本概念 锁的基本用法 模拟12306抢票软件 信号量:Semaphone 概念 Semaphore ...

  6. OGG抽取进程异常一例

    1.问题现象 出去进程常常running,但是没有新产生trail文件,lag比较大 GGSCI (xxxdb) 3> info all Program Status Group Lag at ...

  7. 【网络编程】---C++实现原始套接字捕获数据包

    C++实现原始套接字捕获数据包 引言 原始套接字与TCP套接字和UDP套接字的区别 原始套接字编程使用的场合 原始套接字的通信过程 (1)基于原始套接字的数据发送过程 (2)基于原始套接字的数据接收过 ...

  8. 【大数据实时数据同步】超级详细的生产环境OGG(GoldenGate)12.2实时异构同步Oracle数据部署方案(中)

    系列文章目录 [大数据实时数据同步]超级详细的生产环境OGG(GoldenGate)12.2实时异构同步Oracle数据部署方案(上) [大数据实时数据同步]超级详细的生产环境OGG(GoldenGa ...

  9. 使用内存映射文件在进程之间共享数据

    数据共享方法是通过让两个或多个进程映射同一个文件映射对象的视图来实现的,这意味着它们将共享物理存储器的同一个页面.因此,当一个进程将数据写入一个共享文件映射对象的视图时,其他进程可以立即看到它们视图中 ...

最新文章

  1. pymysql连接mysql_python使用MYSQL数据库
  2. 基于内容推荐系统中的常识 [ACM暑校]
  3. mysql查询今天_昨天_7天_近30天_本月_上一月 数据_(转载)mysql查询今天、昨天、7天、近30天、本月、上一月数据...
  4. Symmetric Tree (101)
  5. ES6_proxy_note
  6. UI设计新趋势|拟物风格UI设计素材模板
  7. centos6上 tengine本地代理gitlab服务器部署
  8. 降维系列之 LLE 局部线性嵌入
  9. 基于proteus的CPU控制器设计(微程序版)
  10. 软件需求工程 高校教学平台 项目总体计划
  11. 巨波公第3子登国公后裔在荆州(巨波公6子的后裔,全部水落石出)
  12. GIS空间分析(一)——空间分析与GIS
  13. SAP SD跨公司销售案例教程案例介绍
  14. 5、DOC命令获取连接电脑热点的设备的mac、ip
  15. 简约黑板擦特效表白网源码
  16. Arcgis(二) 绘制区域划分示意图——以重庆五大功能区为例
  17. 原创西门子SMART 200 modbus rtu通讯宇电温控器例程
  18. VMbox 安装 LInux系统流程
  19. pannel加载form
  20. 动手创建docker镜像

热门文章

  1. 程序员春节回家装逼反击指南!
  2. 华为云WeLink直播平台——为企业直播保驾护航
  3. QVector如何去重
  4. Visual Studio的sln工程设置VTK、ITK项目
  5. 改变您的HTTP服务器的缺省banner
  6. 解决linux系统mysql Ignoring query to other database问题
  7. 质量英文词汇-医疗器械
  8. linux cp f命令,linux cp 命令
  9. 电脑上的html是什么意思,这几个HTML代码是什么意思?
  10. 第10章 项目质量管理