参考文档:

Auto disk management feature in Exadata (Doc ID 1484274.1)
EXADATA AUTO MANAGEMENT INITIATE DROP AND ADD OF THE GRIDDISKS (Doc ID 1599448.1)

上次对exadata换盘,没有太留意log信息。

这次对exadata换盘,留意了以下相关log信息。有一些xdwk进程。

换盘步骤:

周一; 在asm层面把grid disk drop掉

周五;硬盘到了以后,把坏盘拔掉,插上新盘。

在周一正常drop掉griddisk后,asm层面的alert log中有以下提示,大约5分钟一次。

Thu Nov 03 22:50:43 2022
XDWK started with pid=40, OS id=382866
Thu Nov 03 23:05:46 2022
Starting background process XDWK
Thu Nov 03 23:05:46 2022
XDWK started with pid=40, OS id=31173
Thu Nov 03 23:20:49 2022
Starting background process XDWK
Thu Nov 03 23:20:49 2022
XDWK started with pid=40, OS id=79593
Thu Nov 03 23:35:52 2022
Starting background process XDWK
Thu Nov 03 23:35:52 2022
XDWK started with pid=40, OS id=127598
Thu Nov 03 23:50:55 2022
Starting background process XDWK
Thu Nov 03 23:50:55 2022
XDWK started with pid=40, OS id=173112
Fri Nov 04 00:05:58 2022
Starting background process XDWK
Fri Nov 04 00:05:58 2022

同时,在XDWK的trace文件中发现以下信息:

*** 2022-11-02 11:30:33.033
*** SESSION ID:(788.329) 2022-11-02 11:30:33.033
*** CLIENT ID:() 2022-11-02 11:30:33.033
*** SERVICE NAME:() 2022-11-02 11:30:33.033
*** MODULE NAME:() 2022-11-02 11:30:33.033
*** ACTION NAME:() 2022-11-02 11:30:33.0332022-11-02 11:30:33.032987 : kxdam_is_disk_offline: Operation ID: 614109:   in diskgroup  Failed.SQL    : /* Exadata Auto Mgmt: Is Disk in the given MODE_STATUS */
select count(disk_number) from v$asm_disk_statwherename='DATA_PROD_CD_02_PRODCEL03'andmode_status='OFFLINE'andgroup_number in(select group_number from v$asm_diskgroup_statwherename='DATA_PROD'andstate in ('MOUNTED', 'RESTRICTED'))Cause  : Disk not found in offline state.Action : Check if disk has been dropped from the diskgroup.If so manually add disk back to the diskgroup.Ignore this error if disk is part of the diskgroup.

同时,手工查询这些语句,没有返回值。

[grid@xxxx01 trace]$ sqlplus /nologSQL*Plus: Release 11.2.0.4.0 Production on Wed Nov 2 11:37:22 2022Copyright (c) 1982, 2013, Oracle.  All rights reserved.SQL> conn / as sysasm
Connected.
SQL> select count(disk_number) from v$asm_disk_stat2    where3      name='RECO_PROD_CD_02_PRODCEL03'4      and5      (path='o/192.168.0.5/RECO_PROD_CD_02_prodcel03' or mode_status='OFFLINE')6        and7      group_number in8        (9         select group_number from v$asm_diskgroup_stat10           where11             name='RECO_PROD'12               and13             state in ('MOUNTED', 'RESTRICTED')14        );COUNT(DISK_NUMBER)
------------------0SQL> 

通过查询MOS,MOS上关于XDWK进程是这样说明的:(看下面的文档,会自动把盘添加到ASM里面去,实际上并没有自动添加到ASM里面去,需要手工添加到ASM里面。可能与人工drop掉磁盘有关,而不是由exadata自动drop掉由问题的盘)

3. Automatic Storage Management

The Automatic Storage Management (ASM) instance runs on the compute (database) node and has two processes that implement the auto disk management feature:

  • Exadata Automation Manager (XDMG) initiates automation tasks involved in managing Exadata storage. It monitors all configured storage cells for state changes, such as a failed disk getting replaced, and performs the required tasks for such events. Its primary tasks are to watch for inaccessible disks and cells and when they become accessible again, to initiate the ASM ONLINE operation.
  • Exadata Automation Manager (XDWK) performs automation tasks requested by XDMG. It gets started when asynchronous actions such as disk ONLINE, DROP and ADD are requested by XDMG. After a 5 minute period of inactivity, this process will shut itself down.

当拔出磁盘后,ASM的alert log中,不在显示XDWK的信息。

接下来换盘

换盘后,在cell存储的alert.log中有以下信息:可以看到Grid Disk自动创建了。

2022-11-04T09:37:34.508930+08:00
create CELLDISK CD_02_prodcel03 on device /dev/sds
2022-11-04T09:37:34.604668+08:00
create GRIDDISK DATA_prod_CD_02_prodcel03 on CELLDISK CD_02_prodcel03 type 0
GridDisk name=DATA_prod_CD_02_prodcel03        guid=5d3d5a26-b1fd-44c2-9e97-5cd3d640a107 (2749608172) status=GDISK_ACTIVE
2022-11-04T09:37:34.655927+08:00
create GRIDDISK RECO_prod_CD_02_prodcel03 on CELLDISK CD_02_prodcel03 type 0
GridDisk name=RECO_prod_CD_02_prodcel03        guid=7743d6e9-1537-4bd8-bc6c-a43a10985ede (3983708148) status=GDISK_ACTIVE
2022-11-04T09:37:34.685691+08:00
create GRIDDISK DBFS_DG_CD_02_prodcel03 on CELLDISK CD_02_prodcel03 type 0
GridDisk name=DBFS_DG_CD_02_prodcel03         guid=60463395-c176-4edd-8d57-875900f06b9e (4287003124) status=GDISK_ACTIVE  

接下来,将griddisk添加到ASM层面,结束。

END

exadata的xdwk进程相关推荐

  1. 上海Oracle用户组我的页面

    上海Oracle用户组 SHOUG,走近全系Oracle技术和数据库专家 Menu Skiptocontent 活动 SHOUG成员 CategoryArchives:SHOUG成员 SHOUG成员– ...

  2. Oracle 11g 的 VKTM 进程 - virtual keeper of time

    链接:http://www.eygle.com/archives/2012/06/oracle_11g_vktm.html 在Oracle Database 11g中,VKTM是一个新增的后台进程.这 ...

  3. Oracle Exadata 一体机关机过程(虚拟机环境)

    编辑好cell,db节点信息文件all_group,dbs_group,cell_group [root@idc-dns1 exatest]# pwd /root/exatest [root@idc- ...

  4. 【RAC】使用一条“ps”命令获取Linux环境下全部RAC集群进程信息

    如何仅使用一条ps命令便能获取到所有与RAC集群进程相关的信息.   从所使用的命令角度上看很简单,仅需使用ps命令结合grep命令便能实现.问题关键是需要确定检索哪些关键字. 1.与RAC集群有关的 ...

  5. 【力荐】Exadata火线救援:10TB级数据修复经典案例详解!

    凌晨1点半,朦胧中电话铃狂响,某Exadata严重故障--. 跟Salesforce巧合的是,大家都是运行在Exadata上,不幸的是Salesforce丢失了4个小时数据(后续没看到新闻稿,是否又追 ...

  6. Exadata Griddisk Can't be auto added

      近日遇到Exadata 的磁盘故障,在更新完physical disk后,其中一个griddisk没有自动添加的到ASM实例中,在问题解决后,整理出整个问题分析的思路. 1.在磁盘失败的情况下,如 ...

  7. oracle集群启动状态,循序渐进:Oracle 11.2 RAC集群进程的初始化与启动过程

    张大朋(Lunar)Oracle 资深技术专家 Lunar 拥有超过十年的 ORACLE SUPPORT 从业经验,曾经服务于ORACLE ACS部门,现就职于 ORACLE Sales Consul ...

  8. Exadata 的诊断工具之 sundiag.sh

    每个Exadata的数据库服务器和存储服务器节点都安装了sundiag.sh脚本(MOS:761868.1) 我们执行下: [root@erpdb01 ~]# find /opt -name sund ...

  9. Exadata存储服务器(又称Exadata存储单元)

    存储单元可以说是让Exadata如此大规模普及并且使用效果优异的核心要素. I/O性能问题始终是Exadata存储或者存储服务器尽力去解决的问题. Exadata存储服务器概述 Exadata数据库一 ...

最新文章

  1. odbc java 驱动程序_Java访问数据库程序,提示[Microsoft][ODBC 驱动程序管理器] 未发现数据源名称并且未指定默认驱动程序错误...
  2. zynq学习02 新建一个Helloworld工程
  3. UA MATH565C 随机微分方程VI 扩散过程简介
  4. 比较双曲正切tanh与sigmoid激活函数的性能差异
  5. LaTeX文档插入图片的几种常用方法
  6. C#开发VS LUA开发
  7. 去掉a标签下划线_条码软件如何修改条码标签的字体格式
  8. java方向好看的书
  9. 派生类构造的时候一定要调用_没钱的时候,一定要记住这三个教训
  10. 埋坑一: vue中子组件调用兄弟组件方法
  11. Python在视频处理上的优势有哪些
  12. 华为的鸿蒙系统是安卓吗,华为鸿蒙,一个本属于2025年的产品
  13. Microsoft Agent技术在Delphi中的应用
  14. 【web前端开发】vs code插件推荐
  15. win8/8.1安装不了.net 4.6.2版本的解决方法
  16. 周伟焜:IBM为何重造信仰
  17. 没有什么能够毁灭一个人的灵魂
  18. 电视软件测试项目怎么做,LED_TV液晶电视软件测试用例.doc
  19. vps虚拟服务器主机,vps虚拟服务器主机
  20. 基于Spring Boot应用Apache CXF发布Web Services服务

热门文章

  1. 迈克尔•波特的“五力模型”中,最明显的竞争状态是()国开个人与团队管理知识点解析
  2. CIO:云计算数据中心运维管理要点
  3. 安装super-gradients包时遇到的一些错误
  4. 异或运算符的性质及使用
  5. Robust Double-Encoder Network for RGB-D Panoptic Segmentation
  6. 计算机二级15套Excel操作步骤,计算机二级Excel操作步骤
  7. RoBERTa VS BERT
  8. 小米2020软件开发 编程题1
  9. 掷骰子 概率 动态规划
  10. GCC 11 的静态分析功能将得到增强