客户系统数据库意外关闭了,查看数据库故障时间的警告日志:

发现在故障时间,数据库的警告日志中出现了大量的IO错误,最终导致数据库的核心进程出现错误,导致数据库意外关闭。

既然出现了IO错误,我们肯定需要关注下操作系统的日志:

这里截取其中的几行我们分析下:

Jan 8 14:29:55 zrdb-1 kernel: qla2xxx 0000:18:00.0: LOOP DOWN detected (2).

Jan 8 14:29:55 zrdb-1 kernel: qla2xxx 0000:18:00.0: LOOP DOWN detected (2 5 0).

Jan 8 14:29:56 zrdb-1 kernel: bnx2: eth0 NIC Copper Link is Down

Jan 8 14:29:56 zrdb-1 kernel: eth2: Link is Down

Jan 8 14:29:56 zrdb-1 kernel: bonding: bond1: link status definitely down for interface eth2, disabling it

Jan 8 14:29:56 zrdb-1 kernel: bonding: bond1: making interface eth3 the new active one.

Jan 8 14:29:56 zrdb-1 kernel: bonding: bond0: link status definitely down for interface eth0, disabling it

Jan 8 14:29:56 zrdb-1 kernel: bonding: bond0: making interface eth1 the new active one.

Jan 8 14:30:25 zrdb-1 kernel: port-3:0-1: blocked FC remote port time out: saving binding

Jan 8 14:30:25 zrdb-1 kernel: sd 3:0:0:0: SCSI error: return code = 0x00010000

Jan 8 14:30:25 zrdb-1 kernel: end_request: I/O error, dev sdb, sector 1662453767

Jan 8 14:30:25 zrdb-1 kernel: Buffer I/O error on device sdb1, logical block 207806713

Jan 8 14:30:25 zrdb-1 kernel: lost page write due to I/O error on sdb1

Jan 8 14:30:25 zrdb-1 kernel: Buffer I/O error on device sdb1, logical block 207806714

Jan 8 14:30:25 zrdb-1 kernel: lost page write due to I/O error on sdb1

。。。

Jan 8 14:30:28 zrdb-1 kernel: Aborting journal on device sdb1.

Jan 8 14:30:28 zrdb-1 kernel: sd 3:0:0:0: SCSI error: return code = 0x00010000

Jan 8 14:30:29 zrdb-1 kernel: end_request: I/O error, dev sdb, sector 1981510079

Jan 8 14:30:30 zrdb-1 kernel: ext3_abort called.

Jan 8 14:30:31 zrdb-1 kernel: EXT3-fs error (device sdb1): ext3_journal_start_sb: Detected aborted journal

Jan 8 14:30:34 zrdb-1 kernel: Remounting filesystem read-only --这里文件置为了只读状态

。。。

同样在数据库故障时间段内,操作系统的日志中也报出了大量的IO 错误,然后文件系统出于对磁盘数据的保护,把所在的分区置为只读状态了,从而导致了数据库意外关闭。

不过需要注意的是在报出IO错误之前,网卡down掉了,而且fc的连接也断开过一次,而查看fc存储的日志,发现这个时间段也存在一次意外的中断。

所以推断这一故障的原因很可能是因为网络和fc中断后,导致了fc存储对应的文件系统读取出现了较多的IO错误,而操作系统处于安全考虑将该分区重新置为只读状态,而数据库的核心进程dbwn和lgwr进程由于无法完成写入动作,最终强制将数据库关闭。

此时的解决办法其实很简单的,需要重新把上述所在的磁盘分区重新挂载为可读写状态,然后重新启动数据库。

关于文件系统只读,小鱼以前也遇到了很多次,只是每次小鱼都是直接重新挂载就好了,没去过多分析为什么出现文件系统只读,今天借助这个故障的分析,让我们维护人员应该更多的去了解操作系统、存储和网络,这个虽然不一定是我们所擅长,但是一些基本的我们还是必须去掌握,当然这跟实际的工作环境相关。

Good luck!

fc oracle,ORACLE数据文件系统只读(FC中断引起)转载【xiaoyu】相关推荐

  1. oracle dataguard详解,Oracle DataGuard数据备份方案详解

    Oracle DataGuard是一种数据库级别的HA方案,最主要功能是冗灾.数据保护.故障恢复等. 在生产数据库的"事务一致性"时,使用生产库的物理全备份(或物理COPY)创建备 ...

  2. Oracle单实例下oracle数据库从文件系统迁移到ASM上

    第一步:启动ASM实例(+ASM) [oracle@oracle ~]$ export ORACLE_SID=+ASM [oracle@oracle ~]$ sqlplus / as sysdba S ...

  3. 简述oracle的主要数据库对象,Oracle数据库数据对象分析

    Oracle数据库数据对象分析 Oracle数据库数据对象中最基本的是表和视图,其他还有约束.序列.函数.存储过程.包.触发器等.对数据库的操作可以基本归结为对数据对象的操作,理解和掌握Oracle数 ...

  4. oracle更新数据没反应,ORACLE更新数据时如果有就更新没有就插入

    SQL写法: begin update table_name set salary = 10000 where emp_id = 5; if sql%notfound then insert into ...

  5. export Oracle_sid =asm,单实例下oracle数据库从文件系统迁移到ASM上

    第一步:启动ASM实例(+ASM) [oracle@oracle ~]$ export ORACLE_SID=+ASM [oracle@oracle ~]$ sqlplus / as sysdba S ...

  6. Oracle DataGuard数据备份方案详解

    Oracle DataGuard是一种数据库级别的HA方案,最主要功能是冗灾.数据保护.故障恢复等. 在生产数据库的"事务一致性"时,使用生产库的物理全备份(或物理COPY)创建备 ...

  7. oracle 抽样_利用ORACLE实现数据抽样

    做数据分析的,免不了碰到记录数据量很大,怎么办? 做全面分析是不现实也没有必要. 介绍一下抽样方法及实现 几种常用的抽样方法: 1.简单随机抽样(simple random sampling) 将所有 ...

  8. oracle 抽样_利用ORACLE实现数据抽样(sample block)

    转自:http://blog.sina.com.cn/s/blog_4b13ec250100wm14.html 做数据分析的,免不了碰到记录数据量很大,怎么办? 做全面分析是不现实也没有必要. 介绍一 ...

  9. oracle 抽样_[转载]利用ORACLE实现数据抽样

    做数据分析的,免不了碰到记录数据量很大,怎么办? 做全面分析是不现实也没有必要. 介绍一下抽样方法及实现 几种常用的抽样方法: 1.简单随机抽样(simple random sampling) 将所有 ...

  10. VB.NET通过OleDbConnection连接oracle查询数据示例

    一.前言 1.目的 本文实现了VB.Net通过OleDbConnection连接oracle查询数据,并展示数据到TextBox1. 2.数据库版本 select * from v$version; ...

最新文章

  1. parcel react_如何使用Parcel捆绑React.js应用程序
  2. 近期活动盘点:数据化思维困局和0.01突破讲座、极简大数据决策,培养数据化思维讲座...
  3. 朴素贝叶斯分类器的应用-转载加我的理解注释
  4. 新版PyTorch发布!新增TorchScript API,扩展ONNX导出……4大功能更新值得关注
  5. 汇编中的字符串操作指令
  6. 【C 语言】数组 ( 数组指针 | 数组指针定义 | 使用 数组类型* 定义数组指针 )
  7. oracle错误:1067进程意外终止
  8. php 通过类名获取类的文件地址
  9. 线性表----链式表
  10. 云原生全球最大峰会之一KubeCon首登中国 Kubernetes将如何再演进?
  11. java 判断两个数是否异号
  12. poj3280 Cheapest Palindrome(回文串区间dp)
  13. android 播放器 对比,播放器哪个最好用(五款最强播放器最全对比)
  14. Ubuntu 系统 代码比对工具Meld Diff 下载与使用介绍
  15. uniapp 实现高德地图导航
  16. 计算机基础知识如何打钩,Word的方框中怎么输入√号?教你快速在Word中输入对号(打钩)-电脑自学网...
  17. 网络安全-利用sniffer抓包软件,分析IP头的结构(详解)
  18. excel不同文件表格批量加表头vba_多个excel表格自动汇总|如何把两个文件表格用VBA从另一个EXCEL表格导入数据到这个表格中?...
  19. localhost无法访问的问题
  20. 读论文 Automatic generation and detection of highly reliable fiducial markersnunder occlusion

热门文章

  1. 《操作系统导论》期末复习知识点整理
  2. C# 功能“递归模式“在c#7.3中不可用。请使用8.0或者更高的语言版本
  3. 【转】关于Git Credential Manager for Windows
  4. qt 指示灯 状态灯 红绿灯 LED灯:使用QLabel实现
  5. props default 数组/对象的默认值应当由一个工厂函数返回
  6. Castellano 西班牙语学习——Castellano字母发音
  7. 来之不易的新家,每一处都是经过精雕细琢,最终效果棒极了
  8. 如何使用myEclipse来生成hibernate所需文件
  9. SpringCloud之服务发现
  10. prestashop 隐藏 index.php,prestashop1.6版本nginx伪静态规则