服务器故障:

服务器内两块硬盘掉线,lun丢失。

服务器故障检测分析:

硬件工程师对故障服务器进行检测发现掉线的硬盘没有坏道和其他物理故障,对故障服务器所有硬盘进行镜像备份。

需要进行数据恢复的故障服务器硬盘无物理故障,可以判断硬盘掉线的原因是硬盘读写不稳定,被控制器默认将读写不稳定的硬盘当作坏盘踢出,掉线硬盘数超过了2个后就会导致服务器不可用,此时通过常规方式是无法进行数据恢复的。

通过分析该服务器内的raid条目存储形式,获知每个硬盘的不同块组成一个raid条目,服务器数据恢复工程师解析出来raid条目信息后发现每个LUN都有一份LUN_MAP。EVA将LUN_MAP分别存放在不同的磁盘中,使用一个索引来指定其位置。找出每个磁盘中指向LUN_MAP的索引就可以找到现存LUN的信息了。

服务器数据恢复过程:

1、通过分析确定硬盘是因为性能原因掉线,掉线硬盘中一部分数据是老旧数据。由于LUN的阵列大多是RAID5,只需要将一个LUN的RAID条目通过RAID5的校验算法算出校验值,再和原有的校验值作比较就可以判断这个条目中是否有掉线盘。而将一个LUN的所有LUN_MAP都校验一遍就可以知道这个LUN中哪些RAID条目中有掉线盘。而这些RAID条目中都存在的那个盘就一定是掉线盘。

2、排除掉线盘,然后根据LUN_MAP恢复所有LUN的数据。

3、上述的故障分析以及解决方案需要编写程序实现。北亚数据恢复工程师用编写扫描LUN_MAP的程序扫描全部LUN_MAP,结合人工分析获取最精确的LUN_MAP。

4、数据恢复工程师编写检测RAID条目的程序检测所有LUN中掉线的磁盘,结合人工分析排除掉线的磁盘。

5、数据恢复工程师编写LUN数据恢复程序,结合LUN_MAP恢复所有LUN数据。

6、根据功能需求去编写不同的程序,最后使用LUN数据恢复程序结合LUN_MAP恢复所有LUN的数据。然后人工核对每个LUN,确认恢复出来的数据是否和服务器管理员提出的需求一致。

服务器恢复数据验证:

从服务器管理员那里获知:所有LUN的数据分两块:一部分是Vmware虚拟机,一部分是HP-UX上的裸设备。裸设备里存放Oracle的dbf数据库。由于恢复出来的数据是LUN,无法看到里面的文件,因此需要将这些LUN通过人工来核对哪些LUN是存放Vmware的数据,哪些是HP-UX的裸设备里的Oracle的dbf数据库数据。然后将LUN挂载到不同的验证环境中来验证恢复出来的数据是否完整。

1、在一台服务器上安装ESXI虚拟环境,通过iSCSI的方式将恢复出来的LUN挂载到虚拟主机上。因为ESXI版本的原因无法直接扫描到vmfs卷。于是将所有符合vmware虚拟机的LUN里面的虚拟机文件都生成出来,然后通过NFS共享的方式挂载到虚拟主机上,然后将虚拟机一个一个的添加到清单。

2、验证vmfs虚拟机。通过NFS将所有虚拟机都添加到虚拟主机以后将所有虚拟机开机,所有虚拟机都能正常启动系统。由服务器管理员输入密码进入每个虚拟机的操作系统,验证虚拟机里面的数据,确认恢复出来的数据没问题。至此,本案例数据恢复成功。

【服务器数据恢复】服务器硬盘读写不稳定掉线,lun丢失的数据恢复案例相关推荐

  1. 【服务器数据恢复】HP EVA存储lun丢失的数据恢复案例

    服务器故障&检测&分析: 某品牌EVA存储设备中的RAID5磁盘有两块硬盘掉线,lun丢失.硬件工程师对故障服务器进行物理故障检测,发现掉线硬盘能够正常读取,无物理故障,也没有发现坏道 ...

  2. 【服务器数据恢复】某银行服务器磁盘阵列多块硬盘掉线的数据恢复案例

    服务器数据恢复环境: 某银行服务器,共13块硬盘. 服务器故障&分析: 某公司银行业务突然崩溃,无法正常使用,银行运维人员排查服务器故障,发现服务器有多块硬盘故障离线,上层应用崩溃,服务器无法 ...

  3. 【服务器数据恢复】浪潮服务器硬盘坏道导致raid5瘫痪的数据恢复

    服务器数据恢复环境: 宁夏某单位一台浪潮服务器: 6块SAS硬盘组成的RAID5: 上层分了1个卷,存放Oracle数据库文件. 服务器故障: RAID5中两块硬盘故障离线,指示灯显示黄色,RAID5 ...

  4. 阿里云服务器为什么总是那么不稳定经常崩溃掉线?

    偶尔会看到有站长在抱怨说阿里云服务器不稳定,经常崩溃和掉线等现象,然后就说阿里云的各种不是等.客观上说阿里云在国内的市场占有率还是非常高的,建议大家要购买正规的阿里云服务器,成功购买之后建议专业的人做 ...

  5. 【服务器数据恢复】服务器意外断电导致raid信息丢失的数据恢复

    服务器数据恢复环境: 某品牌服务器riad5,存储的是普通类型文件. 服务器故障: 在正常工作状态下服务器意外断电,服务器管理员重启服务器发现该服务器内的raid信息丢失,服务器无法使用. 服务器故障 ...

  6. 【服务器数据恢复】MDisk重建,vdisk丢失导致数据库不可用的数据恢复案例

    服务器故障: 本案例需要进行数据恢复机器是一台IBM某型号存储,故障为vdisk丢失,操作系统中的Oracle数据库无法正常使用.管理员重建MDisk,把故障存储中的raid10重建为了raid6,然 ...

  7. 【服务器数据恢复】VMFS文件系统RAID5硬盘故障的数据恢复案例

    服务器数据恢复环境: VMware ESX服务器: 服务器文件系统:VMFS: 8块硬盘组建RAID5,4号盘是热备盘. 服务器故障: 服务器两块硬盘指示灯亮黄色,机房管理员检测后初步判断这2块盘出现 ...

  8. 硬盘重新分区后有一个分区表信息丢失的数据恢复

    硬盘重新分区后有一个分区表信息丢失的数据恢复 华山剑客 特别说明: 1.因为这个案例的数据恢复的全过程是通过QQ的远程协助完成的,对方(以下称"网友")对某些软件的操作不是很熟练( ...

  9. 硬盘分区损坏后数据恢复方法[分区恢复,分区修复,分区丢失,数据恢复,数据丢失,数据修复]

    如果硬盘分区损坏,找不到分区,有一种找到数据比较快速的方法,本操作的重点是先找到数据所在分区的开始扇区值及下一个分区的开始扇区值,再开始对这个开始扇区到下一个分区的开始扇区值进行扫描,以找到数据. 涉 ...

  10. 服务器如何判断客户端非正常掉线-心跳连接

    服务器如何判断客户端非正常掉线-心跳连接 心跳:如果不主动关闭socket的话,系统不会自动关闭的,除非当前进程挂掉了,操作系统把占用的socket回收了才会关闭.为什么需要心跳连接主要是判断当前连接 ...

最新文章

  1. 利用Nginx轻松实现Ajax的跨域请求(前后端分离开发调试必备神技)
  2. Java中数组以及集合
  3. python海龟图 如何控制线的粗细_使用Python中的高级turtle(海龟)作图方法
  4. I. Space Station(hash记忆化+dp)
  5. 剑指Offer - 面试题38. 字符串的排列(全排列,排序,回溯+剪枝)
  6. 鸿蒙系统替代iOS,华为横空出世!鸿蒙系统,能否替代安卓IOS?
  7. linux vfs 根节点名称,Linux:文件,目录项,索引节点,超级块,VFS,具体文件系统...
  8. 深入浅出ES6教程模块化
  9. 利用Matlab绘制图像中的某一行或者某一列的灰度曲线
  10. iOS工作中的经验总结—马甲包审核以及常见审核问题!!!(干货)
  11. 归并排序(MergeSort)
  12. 微信扫码跳转浏览器下载app
  13. 极路由第三方插件大全_极路由极硬货HC5663春节折腾记
  14. 深蓝学院-视觉SLAM课程-第4讲作业(T5矩阵微分,T6手写高斯牛顿,T7批量MLE)
  15. SATA 3.3协议 Error handing机制
  16. Mikrotik路由器(routerOS)调试环境搭建
  17. 人工智能前沿——无人自动驾驶技术
  18. python迭代器问题
  19. 生花妙笔信手来 | 基于 Amazon SageMaker 实现 AI 模特换衣
  20. linux图形编程,linux图形界面编程基本知识

热门文章

  1. 专题详解-5G接入控制:CAG新特性(3)-end
  2. 国足0:2不敌韩国 淘汰赛将战泰国
  3. java数组的四种拷贝方式
  4. 详细教程-阿里网盘部署本机
  5. linux跨平台通信软件,下载:跨平台即时通信工具Pidgin 2.7.5
  6. 组件化之路 - ViewBinding基类封装
  7. C语言编程的双大于号,VC 双小于 双大于号
  8. 软件测试之客户端(Client)测试
  9. 腾讯笔试经验-不是大牛-勿看
  10. javascript 域名合法性检测