DELL SC4020 或者DELL SCv2020/2000控制器更换过程中,很多客户会遇到问题,下面简单介绍下可能遇到的问题和一些处理办法:

先说明一下,DELL SC的不同generation,就是不同代的更换方式是不同的,这里仅仅是针对SC4020/Scv2000的,老的或者新的SC3000/5000/7000/8000/9000 等是有所不同的。

首先我们来看看官方service manual guide中的更换流程,很多工程师就是拿着这个文档来做更换的,然后不成功,还不知道怎么回事,反复就说控制器有问题。

第一步先要找到故障的控制器,这个比较容易,但也有人搞错,DELL SC把上下两个控制器分别称之为 TOP controller(顶部控制器)和bottom controller(底部控制器)。将故障控制器抽出来的时候要注意呀,已经遇到好几次,由于上下两个控制器的把手是一起的,结果抽错位置了,然后就悲剧了,好的控制器也宕机了。

下面是官方流程,中间的坑我们一一来给大家说明下:

  1. Make sure all the cables are labeled.
  2. Disconnect all the cables from the storage controller that was shut down.

前两步不用解释了,是个攻城狮都知道。线缆标记,然后把线拔掉。

3. Remove the battery from the storage controller.

把电池先拔掉,这个需要注意些。如果控制器彻底挂了就无所谓。但是如果控制器还没有彻底挂。如果直接把控制器,很可能会导致dirty cache,就是内存中的数据没有刷入硬盘,有数据丢失的风险。

4. Push down on the release tab of the storage controller and pull the release lever away from the  chassis.

NOTE: Wait until all the storage controller indicators are off before removing the storage controller.

松开卡口,控制器就自动出来一些了。然后等控制器上的LED灯全部熄灭再彻底抽出来。

5. Grasp the release lever and pull the storage controller away from the chassis.

6. Locate the battery removed in a previous step and insert it into the replacement storage controller.

a. Align the battery with the slot on the storage controller.

b. Slide the battery into the storage controller until the release tab clicks into place.

这个步骤就是把之前抽出来的BBU电池插到新更换的控制器里面。这里,我们也遇到过好几次问题,有客户说电池控制器识别不到,其实就是电池没有插紧。当然也有可能是控制器有故障,无法识别到电池。这种情况对于我们专业的备件供应商是不存在的,每次发货都会有测试报告。

7. Insert the replacement storage controller into the chassis until it is fully seated.

NOTE: The bottom storage controller is installed upside down.

把更换的控制器装回去,注意底部控制器是反着装回去的。

这个官方步骤看着是多么的轻松,简而言之,就是老的拔下来,新的插回去,完活。

其实这里是有很多问题的。后面会给大家做些讲解。

8. Reconnect the cables to the storage controller.

9. Push the release lever toward the chassis until it clicks into place. The storage controller is powered on.

把控制器推进去,然后控制器加电。

NOTE: When a storage controller is powered on, there is a one‐minute delay while the storage controller prepares to boot. During this time, the only indication that the storage controller is powered on are the LEDs on the storage controller. After the one‐minute delay, the fans and LEDs turn on as an indication that the storage controller is starting up.

注意,控制器刚插进去是有一个大概1分钟多的延迟的,才开始启动。表现就是后面的风扇开始转动了,这个能听到很大的声音。

10. In the Storage Center System Manager, make sure that the replacement storage controller is recognized and shown as up and running.

这里就完活了,到GUI界面看控制器是否UP。

NOTE: If the Storage Center software on the replacement storage controller is older than the software on the existing storage controller, the storage system updates the replacement storage controller with the software version on the existing storage controller. The Storage Center software update on the replacement storage controller could take 15 to 45 minutes to complete.

注意:如果更换控制器的SCOS版本比你的版本低,系统就自动开始更新更换的控制器版本,时间上大概有15-45分钟时间,主要看更新那些固件,有时候还有几次重启。

NOTE: In rare cases, when a storage controller is replaced, it may boot into safe mode and wait to be configured. If so, contact Dell Technical Support Services for the configuration information to enter. In addition, if the storage system is at a later Storage Center OS version then the replacement storage controller, the Storage Center OS on the replacement storage controller must be manually updated using virtual media update method.

还有可能,就是更换完毕的控制器启动到了safe mode,然后就不动了。这个时候一定是要人工干预了。还有一种情况就是更换控制器的OS版本高于原来的版本,系统不会自动同步为原来的控制器版本,需要人工使用ISO文件来升级了。

这个流程看下来是不是很简单,总结就是故障的拔下来,新的插入,然后系统自动同步OS。

事实上,实际情况完全不是这样的,这个流程是针对DELL原厂全新的控制器备件来说的,不是针对第三方的拆机备件的。您要做的要么 1)选择靠谱的备件供应商,可以加vx: StorageExpert。 或者 2)一定要有串口线,监控更换过程,知道哪里除了问题,这样才好对症下药。

所以,绝大部分的更换遇到的问题就是控制器会进入到safe mode,如下图所示:

Safemode 是系统启动到了一个最小模式,不是完全启动系统。这这个状态可以做故障诊断和分析处理。如果不知道怎么操作,可以添加vx:StorageExpert来协助处理。

第二种常见情况是,脑裂。工程师采取了重启终极大法,把原来正常的控制器也给插拔重启,试图这样可以恢复正常,悲剧就发生了,原来可以单控继续提供服务,现在原来正常的控制器也不能启动了,一直提示:

Failed controllers , first selection, restart

这个状态就是典型的控制器脑裂,这个控制器必须找到leader 控制器才可以正常启动,否则就一直找。如果要快速恢复业务,就需要放弃掉另外一个控制器,让单控启动。

第三种常见情况就是机器反复重启几次,一直不到正常状态。有二把刀就认为控制器有故障了,把控制器给抽了出来,然后更大的悲剧就发生了,由于新更换的控制器OS版本低,要升级很多固件,有些固件是需要重启机器的,而且在升级固件期间,如果突然拔出控制器,这个控制器基本就废了。

如下图就是一个典型的BMC版本升级/降级(下图是从2.8.00F降级到2.8.000D)

第四种情况就是控制器启动以后直接到了无任何配置的模式,就是safe mode sn为0的情况,如下图所示:

最后一种情况就是系统完全不启动,找不到boot disk,这种情况大概率就是boot disk的ssd盘坏了,处理办法就是更换这个卡或者做ISO的reimage。

总之,控制器更换是个相对复杂的故障,会遇到各种千奇百怪的问题,各种问题都有对应的解决方案。

SC4020/SCv2020 控制器更换流程步骤和可能遇到的问题相关推荐

  1. 看图识字,DELL SC4020 / SCv2000 控制器更换过程

    对于DELL SC4020或者SCV2000 进行控制器更换的时候,经常遇到各种不可预知的问题,支持情况下,现场应该准备一条串口线,然后根据串口线的输出来判断问题,然后做出处理建议.但我们很多NB的工 ...

  2. CentOS7安装MariaDB的流程步骤

    安装前需要彻底清除你的服务器计算机上原来安装过的mysql.maraidb的文件,不然会出现各种问题. CentOS7安装MariaDB的流程步骤如下: ======================= ...

  3. EMC VNX 中端存储系统控制器更换常见问题探讨

    最近遇到一些客户在更换EMC Clariion系统(就是传统的中端存储,包含CX,VNX1代,VNX2代,VNXe和Unity类似)控制器中遇到一些问题,然后处理方案千奇百怪,问题越高越复杂,最后丢数 ...

  4. 简单介绍Git合并分支的流程步骤

    这篇文章主要介绍了详解Git合并分支的流程步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧 正常合并分支dev到master流 ...

  5. R语言使用knitr生成机器学习模型全流程步骤示例:knitr与自动化结果报告、knitr常用参数

    R语言使用knitr生成机器学习模型全流程步骤示例:knitr与自动化结果报告.knitr常用参数 目录

  6. 【JVM】Java对象创建的流程步骤

    · 本文摘要 · 罗列Java创建对象的各种方式: · 讲解Java对象创建的流程步骤: 一.Java创建对象的各种方式 · 1. 用关键字new,老少皆知的方法:StringBuffer sb = ...

  7. 域服务器重装系统,win10系统配置域控制器的详细步骤

    域控服务器能安全集中管理软件,一般适用于中大型企业,系统配置域控服务器时,需先安装域服务.那么win10系统如何配置域控制器?针对这一问题,小编来和大家说说具体操作步骤. 具体方法如下: 1.单击开始 ...

  8. app制作流程步骤_企业画册设计流程总结 告诉你画册制作步骤

    画册设计流程是怎样的,不管什么设计都是有步骤有方法的,按照企业画册的设计流程来制作,有助于我们开展画册的制作工作.在本文我们看看企业画册设计流程是什么.其实从企业内刊设计流程,可以参看画册的设计流程. ...

  9. jsapi支付签名_PHP实现微信支付(jsapi支付)流程步骤详解

    最近接触到一个项目,涉及到微信支付,搞微信开发这么久以来,还没搞过支付,之前也就搞过公众号发红包,感谢前辈们的探索,我看了他们的博文,让我少走了很多弯路. 前期准备: 1.微信认证服务号,并且开通了微 ...

最新文章

  1. SEO优化之meta标签
  2. Keras中神经网络可视化模块keras.utils.vis_util 的安装
  3. matlab fft例程,c++ FFTW与Matlab FFT
  4. 案例九:shell脚本自动创建多个新用户,并设置密码
  5. js及jQuery实现checkbox的全选、反选和全不选
  6. GDCM:基本应用程序级别机密性配置文件测试程序
  7. 常用计算机二级函数,计算机二级MS office常用函数
  8. 基于IMAGE法的房间回响模型创建、C++代码实现、matlab仿真
  9. 博客,文字的卡拉OK版
  10. 【转载】你不得不知道的深度学习网络画图工具
  11. Winsock编程补遗
  12. aspdotnet部分资源
  13. 淘宝刷DSR动态评分技巧
  14. ffmpeg(七)合并音视频文件
  15. JTree创建、获取和删除节点的方法
  16. (4)数仓建设-数据仓库命名规则
  17. 正片叠底(Multiply)和滤色(Screen)是两种基本的混合模式
  18. 价值7000万的商业模式,羊毛出在狗身上,猪来买单
  19. 20230225在WIN10下安装PR2023失败的解决
  20. 液晶面板里面有些什么配件_液晶电视核心部件各类液晶面板介绍是什么?请生意经的朋友帮忙解答...

热门文章

  1. 高数等价无穷小替换公式
  2. python输出100以内偶数_Python求取100以内的所有偶数和奇数以及和
  3. 关于小电脑研制与经营的研究报告
  4. 共享安装 cacti 过程中的一些经历 cacti 中文-linux - sun solaris
  5. microbit python_刘鹏涛老师用Microbit 学Python系列教程
  6. 云服务器 cvm mysql_腾讯云CVM如何安装搭建MySQL
  7. iconic 框架中的滚动条高度
  8. iofod - 为攻城师们打造的低代码平台
  9. 麒麟 android os,华为可真有本事!自研国产系统麒麟OS来了,安卓会被取代吗?...
  10. python遇到的问题及解决方法