7月11日下午2时,著名的旅行网站艺龙突然无法访问,此后连续二十六个小时,用户纷纷表示无法访问网站,首页均显示系统正在升级。后来证实是存储系统除了问题,导致整体服务停止,系统宕机。因为这一场事故,艺龙蒙受了巨大的客户流失,为此花费了大量维修成本。

  这个事故在业界掀起一阵对数据中心灾难防护的争论,在业务时间按秒计算的今天,IT设备一分一秒的浪费,都会给企业带来不可估量的损失。其实今年的宕机事故并非只有艺龙一个,但是这些事故并没有得到应有的重视。为何非要等到出现严重后果,人们才能意识到预防宕机的重要性呢?

  我们先复习一下TIA-942《数据中心的通信基础设施标准》中对于数据中心等级的划分。

  该表格倒数第二行是指年宕机时间,即该等级的数据中心在一年内能够容许宕机的时间长度,单位为小时。可以看出,对于最高等级Tier 4来说,一年仅容许0.4小时的宕机时间,也就是24分钟,对于Tier1来说,也不能超过28.8小时。

  但是,大多数数据中心(包括很多知名企业的大型数据中心)都在一次宕机内就完成了一年的“目标”。

  结合着这一点,我们来回首一下近期影响较大宕机事故:

  4月21日亚马逊云计算中心宕机

  亚马逊在Virginia的云计算数据中心服务由于误操作宕机,导致大量依赖其云服务的企业利益受损,其中包括手机服务网站FourSquare、新闻网站Reddit等等。这次宕机事故,不但让亚马逊及其客户受到惨痛的损失,更带来了人们对云计算服务的信任危机。

  8月8日,亚马逊云服务由于雷击再次宕机,不过这次仅持续1个小时。

  5月26日 Skype宕机

  网络电话服务软件Skype发生宕机事故,很多用户无法登陆软件或者拨打电话。无处发泄的用户只得在twitter上表达不满,更有用户将其怪罪于微软收购Skype的行为,因为主要是Windows版客户端出问题。在同年6月7日,Skype再度发生宕机事故。

  6月9日 Twitter宕机

  Twitter当天早晨因为不明技术问题,导致API受到影响,但是宕机仅持续了一个多小时就被解决,所以并没有造成太大影响。去年Twitter曾经发生过多起宕机事故,最久持续6小时,而今年情况大为好转,宕机时间较少,而且一旦发生,就能马上解决。

  7月14日艺龙旅行网宕机

  今年最大的一起宕机事故,事故缘于EMC存储设备,但就其根本,据说是艺龙本身的存储架构不完善,才导致了如此长的修复时间。由于存储灾备的不完善,备份没有起到应有的作用。否则EMC出现故障,也不至于宕机26个小时。

  7月15日谷歌App Engine宕机

  谷歌应用引擎Java服务出故障,导致宕机1小时,这个问题日期相近的艺龙宕机事故来说不是特别引人注目,但是故障原因基于云计算,把应用程序转到网络上,出现了一些问题。最近云服务颇受欢迎,但是安全问题还是一把达摩克利斯剑。

  8月3日雅虎邮箱宕机

  用户12小时无法访问雅虎邮箱,一开始并没有得到雅虎的重视,随着反映问题的用户越来越多,才开始作出回应。原因不明。

2011年几大宕机事件盘点相关推荐

  1. 黑色八月 宕机事件盘点

    黑色八月 宕机事件盘点 摘要:宕机的事件好像8月频频发生,国外苹果iclould.谷歌.微软.Amazon等巨头先后宕机,国内百度.微信也发生故障.各大网络应用和服务都频繁地出现问题,给企业带来了重大 ...

  2. 云宕机事件盘点:IBM云服务全球宕机四小时,安全稳定成空话?

    随着越来越多的企业及应用将它们的数据搬运至云端,即便只是云服务上的一个小小宕机事件,都可能引发一场大灾难. 6月10日,IBM云计算发生了长达四个小时的中断故障,导致多项托管于平台上的互联网服务中断, ...

  3. 2018年十大云宕机事故盘点:主流无一幸免!

    根据IDC今年7月份发布的<中国公有云服务市场半年度跟踪报告>显示,阿里云的市场占有率已过45%,腾讯云达到10%.在全球市场,根据Gartner最新数据显示,亚马逊AWS占全球份额的51 ...

  4. 从谷歌宕机事件认识互联网工作原理

    摘要:谷歌服务器经历了短暂的宕机事件,持续大概27分钟,对部分地区的互联网用户造成了影响.此次事件的原因深究起来需要进入互联网络那深邃的.黑暗的角落. 译者注:本文中提到CloudFlare是一家总部 ...

  5. Redis的KEYS命令引起宕机事件

    摘要: 使用 Redis 的开发者必看,吸取教训啊! 原文:Redis 的 KEYS 命令引起 RDS 数据库雪崩,RDS 发生两次宕机,造成几百万的资金损失 作者:陈浩翔 Fundebug经授权转载 ...

  6. 深入解析和反思携程宕机事件

    携程网宕机事件还在持续,截止28号晚上8点,携程首页还是指向一个静态页面,所有动态网页都访问不了.关于事故根源,网上众说纷纭.作为互联网运维老兵,尝试分析原因,谈谈我的看法. \\ 宕机原因分析 \\ ...

  7. 如何降低数据中心宕机事件的影响

    大多数人在生活或工作领域中都不希望出现连接中断的情况,尤其是在以数字生活方式为主的今天,所以数据中心基础设施变得越来越重要.对于许多消费者来说,他们希望自己的数字产品和服务能保持正常工作,所以当发生宕 ...

  8. 回顾2019年5个重大宕机事件

    任何时候发生网络服务中断,都会对全球业务造成极大的影响和破坏,而且还会导致收入和声誉的重大损失.尽管应用程序交付依赖于许多网络服务提供商(ISP),但它也越来越依赖于面向网络的服务的大型且复杂的生态系 ...

  9. 服务器系统日志6008,DELL服务器宕机事件6008

    在DELL服务器上安装了windows server 2008 r2 64位标准版,客户在该操作系统上安装了自己开发的视频监控软件.服务器在运行一段时间后,会出现如下情况:(事件ID6008) 1.机 ...

最新文章

  1. 功能到位 + 颜值爆表的开源任务管理工具
  2. MATLAB中plot()画图的颜色线型和希腊字母参数设置
  3. python中map函数的用法
  4. linux文件系统只有几k,关于Linux文件系统的的简单理解和认识
  5. CompletableFuture详解~thenAcceptAsync
  6. Qt工作笔记-QFileSystemModel创建文件系统信息模型
  7. 11-windows下卸载Orcale
  8. redis学习-分布式数据库CAP原理
  9. django 中的用户身份验证和 session 的关系
  10. linux下yum安装maven
  11. c语言中文件的存储,急求如何将下列C语言程序数据存储到文件中?
  12. 【渝粤题库】陕西师范大学200061语言学概论作业(高起本、专升本)
  13. 面试被问离职原因该怎么回答?
  14. 解决VMware虚拟机安装Win10系统后无网络问题
  15. 用python爬取网易云音乐评论
  16. linux运行proxmark3,Linux 下编译使用Proxmark3
  17. 【Windows Server 2019】活动目录 (Active Directory) ——创建、删除和管理对象、容器和组织单位(OU)
  18. H3C交换机机框首次启动报错“The device (FFFFFFFF-40) doesn‘t support this kind of board.”
  19. 快速实现M5311NBIOT MQTT通信
  20. java 163邮箱发邮件_java用163邮箱发邮件的方式,步骤有哪些?

热门文章

  1. 【BZOJ2038】【莫队】小z的袜子
  2. 现代图论笔记(三)图的距离与连通性
  3. 极大提高效率:论文写作工具神器
  4. java国际象棋游戏_java打印国际象棋棋盘的方法
  5. 人工智能之父,关于两个“爸爸”的事情,你不想了解一下吗?(楚才国科)
  6. 日常问题01 —— 微信开发者工具代码被覆盖了如何恢复
  7. 二级MS Office 考什么,点进来细说
  8. 纠结是否现在从事数据库管理员
  9. 『AngularJS』ngShow
  10. 转载:Notepad++的64位HexEditor