2011年几大宕机事件盘点
7月11日下午2时,著名的旅行网站艺龙突然无法访问,此后连续二十六个小时,用户纷纷表示无法访问网站,首页均显示系统正在升级。后来证实是存储系统除了问题,导致整体服务停止,系统宕机。因为这一场事故,艺龙蒙受了巨大的客户流失,为此花费了大量维修成本。
这个事故在业界掀起一阵对数据中心灾难防护的争论,在业务时间按秒计算的今天,IT设备一分一秒的浪费,都会给企业带来不可估量的损失。其实今年的宕机事故并非只有艺龙一个,但是这些事故并没有得到应有的重视。为何非要等到出现严重后果,人们才能意识到预防宕机的重要性呢?
我们先复习一下TIA-942《数据中心的通信基础设施标准》中对于数据中心等级的划分。
该表格倒数第二行是指年宕机时间,即该等级的数据中心在一年内能够容许宕机的时间长度,单位为小时。可以看出,对于最高等级Tier 4来说,一年仅容许0.4小时的宕机时间,也就是24分钟,对于Tier1来说,也不能超过28.8小时。
但是,大多数数据中心(包括很多知名企业的大型数据中心)都在一次宕机内就完成了一年的“目标”。
结合着这一点,我们来回首一下近期影响较大宕机事故:
4月21日亚马逊云计算中心宕机
亚马逊在Virginia的云计算数据中心服务由于误操作宕机,导致大量依赖其云服务的企业利益受损,其中包括手机服务网站FourSquare、新闻网站Reddit等等。这次宕机事故,不但让亚马逊及其客户受到惨痛的损失,更带来了人们对云计算服务的信任危机。
8月8日,亚马逊云服务由于雷击再次宕机,不过这次仅持续1个小时。
5月26日 Skype宕机
网络电话服务软件Skype发生宕机事故,很多用户无法登陆软件或者拨打电话。无处发泄的用户只得在twitter上表达不满,更有用户将其怪罪于微软收购Skype的行为,因为主要是Windows版客户端出问题。在同年6月7日,Skype再度发生宕机事故。
6月9日 Twitter宕机
Twitter当天早晨因为不明技术问题,导致API受到影响,但是宕机仅持续了一个多小时就被解决,所以并没有造成太大影响。去年Twitter曾经发生过多起宕机事故,最久持续6小时,而今年情况大为好转,宕机时间较少,而且一旦发生,就能马上解决。
7月14日艺龙旅行网宕机
今年最大的一起宕机事故,事故缘于EMC存储设备,但就其根本,据说是艺龙本身的存储架构不完善,才导致了如此长的修复时间。由于存储灾备的不完善,备份没有起到应有的作用。否则EMC出现故障,也不至于宕机26个小时。
7月15日谷歌App Engine宕机
谷歌应用引擎Java服务出故障,导致宕机1小时,这个问题日期相近的艺龙宕机事故来说不是特别引人注目,但是故障原因基于云计算,把应用程序转到网络上,出现了一些问题。最近云服务颇受欢迎,但是安全问题还是一把达摩克利斯剑。
8月3日雅虎邮箱宕机
用户12小时无法访问雅虎邮箱,一开始并没有得到雅虎的重视,随着反映问题的用户越来越多,才开始作出回应。原因不明。
2011年几大宕机事件盘点相关推荐
- 黑色八月 宕机事件盘点
黑色八月 宕机事件盘点 摘要:宕机的事件好像8月频频发生,国外苹果iclould.谷歌.微软.Amazon等巨头先后宕机,国内百度.微信也发生故障.各大网络应用和服务都频繁地出现问题,给企业带来了重大 ...
- 云宕机事件盘点:IBM云服务全球宕机四小时,安全稳定成空话?
随着越来越多的企业及应用将它们的数据搬运至云端,即便只是云服务上的一个小小宕机事件,都可能引发一场大灾难. 6月10日,IBM云计算发生了长达四个小时的中断故障,导致多项托管于平台上的互联网服务中断, ...
- 2018年十大云宕机事故盘点:主流无一幸免!
根据IDC今年7月份发布的<中国公有云服务市场半年度跟踪报告>显示,阿里云的市场占有率已过45%,腾讯云达到10%.在全球市场,根据Gartner最新数据显示,亚马逊AWS占全球份额的51 ...
- 从谷歌宕机事件认识互联网工作原理
摘要:谷歌服务器经历了短暂的宕机事件,持续大概27分钟,对部分地区的互联网用户造成了影响.此次事件的原因深究起来需要进入互联网络那深邃的.黑暗的角落. 译者注:本文中提到CloudFlare是一家总部 ...
- Redis的KEYS命令引起宕机事件
摘要: 使用 Redis 的开发者必看,吸取教训啊! 原文:Redis 的 KEYS 命令引起 RDS 数据库雪崩,RDS 发生两次宕机,造成几百万的资金损失 作者:陈浩翔 Fundebug经授权转载 ...
- 深入解析和反思携程宕机事件
携程网宕机事件还在持续,截止28号晚上8点,携程首页还是指向一个静态页面,所有动态网页都访问不了.关于事故根源,网上众说纷纭.作为互联网运维老兵,尝试分析原因,谈谈我的看法. \\ 宕机原因分析 \\ ...
- 如何降低数据中心宕机事件的影响
大多数人在生活或工作领域中都不希望出现连接中断的情况,尤其是在以数字生活方式为主的今天,所以数据中心基础设施变得越来越重要.对于许多消费者来说,他们希望自己的数字产品和服务能保持正常工作,所以当发生宕 ...
- 回顾2019年5个重大宕机事件
任何时候发生网络服务中断,都会对全球业务造成极大的影响和破坏,而且还会导致收入和声誉的重大损失.尽管应用程序交付依赖于许多网络服务提供商(ISP),但它也越来越依赖于面向网络的服务的大型且复杂的生态系 ...
- 服务器系统日志6008,DELL服务器宕机事件6008
在DELL服务器上安装了windows server 2008 r2 64位标准版,客户在该操作系统上安装了自己开发的视频监控软件.服务器在运行一段时间后,会出现如下情况:(事件ID6008) 1.机 ...
最新文章
- 功能到位 + 颜值爆表的开源任务管理工具
- MATLAB中plot()画图的颜色线型和希腊字母参数设置
- python中map函数的用法
- linux文件系统只有几k,关于Linux文件系统的的简单理解和认识
- CompletableFuture详解~thenAcceptAsync
- Qt工作笔记-QFileSystemModel创建文件系统信息模型
- 11-windows下卸载Orcale
- redis学习-分布式数据库CAP原理
- django 中的用户身份验证和 session 的关系
- linux下yum安装maven
- c语言中文件的存储,急求如何将下列C语言程序数据存储到文件中?
- 【渝粤题库】陕西师范大学200061语言学概论作业(高起本、专升本)
- 面试被问离职原因该怎么回答?
- 解决VMware虚拟机安装Win10系统后无网络问题
- 用python爬取网易云音乐评论
- linux运行proxmark3,Linux 下编译使用Proxmark3
- 【Windows Server 2019】活动目录 (Active Directory) ——创建、删除和管理对象、容器和组织单位(OU)
- H3C交换机机框首次启动报错“The device (FFFFFFFF-40) doesn‘t support this kind of board.”
- 快速实现M5311NBIOT MQTT通信
- java 163邮箱发邮件_java用163邮箱发邮件的方式,步骤有哪些?