云计算的IaaS、PaaS、SaaS最后那个S都是Service。就是说,无论你云计算长成什么样,都得要向用户提供“服务”而不仅仅是软硬件和各种资源。

云计算的技术难点

  到今天,云计算的工业实现已经不太难了。现在有开源软件KVM和Xen,这两个东西基本把虚拟化搞定;而OpenStack则把管理、控制系统搞定,也很成熟。PaaS也有相应的开源,比如OpenShift,而Java里也有N多的中间件框架和技术。另外分布式文件系统GFS/TFS,分布式计算系统Hadoop/Hbase等等,分布式的东西都不神秘了。技术的实现在以前可能是问题,现在不是了。

  对于云计算工程方面,现在最难的是运维。管100台、1万台还是100万台机器,那是完全不同的。机器少你可以用人管理,机器多是不可能靠人的。运维系统不属于功能性的东西,用户看不见,所以这是被大家严重低估的东西。只要你做大了,就必然要在运维系统上做文章。数据中心/云计算拼的就是运维能力。

  为什么我说运维比较复杂,原因有这么几个。

  一方面,云计算要用廉价设备取代那些昂贵的解决方案。所谓互联网的文化就是屌丝文化,屌丝就是便宜,互联网就是要用便宜的东西搭建出高质量的东西,硬件和资源一定不会走高端路线——比如EMC、IBM小型机、SGI超级计算机等等,你如果用它去搭建云计算,成本太贵。用廉价的解决方案代替昂贵的解决方案是整个计算机发展史中到今天唯一不变的事情。所以如果你要让夏利车跑出奔驰车的感觉,你需要自己动手做很多事,搭建一个智能的系统。用廉价的东西做出高质量的东西,运维好廉价的设备其实是云计算工程里最大的挑战。

  另一方面,因为你机器多了,然后你用的又不是昂贵的硬件,所以故障就变成了常态,硬盘、主板、网络天天坏。所以,没什么好想的,运维就必须要跟上。云计算的目标是在故障成为常态的情况下保证高可用——也就是我们所说的,你服务的可用性是3个9、4个9还是5个9。

  最后,这一大堆机器和设备都放在一起,你的安全就是一个挑战,一方面是Security,另一方面是Safety,保证数十台数百台的设备的安全还好说,但是对于数万数十万台的设计,就没有那么简单了。

  面对这样的难题,人是无法搞得定的,你只能依靠技术来管理和运维整个平台。比如必须有监控系统。这跟操作系统一样,对资源的管理,对网络流量、CPU利用率、进程、内存等等的状态肯定要全部收集的。收集整个集群各种节点的状态,是必然每个云计算都有的,都是大同小异的。

  然后,你还要找到可用性更好的节点,这需要有一些故障自检的功能。比如阿里云就遇到过磁盘用到一定时候就会莫名其妙的不稳定,有些磁盘的I/O会变慢。变慢的原因有可是硬盘不行了,于是硬盘控制器可能因为CRC校验出错需要要多读几次,这就好比TCP的包传过来,数据出错了,需要重新传。在这种硬盘处理半死不活的状态时,你肯定是需要一个自动检测或自动发现的程序去监控这种事情,当这个磁盘可能不行了,标记成坏磁盘,别用它,到别的磁盘上读复本去。我们要有故障自动检测、预测的措施,才能驱动故障,而不是被动响应故障,用户体验才会好。换句话说,我们需要自动化的、主动的运维。

  为了数据的高可用性,你只能使用数据冗余,写多份到不同的节点——工业界标准写三份是安全。然而,你做了冗余,又有数据一致性问题。为了解决冗余带来的一致性问题,才有了paxos的投票玩法,大家投票这个能不能改,于是你就需要一个强大的控制系统来控制这些东西。

  另外,公有云人来人往,里面的资源和服务今天用明天不用,有分配有释放,有冻结,你还要搞一个资源管理系统来管理这些资源的生命状态。还有权限管理,就像AWS的IAM一样,如果没有像AWS的IAM权限管理系统,AWS可能会不会像今天这样有很多大的公司来用。企业级的云平台,你需要有企业级的运维和管理能力。

云计算的门槛

  为啥云计算有这么多开源的东西,却不是人人都能做?

  一方面,这就跟盖楼一样。盖楼的技术没什么难的(当然,盖高楼是很难的),但是你没地你怎么盖?我觉得云计算也一样,带宽的价格贵得就像土地的价格。其实云计算跟房地产一样,要占地、占机房、占带宽。如果能把中国所有的机房、机柜、带宽资源都买了,你就不用做云计算了,卖土地就够了——因为这些是有限的。最简单的例子,IP地址是有限的。你有带宽、有机房,但是如果你没有IP,这就不好玩了。尤其是你要提供CDN服务,这个就更明显,因为有多少物理节点直接决定你的CDN服务质量。

  另一方面,正如前面所说的,运维是件很难的事,运维这个事并不是一般人能搞的事。没有足够的场景、经验和时间,这种能力很难出现。

  从用户的角度来说呢,云计算是一种服务,你需要对用户企业内的解决方案要有很好的了解,这样才能提高很好的服务。能提供“好服务”的通常都是把自己真正当成用户公司。

  卖汽车也是卖服务。造出汽车来,并不代表你搞定这个事了。如果没有公路、没有加油站、没有4s店、没有交通管理、规则等等,你要么用不了,要么就是乱七八糟。不能只让用户在那看着你的汽车好牛啊,但是用户不知道怎么用。所以说,云计算最终旁边必须要有一套服务设施,而这套服务设施也是今天被人低估的。

  云计算有两个东西我觉得是被人低估的,一个是运维,一个是那堆服务。做服务的需要有生态环境,有人帮你做。所以做云计算要落地并不简单。

  总之,云计算是需要吃自己的狗食才能吃出来的,绝不是像手机上的Apps一样,你想一想、试一试就能搞出来的,你首先需要让自己有这样的场景,有这样的经历,你才可能会有这样的经验和能力。

  还是那句话,云就是服务,只要提供了好的服务,无论公有还是私有都是会有价值的。

本文作者陈皓,CoolShell.cn博主。

云计算免费课程火热开讲中,5天运维经典课程免费学,会云计算的运维人才到底需要掌握哪些技术,未来前景发展怎么样?跟随行业大咖一起剖根究底,点击文末“阅读原文”或长按下方二维码即可报名免费课程!抓住免费学习的机会,逆袭2019~~

PS:记得查收小编送你的免费大礼包呦~

福利 | 一万多套PPT模板等你免费来拿!无条件领取!

免费送 | 1000多套简历模板免费拿,附赠简历制作教程!

免费领 | 《Shell脚本 100例》电子书免费拿,运维必备干货~

▼▼点击【阅读原文】,5天运维免费课程,开讲在即!

云计算:拼的就是运维!相关推荐

  1. 云计算,拼的就是运维

    本文根据 InfoQ 中文站跟陈皓(@左耳朵耗子)在 2014 年 3 月的一次聊天内容整理而成. 在沟通中,陈皓分享了自己对云计算的理解,包括云计算为什么会分三层,实现一个云平台的难点在什么地方,运 ...

  2. 云计算中的自动化运维技术及其实践

    引言 随着云计算技术的快速发展,云计算成为了企业数据中心的新生态,提供了更加灵活.高效.安全的 IT 基础设施和应用服务,让企业能够更加专注于业务创新和变革.但是,云计算的快速发展也带来了新的安全挑战 ...

  3. 云计算时代,IT运维人员需要掌握哪些技术?会使用哪些运维工具?

    云计算时代,IT运维人员需要掌握哪些技术?会使用哪些IT运维工具呢?云计算时代的大背景下,企业IT运维人员需要的技术知识背景其实已经发生了根本性变化,脱离了风火水电的硬件运维工作,现在反而关注操作系统 ...

  4. 云计算开发教程:运维工程师必会技能--sar

    今天这篇文章是给大家分享一些云计算开发教程,今天讲解的是:运维工程师必会技能–sar. SAR是系统活动报告(System Activity Report)英文单词的首字母缩写.正如它的名字所表示的那 ...

  5. 数据中心linux运维学习_云计算时代数据中心运维三大要点

    在当前企业IT系统向云架构转型的时刻,运维系统再一次面临着新的挑战.所以在数据中心运维的时候,运维人员应该注意哪些问题? 在云计算时代,IT系统建设越来越成为企业发展至关重要的一环.业务系统,以及支撑 ...

  6. 云计算1+X平台运维与开发认证能(初级)选择题

    在写的过程中,出现小错误欢迎指正 1.下面哪个不是项目开发成员角色? A.项目经理 B.测试经理 C.产品经理 D.实施经理(正确答案) 角色:项目经理.产品经理.开发经理.测试经理 2.为满足金融业 ...

  7. 云计算1+X平台运维与开发认证(初级)操作题详解

    操作题(详解) 选择题:https://blog.csdn.net/yzqtcc/article/details/111672517?spm=1001.2014.3001.5501 主从数据库管理 在 ...

  8. 中国E动网陈明华:云计算不拼人 拼“运维能力”

    IDC评述网12月18日报道:由IDC评述网组办"2014-2015年度十佳IDC评选"于11月08日正式启动投票,活动将持续4个多月,截止至2015年02月05日结束.本次评选, ...

  9. 【网盘】无论是云计算SaaS,PaaS还是IaaS,拼的都是运维!| 燕麦企业云盘

    发展至今,云计算提供三种形式的云服务,基础设施即服务(IaaS),平台即服务(PaaS)和软件即服务(SaaS).尽管这三种服务形式有所差异,其最终的目的就是为用户提供服务(Service)的,而不仅 ...

最新文章

  1. Myeclipse在启动tomcat的时候的模式改变
  2. WinCE/Mobile上下滑动浏览DataGrid数据 【转】
  3. EventBus3.0开发详解 近万开发者收藏
  4. Bash脚本教程之算数运算
  5. android通过adb shell播放音乐
  6. oracle树状排序,Oracle树状结构查询
  7. noise函数的使用
  8. python_标识符_帮助系统的使用_命名规则---python工作笔记018
  9. MS DOS 命令大全
  10. Oh-My-Zsh 下远程ssh的乱码问题
  11. linux ln链接命令
  12. 计算机一级ps教程自学网,ps教程自学网
  13. 10款最佳SQL Server服务器监控工具
  14. Au 音频效果参考:调制
  15. 云计算 | 浅议云计算发展趋势
  16. 卡通人物数据集下载地址
  17. mybatis中如何防止sql注入和传参
  18. python--中文分词与词云制作--入门笔记(附停用词库及Mac字体资源)
  19. 【安全】【信息搜集】Google Hacking
  20. 改了计算机名oracle,修改计算机名字导致oracle连接不上的解决方案

热门文章

  1. 使用js开发IE浏览器本地插件
  2. 计算机软件行业关联,2016年计算机市场现状分析-中国计算机行业与上下游之间关联性情况分析 - 观研报告网...
  3. 获取系统文件文件夹图标之计算机图标(我的电脑图标)、驱动器图标文件图标等
  4. java计算机毕业设计高校毕业生就业满意度调查统计系统源码+系统+lw文档+mysql数据库+部署
  5. 用JavaScrpt给文件夹加密
  6. 数据结构——表达式求值
  7. 2021高考河南正阳成绩查询,驻马店教育网2021正阳中考成绩查询系统入口
  8. vue - vue中实现对图片添加水印和截图的功能
  9. obj[“key“]与obj.key
  10. Mogrt标题模板 温馨花朵爱心动态母亲节标题PR模板下载