Zeus资源调度系统介绍
摘要: 本文主要概述阿里巴巴Zeus资源调度系统的背景和实现思路。 本文主线:问题、解决方案、依赖基础知识、工程实践、目标、经验分享。立足企业真实问题、常规解决策略,引出依赖的容器技术、实践方案,所有这些落实到工程实践,要解决那些问题、实现哪些目标、技术大趋势的影响。最后给出阿里巴巴的实践经验。本序列文章并不是突出架构上重大突破,毕竟这个领域已经发展了10多年了。而是,实践过程中的一些细节、一些特殊场景下的特殊处理方法,作为一种新的认知素材。依赖的容器或周边系统,都不会进行深入的分析,围绕资源调度概括性地做一些总结和补充些细节描述。
关键词:容器技术 资源调度
1.背景:资源浪费剖析
资源管理系统没有掌握资源的利用情况,当前的资源利用率是怎么样的,有哪些空闲资源不是太清楚。甚至有些资源脱离了系统的管理,成为僵尸资源。这样造成了大量可用资源的闲置和浪费。
对于网站来说,访问量是呈现成曲线分布的,有高峰有低谷。在访问高峰的时候资源利用率比较高,在访问低谷的时候,则资源比较闲置,从而造成大量资源的浪费
2. Zeus介绍
Zeus是一个资源调度系统,它对数据中心的服务器资源进行统一的调度和分配。它的主要功能包括:
3. 资源的虚拟化
容器技术把硬件等计算、存储、传输资源进行了无状态性、相对透明的共享。容器内的具体任务以及容器的生命周期等管理,交给了上层业务进行管理、运维。
从资源生命周期看,长期租用、短期租用、不定时租用。不定时租用对应的往往是分时共享,而长期租用多半是固定配额共享或者专有共享。资源在时间、粒度、上下文环境一致、业务类型上进行平衡。
不论哪种角度看共享,只要有共享,就必须保障基础环境的一致性,不能因为共享者的环境变更导致其他服务受影响。实时环境巡检也就必不可少。
4. 技术架构
5. 资源利用率
5.1 超卖
应用在申请的资源的时候,往往会申请比他实际使用更多的资源。也就是说他申请的资源,在实际使用中,他是用不了这么多资源的。这样就形成了资源的浪费。我们通过超卖来解决这个问题。
5.2 混合部署
5.3 减少资源碎片
6. 稳定性
6.1 故障处理
6.2 稳定性调度策略
6.2 大促稳定性
在类似双11这种大型促销的活动中,由于负载超出平时数倍,会出现各种资源竞争异常的情况。Zeus通过对应用部署的自动洗牌,定点迁移,容器内核的调整等方式确保大促的稳定运行,不出现资源竞争的问题。
7. 运维自动化
Zeus能够自动化的处理各种软硬件故障,大大降低人工干预的程度,从而提高了运维自动化程度。Zeus大大提升了应用扩容的成功率,为弹性伸缩的自动化运行也提供了可靠的保证。
Zeus还提供了多维度的运维工具,可以让运维人员轻松的对资源进行控制和管理,提升了运维自动化程度。
8. 参考链接
[1]http://news.oneapm.com/cloud-oneapm/
[2]http://2016.qconbeijing.com/presentation/2878
[4]http://www.innoarchitech.com/in-depth-look-container-technology-caas-next-big-thing-tech/
[5]http://news.oneapm.com/cloud-oneapm/
[6]http://searchservervirtualization.techtarget.com/feature/Five-cons-of-container-technology
[8]http://ju.outofmemory.cn/entry/21397
[9]http://www.cngulu.com/2870.html [10]http://www.umbrant.com/blog/2015/mesos_omega_borg_survey.html
Zeus资源调度系统介绍相关推荐
- 快手超大规模集群调度优化实践
导读:随着公司业务的快速发展,离线计算集群规模和提交的作业量持续增长,如何支撑超大规模集群,如何满足不同场景的调度需求成为必须要解决的问题.基于以上问题,快手大数据团队基于YARN做了大量的定制和优化 ...
- 面向容器技术资源调度关键技术深度对比
导读:之前发布了云平台技术栈(ps:点击可查看),本文主要说一下其中的容器调度技术! 作者:阿里中间件,公众号:云栖社区 本文以资源分配理念:拍卖.预算.抢占出发,引出Borg.Omega.Mesos ...
- 20.27分发系统介绍;20.28expect脚本远程登录;20.29expect脚本远程执行命令;20.30expect脚本传递参数...
20.27 分发系统介绍 shell项目-分发系统-expect 20.28 expect脚本远程登录 1. 安装expect [root@hao-01 ~]# yum install -y expe ...
- yarn资源调度(网络搜集)
本文转自:http://www.itweet.cn/2015/07/24/yarn-resources-manager-allocation/ Hadoop YARN同时支持内存和CPU两种资源的调度 ...
- 多 LDAP 目录服务器的 FileNet P8 系统介绍和配置实例
摘抄笔记:http://www.ibm.com/developerworks/cn/data/library/techarticle/dm-1312multipldap/ 多 LDAP 目录服务器的 ...
- 最新ZeuS僵尸网络敲响网银安全警钟
一些新的能力正在增强ZeuS僵尸网络.犯罪分子利用这个僵尸网络在网上银行.自动清算中心网络和工资管理系统上窃取金融证书和执行非授权的代码.这个最新版本的犯罪工具(起始售价大约3000美元)提供了一个1 ...
- Hadoop的资源调度器
Hadoop的资源调度器 概念 资源调度器分类 FIFO(先进先出调度器) Capacity Scheduler(容量调度器) Fair Scheduler(公平调度器) 概念 目前,Hadoop作业 ...
- Xamarin Android教程Android基本知识版本介绍与系统介绍
Xamarin Android教程Android基本知识版本介绍与系统介绍 Xamarin Android教程Android基本知识版本介绍与系统介绍,开发Andriod有时候不像iOS一样轻松,因为 ...
- 商业级全局负载均衡器 zeus.ZXTM 实施方案
网址:http://www.zeus.com/products/traffic-manager 1. 什么是ZXTM: 1 总是在说ZXTM,什么是ZXTM呢?其实它是Zeus Technology( ...
最新文章
- GPU 编程入门到精通(五)之 GPU 程序优化进阶
- python 修饰器_python中用修饰器进行异常日志记录
- ea连接远程oracle报错,PLSQL Developer日期格式如何定制化
- 一篇文章搞懂架构师的核心技能
- java gbk汉字 10进制,用java程序将GBK字符转成UTF-8编码格式
- Node.js:项目中的 package.json 格式
- OGNL在Struts2中的应用
- .net模式子窗口传值给父窗口
- codevs 1038 一元三次方程求解 NOIP2001提高组
- Python基础练习题,含答案解析
- 高一计算机信息与技术知识点,高中信息技术必修知识点汇总
- 微软word 2019取消交叉引用
- html语言实现两数相加,HTML(2)
- matlab中除号的有效字符,乘号(x)、除号(÷)、双引号()等字符实体的HTML代码...
- 回调函数的注册机制为什么会在嵌入式固件开发中应用如此广泛?
- 一种融合CMMI和敏捷的策略的前进路线
- IDE for C++
- Java---设计【花店鲜花管理系统】
- 保持冷静、继续前行——《白说》读后感
- 网络安全等级保护测评——岗位职责、权限划分设计思路(三权分立)