“一直以来,阿里云都始终坚持自主研发,我们挑剔和控制掌握每一行代码,就是做到为用户提供更加稳定与可靠的服务,保障永不停机的计算服务,是我们的使命。”这是2019年杭州云栖大会上,阿里巴巴合伙人、阿里云智能基础产品事业部总经理、研究员蒋江伟,花名小邪的压轴之词。

科技发展到今日,早已没有人质疑云计算乃是最主流的企业IT基础设施之一,是使命也是信仰,小邪昨日重磅砸出了基于神龙架构的第六代ECS实例,又迈出了“计算永不停机”的关键一步。

第六代ECS实例:“计算永不停机”

据晶少了解,这代ECS实例的计算性能相比前辈一代提升了20%,内存延迟降低 30%,ESSD云盘延时也降低 70%之多;更重要的一点,TA适用于多种计算场景,包括大数据、离线等且表现越发稳定。举个例子来说,每一百万次计算中只有一次计算抖动,与传统物理服务器相比,整体宕机率下降高达80%。“这是一个怎样的概念?通常来说每一万台服务器正常被使用的前提下每天就会有三台出现宕机现象;但如今基于神龙架构的新款ECS已经能够做到一万台服务器中只有0.6台服务器出现宕机,两者相差五倍,这点其实对于用户来说非常关键。”小邪补充道。

在这个成本优先的环境中,要问如此极致性能的体验,背后价格几何,普惠才是王道!对此阿里云方面表示,基于新架构的各产品依照不同的情况最高可降价幅度达58%以上。另外更加值得画圈圈的是,神龙架构对火热的云原生浪潮下容器等产品的适配程度极高,毕竟通过 I/O offload 芯片加速,高效调度和自动化弹性伸缩的容器化产品可帮助用户降低50% 的计算成本,性能比物理机更加优越。

更关键的,新款计算实例的计算能力也是可圈可点,例如在交易服务场景中,与同规格的物理服务器相比其性能提升十分明显,从最初的3.4万QPS提升到4.4万QPS,提升达30%,延迟降低60%,在没有修改一行代码的前提下达成如此成绩实在可喜。为何新款ECS会有如此高性能的表现?主要源于自身架构的不断突破以及长达十年的的技术积累,所谓“十年自研积淀让阿里云有机会突破自我,找到进化的方向”就是这个道理。

神龙三代,终于显露头角

了解第六代ECS实例的童鞋们都知道,此款实例“建设于神龙架构之上”的事实不容忽视。掐指一算,从2017年发布第一代神龙架构开始,阿里云就独自研发解决方案,最终突破了虚拟化的性能束缚,彻底激发了服务器释放 100%潜能,重构云计算的基础设施;而最新重磅发布的第三代自研神龙架构,更是贯穿了整个IaaS计算平台,并在 IOPS、PPS 等方面提升5倍性能,用户可以做到在云上获得物理机100%的计算能力。

具体来说,三代神龙成功加入了自研的虚拟化操作系统以及芯片,通过硬件加速的方式将虚拟化开销降低并接近于零,并通过芯片加速的方式让存储、网络等IO性能大幅度提升,云盘性能更是达到百万。

谈及神龙架构金属服务器与容器的“天生一对 ”,小邪表示过去人们总认为容器的最佳CP是物理服务器,但其实忽视了几个属于物理服务器的天生缺陷,即无弹性、不稳定、共性连困难以及迭代速度缓慢等;而基于神龙架构的裸金属服务器,既具备传统物理机的最佳性能又兼具虚拟机的灵活性,“因为我们在虚拟化技术中采用了硬件隔离的方式,使裸金属服务器的安全性也很高,并且将存储、网络的IO运算封装在芯片中,果断实现了端到端安全;再加上阿里云本身的迭代周期完全可以达到最快达每周一更新,远远超过了传统意义上半年一迭代的速率。”

提及神龙架构带来的端到端安全保障,同样在飞天智能的主会场,昨天阿里云数据库掌门人李飞飞最新发布的全加密云数据库最能说明这一点。据晶少了解,在这款新品数据库中,用户可以利用自己生成的密钥对数据在云端进行全程加密保护,根源在于结合了神龙架构服务器。

其实两方的合作主要源于后来阿里内部All  on  ECS的项目,之所以可以做到帮助云数据库做到即便被攻破也无权浏览其中数据,归功于神龙架构提供的加密计算能力。“我们有很多安全防护设置在其中。一方面,不单单是“阿里云产品全家桶”产品可以使用,外部的生态合作伙伴也可以使用加密计算服务来搭建属于自己的安全能力,这种开放性就是为了帮助更多企业达成云上业务创新的目标。”

此外更关键的是,在历经软件虚拟化、通用硬件虚拟化、专用硬件芯片虚拟化三个阶段之后,第三代神龙架构已经实现了裸金属服务器、ECS 虚拟机等计算平台的架构统一,用户可以更加便捷获得高质量的弹性资源。

总体来说,作为技术计算类别产品的中台,三代神龙相比之前最核心的升级就是各项参数与指标都有了极大程度的提升,尤其是在控制虚拟化开销、隔离技术以及应用场景等方面,尽管与之前的二代神龙相比在整体架构方面区别并不是很大。具体,几代神龙在虚拟化开销方面主要基于裸金属的虚拟化技术,即为无限接近物理机的虚拟化技术。“三代神龙开销更小,甚至可以将CPU忽略;不止应用于通常情况下的大数据、在线业务等系统,还可以作用在网络上,甚至是边缘。”技术升级是显而易见的。

如果说一代神龙助力企业大规模无顾虑上云,二代神龙优先实现资源并池,那三代神龙究竟为何横空出世?仅仅只是追求三部曲的技术指标升级吗?

对于晶少的这个问题,阿里巴巴研究员,阿里云智能创新产品线总负责人旭卿表示,主要还是需求驱动使然。“过去我们遇到大型数据库上云,只需要推荐到PolarDB就可以了;然而,随着云计算不断向纵深方向发展,非数据库类的大型应用越来越多,对于IO存储能力以及网络转发能力都会有不同程度的需求变化。”

面对神龙的多角度优势,有的小伙伴或许会想在线定下一台神龙并飞速搬到自家的数据中心里放肆用起来,针对此晶少得知,其实目前神龙在专有云方向可以做到线下输出,但一般情况下不提倡直接贩卖物理机的形式,主要还是基于云上发挥功能。究其原因,更多在于神龙的出现,原本就是基于云上研发才能充分发挥其弹性功能,甚至可以做到与其他阿里云系列产品,例如盘古、洛神等联合使用助于发挥更强大的功能。

一路走来的神龙架构

2017年,一代神龙架构震撼现世,主要采用了自主研发的虚拟化2.0技术,兼具“虚拟机的心脏”和“物理机的肌肉”,被认为是云计算领域的新物种。如果仔细梳理神龙架构,我们发现很大程度上绕不开虚拟化技术的发展,甚至神龙可以被定义为是虚拟化技术的一个延伸。无论是从1974年第三代虚拟化架构的新时代要求,还是VMware公司成立等,真正把虚拟化带入应用阶段仅仅才刚开始,以前更多较倾向于理论研究。

对此阿里巴巴研究员,阿里云智能创新产品线总负责人旭卿提及,2009年阿里云开始着手弹性计算,最早使用了开源的Xen;但经过几年的发展,就在2016年,众多从事基础IT的阿里人不禁反思:在云数据中心时代,究竟怎样的虚拟化技术可以满足日益增长的需求,毕竟几十年的虚拟化技术发展以来,但底层架构几乎未变。是不是可以做一些软硬融合或者软件硬件协同的创新来提高虚拟化的效率?毕竟传统物理机缺陷日渐凸显。

通常情况下,一台物理机中包含宿主机以及虚拟机,出现最多的情况就是资源“争抢”,这就会导致虚拟化效率的降低甚至频繁出现波动性。此外,云计算要配合虚拟化自然要消耗大量资源;想要做到效率高、性能佳,除了消耗大量的CPU资源之外似乎并没有更好的办法 ,相比之下成本激增就是个问题。所以在更高的计算性能、更快的网络接入,更高的存储读写能力的综合要求下,神龙就这样应运而生了。“我们重新定义服务器的架构,让它更好地服务今天的虚拟化技术,计算效率大幅度提升。”

可以清晰地看到,发布以后2018年初神龙一代就实现全面商业化,在大规模在云上部署来主要满足大客户上云的需求。一代神龙之后,阿里方面发现,如果传统的虚拟化生产虚拟机和现在使用不一样的计算架构,就会带来两个资源池,成本大幅度上升。如何做到一套架构既可以支持裸金属服务,又可以支持传统的虚拟机,提供更高的服务质量,更好地支持容器,还能很好地兼顾成本、技术发展?在此背景下,真正让虚拟机在神龙架构下性能飞起来,FPGA毫秒级热升从中带来很大帮助,完成技术融合与资源并池,成为神龙二代的主要着力点。

如今神龙三代已大成推出,主要集中在系统内部的优化部署,可以简单概括为芯片的硬化功能。有数据显示神龙架构和非神龙架构的业务吞吐会高30%,并且延迟保守不动,低负载和高负载完全一样;同时CPU利用率也会大幅度下降, 通俗来说原来需要一万台服务器完成的任务,现在只需几千台就可以,这就是神龙架构带来的最直观优势。

如今神龙架构已经统一整体阿里云的计算资源产品,无论是ECS还是容器以及裸金属服务器等,整个平台所有的技术红利都因此被享受到。“接下来,阿里云遍布全球的百万服务器将全面升级至第三代神龙架构。” 小邪透露,在阿里巴巴内部,神龙架构已大规模应用于淘宝、天猫、菜鸟等业务,解决高峰值的性能瓶颈问题。

今天云栖已走过十年光景,我们惊奇地发现盘点今年大秀,阿里发布了更多芯片以及硬件产品 ,软硬件一体化的趋势尤其明显。晶少觉得,随着技术不断升级发展,未来很大程度上是软件、硬件和芯片的垂直化、一体化设计,或许这也是神龙架构一代代演进以及有关阿里云基础设施变革思考的初衷。

神龙三代,集大成而来!相关推荐

  1. 数据标注、模型调参debug...通通自动化!华为云AI开发集大成之作ModelArts 2.0发布...

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 福音.AI开发门槛现在更低. 不用你编码,甚至无需AI开发经验. 如今你所需所做:只需标注一小部分数据,然后它就会帮你标注剩下数据,并且自 ...

  2. Marvell 88nv1120开卡方法集大成之作,附开卡工具

    Marvell 88nv1120开卡方法集大成之作,附开卡工具,直接上干货! 1.只针对开海力士16nm tlc的教程,别的我没有开过 2.除了jm20329的桥之外,vl711也亲测可用 3.如果是 ...

  3. 云优化,集大成的可扩展平台是硬道理

    导语:云IaaS进入成熟期,如何取得新的优化成效?如何在计算.存储.内存.安全等方面实现四位一体的可扩展平台级融合?请看新一代云优化的必由之路. 近日,Gartner发布了2019年全球IaaS市场数 ...

  4. 面试必备,各种技术知识集大成之项目~

    今天小编给大家介绍一个GitHub上的宝藏项目,真的很宝藏,可以说是技术宅必看的宝典~ 其中有各种不同领域的技术基础知识,像算法.计算机操作系统.计算机网络.系统设计等等. 每一个小项目小分支都是作者 ...

  5. 一段集大成的thymeleaf代码

    我在工作中正式用java有几个月的时间了吧,其中thymeleaf也算比较大的大头.虽然我不喜欢这个玩意,但谋生使然,现在来做一个总结.我发现我有一段代码,几乎囊括了我现阶段的thymeleaf心得. ...

  6. 【Python】列表 - 集大成篇

    目录 1.  列表的操作 1.1   索引 1.2   加法 1.3   乘法 2.  列表的成员资格 3.  列表的函数 3.1  len()  函数 3.2  max ()  函数 3.3  mi ...

  7. 【Python】字符串 - 集大成篇

    目录 1.不同语言的字符串比较 1.1.C 语言 1.2.C ++ 语言 1.2.1   C 风格字符串 1.2.2   C ++ 风格字符串 1.3.JAVA 1.4.Python 2.Python ...

  8. 【集大成篇】数据类型( C、C++、Java )对比

    1.C 语言 数据类型 关键字 取值范围 内存占用 字符型 char -128~127 1 整 型 short -32768~32767 2 int -2147483648~2147483647 (1 ...

  9. 显式锁Lock的集大成之作,最细节教程

    显式锁是什么? 我们一般喊synchronized就叫synchronized.其实synchronized又被称为隐式锁,但我们就爱喊它synchronized.而显式锁就是我们一般说的Lock锁, ...

最新文章

  1. android的UI开发工程师指引
  2. 【重大更新】DevExpress v17.1新版亮点(DevExtreme HTML5/JS篇)
  3. 三列浮动中间列宽度自适应
  4. linux+dhcp服务的安装包,服务器_Linux教程:配置DHCP服务器方法介绍,  1.安装dhcp软件包 #rpm nd - phpStudy...
  5. [SharePoint][SharePoint2013循序渐进]SPS2013简介
  6. 大屏某区域滚动效果循环
  7. android 机顶盒 view 焦点,AndroidTV/机顶盒 ListView获取焦点与点击事件问题处理方案...
  8. 新书 | Kevin P. Murphy《概率机器学习:进阶》PDF开放下载
  9. 啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊
  10. Trendmicro Officescan 服务器迁移
  11. python矩阵连乘_动态规划之矩阵连乘问题Python实现方法
  12. 上周六香山游兄弟们的合影
  13. 使用cd-hit对核酸序列或氨基酸序列聚类
  14. 去除文件系统、只读等属性
  15. 如何制作手机海报?手把手教你在线自制手机海报
  16. 【算法leetcode】1557. 可以到达所有点的最少点数目(rust和go我都要)
  17. 压缩文件7-Zip与WinRAR个人免费版在不同压缩等级下的对比
  18. 三菱R系列PLC程序 全部采用ST语言编写,内部使用函数块和结构体,程序思路清晰
  19. HBase简单API
  20. 数字系统设计VHDL实验:洗衣机控制器的设计(简易版)

热门文章

  1. 企业如何提供安全方面的投资回报率?
  2. 210322,鑫铂股份,中电电机,中信重工成交量检测
  3. 智能商贸系统02-完成基本框架,高级查询和删除
  4. 小米空调业务要打开局面需要时间
  5. 从金蝶云星空到旺店通·企业奇门通过接口配置打通数据
  6. 九度 oj 1019
  7. florr基本介绍(新手)
  8. oracle root密码重置,Exadata存储节点root用户密码重置
  9. 安卓自定义音量键_红米2|LineageOS17.0|安卓10.0|2.4编译|顶级流畅|超强跑分|全新手势|强力推荐...
  10. 百度地图第二代车道级导航“亚米级”高精度定位的背后