裸金属服务器业务(BMS)的现状调研2:Aliyun X-Dragon System

大约从2017年开始,裸金属服务器业务就逐步成为业界热点之一,裸金属服务器业务从表面上看,和传统的IDC业务有很大的相似之处,即都是出租物理机、带宽和相关的资源,但是存在一个很大的差异就是,裸金属业务是一种可以被管理的线上业务,而IDC业务则是线下开通的业务,貌似相似的表面之下,技术含量有很大的差异。目前主流的云计算服务商,包括AWS、Azure、阿里、腾讯、华为、IBM、Oracle、Packet等8个企业,都有裸金属业务。但是这些单位的裸金属业务还是有些不一样的,有篇文章《裸金属:技术演进及主流厂商策略分析》介绍了一些大体情况,还是比较通俗易懂的。文章《阿里云弹性裸金属服务器-神龙架构(X-Dragon)揭秘》介绍了阿里云的神龙裸金属架构,算是相对清晰的一篇文章。

系列文章如下:

第一篇:裸金属服务器业务(BMS)的现状调研1:AWS Nitro System

第二篇:裸金属服务器业务(BMS)的现状调研2:Aliyun X-Dragon System

第三篇:裸金属服务器业务(BMS)的现状调研3:Tencent Cloud Physical Machine

第四篇:裸金属服务器业务(BMS)的现状调研4:Huawei Bare Metal Server

为啥非要裸金属呢,唯一的原因就是降低VM的性能损耗,所有号称性能损耗小的VM技术,实际上还是有5-15%甚至更高的损耗,这种损耗在VM规格增大的时候,也会增大。裸金属的优点就是降低损耗,同时裸金属也带来一个额外的好处就是可以做更大规格的虚拟机。第二个额外的好处是裸金属可以支持将异构的VM技术,例如VMware迁移到公有云上,也包括各种新型的Linux、容器迁移到公有云上,例如VMware SDDC on AWS。粗略地想想,要做到VMware Over BMS,预计还是要改造VMware来适配的。

一、使用专门的硬件和Hypervisor

所有的裸金属服务中,AWS和阿里的比较像:均采用了专有的硬件和配套的Hypervisor,GuestOS依然运行在Hypervisor上,但是GuestOS可以直接访问存储(如NVMe)和网络(如25Gbps)等硬件,就好像访问本地设备一样。

2、阿里云 X-Dragon系统

阿里的神龙,网上的材料不多,所有的内容都来自飞天技术汇的一个75分钟的科普性质的访谈(狒哥 访谈 阿里旭卿)。这个访谈展示了神龙服务器和MOC卡,这两个属于神龙裸金属服务器的核心。但是技术性的内容并不多。吐槽下,有时候转专家想介绍一些深入的内容,结果又被主持人拉回到科普上面,车轱辘话说了75分钟。下面分析一下网上可以检索到的一些内容

【引文】基于神龙架构的阿里云弹性裸金属实例ebmhfg5.2xlarge(8vCPU) 在10000位圆周率计算Superπ中跑出了1分26秒的成绩,比AWS基于Nitro架构计算型实例c5.2xlarge(8vCPU)快了15%。神龙架构的弹性裸金属服务器已正式商业化售卖,支持8核、16核、32核、96核等多个CPU规格,并支持3.7 GHz~4.1 GHz的超高主频实例。

【五哥:严格地说,AWS的C5实际上不算是Nitro系统。C5处理器是Xeon白金版,3.0GHz,c52x是8c16GiB,使用ENA技术的实例,而阿里云的ebmhfg5.2xlarge实例配置是8c32GiB,处理器是3.7GHz的Xeon E3 1240v6。主频差别很大,白金版和Xeon的主要差别是安全性,因此可比性有些不妥,两者的主频差别很大,计算圆周率,主频越快,显然时间越短,如果优化的好,长时测试,阿里云的时间应该缩短20%】

【五哥:计算圆周率的小程序 Super π是Windows程序,用于测算CPU稳定性,引用网文,一般计算104万位,似乎测试10000位有些少 】

【五哥:用Super PI测试裸金属的意义不大,应该使用访问本地存储、EBS和网络的测试用例】

【五哥:中国站,EBM实例只有2种,每种只有1个配置,其他配置或许是测试版】

引文】硬件配置方面采用Intel最新的可扩展至强平台,最高可以配置铂金牌Xeon 8163,最多96个核心——Intel公开发布的型号中并没有这一款,看来是阿里云定制的,应该是颗24核心,四路并行——与之最接近的铂金牌Xeon 8168也是24核心,批发报价5890美元,定制的只会更贵。 除此之外还可以选择8核心、16核心、32核心、64核心等不同配置,其中8核心的主频为3.7-4.1GHz,同样应该是定制的,与之最接近的8核心金牌Xeon 6144主频为3.5-4.2GHz,批发报价2925美元。 另外,内存可选最低32GB,最高768GB DDR4-2666,搭配25Gbps带宽、400万收发包能力的高性能网络,并支持挂载多块SSD云盘,每块最大容量32TB

【五哥:Intel网站确实没有8163这个型号,最高是28core的8176,报价9284$,这个和文后的网页型号确实有所不同,不知道怎么定制出来96core,下次打听下再报告】

image_thumb14

解说中,说神龙服务器上那两个卡,一个是GPU,一个是MOC卡。外观倒是一模一样。

image_thumb21

image_thumb23

image_thumb25

image

MOC是全高、半长、两倍厚度PCIe卡,看上去其中有3个电口,2个光口,1个USB。没有弄明白颜色的区别,以及光口和电口的区别。可能是一组用于EBS主备,一组用于网络主备,这个玩意是侧插在另外一个接口卡上的,接口卡插在主板上

image_thumb28

image_thumb31

上图中,下面部分是中心结构,整个X-Dragon Hypervisor完完全全运行在这张卡上面。它是支持云盘、支持VPC网络、支持存储/网络设备热插拔、支持32块弹性物理网卡同时对X86、ARM、Power等CPU是兼容的。没有本地存储。

image_thumb33

再让我们看看阿里EBM的价格,通用型每年11万RMB(96核、384G),高主频每年1.5万RMB(8核32G)

image_thumb[2]

(注:图中有一个文档错误,两处1:4的标点,一个是中文,一个是英文)

相关信息:

  1. 裸金属:技术演进及主流厂商策略分析
  2. 华为云将全面开启裸金属云时代
  3. 阿里云弹性裸金属服务器-神龙架构(X-Dragon)揭秘
  4. 云计算史上的第一次开箱直播 阿里云神龙技术架构首次全方位曝光
  5. 宣布正式发布 Amazon EC2 裸机实例
  6. Amazon EC2 Bare Metal Instances with Direct Access to Hardware
  7. AWS Releases EC2 Bare-Metal Instances
  8. 详解华为云BMS裸金属服务与专属云DeC解决方案
  9. 【云知易】BMS入门 01 创建裸金属服务器
  10. The Nitro Project: Next-Generation EC2 Infrastructure – AWS Online Tech Talks
  11. Amazon EC2 Bare Metal Instances – CMP330 – re:Invent 2017
  12. Transform Your Business with VMware Cloud on AWS: Technical Overview
  13. Transform your Business with VMware Cloud on AWS, an Integrated Hybrid Approach
  14. MongoDB:AWS to Bare Metal: Motivation, Pitfalls, and Results
  15. ScyllaDB: Measuring Database Performance on Bare Metal AWS Instances
  16. AWS Nitro Hypervisor FAQ
  17. AWS EC2 Virtualization 2017: Introducing Nitro
  18. Getting Started with VMware Cloud on AWS
  19. B站:阿里云神龙(弹性裸金属服务器)架构首次开箱
  20. 阿里云弹性裸金属服务器-神龙架构(X-Dragon)揭秘
  21. 阿里云发布神龙云服务器:96核心+768GB内存
  22. So Amazon Develops Its Own NIC — AWS Enhanced Networking!
  23. Superπ 1.2 汉化版
  24. Intel® AVX-512
  25. Intel® Xeon® Platinum processors
  26. Intel Xeon processors
  27. https://www.nvidia.com/zh-cn/data-center/nvlink/

裸金属服务器业务(BMS)的现状调研2:Aliyun X-Dragon System》有3个想法

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注