神龙架构没那么难理解—图解世界领先的阿里云神龙架构(一)缘起

简介: 本文为神龙架构没那么难理解—图解世界领先的阿里云神龙架构的第一篇,介绍的是虚拟化技术的瓶颈问题,解决这个瓶颈问题是发明神龙架构的出发点

作者:朱祺 阿里云全球最有价值专家

1 概述

1.1 神龙架构的特点

阿里云官方文档对于神龙架构的描述如下:
保留了普通云服务器的资源弹性,并因嵌套虚拟化技术让弹性裸金属服务器保留了物理机的体验。

1.2 理解上的难点

同时拥有云服务器的资源弹性和保留了物理机体验的特点容易让用户在需要深入了解神龙架构时产生一个疑问:神龙架构到底是虚的还是实的,如果虚实融合又怎么来理解什么是虚实融合?通过什么手段做到的?

1.3 本文重点说明的问题

结合以上神龙架构的特点和理解上的难点,本文详细的对于神龙架构进行研究分析,说明神龙架构是如何做到同时拥有云服务器的资源弹性和保留了物理机体验的目标的。

2 为什么需要发明神龙架构

2.1 以搬砖为例说明虚拟化技术的特点

把物理机变成虚拟机的这个技术,就是“虚拟化”。比如我家里装修有100块砖需要搬运,邻居家也在装修同样有100块砖需要搬运,我们各请了50个搬运工,当工人到达时发现邻居家的主人在睡觉,因此他家的50个工人只能等他睡醒再搬砖,我家请的50个工人则可以直接帮我开始搬砖,情况如下图所示:
image.png
正好两家的工人来自于同一个公司于是包工头过来看了一下,发现邻居家的工人在空闲状态觉得效率很低。于是决定既然邻居家的工人目前空闲于是一起来帮我家搬砖。和我商量费用并不增加,工人增加50个,我自然非常开心,觉得多给了我家50个工人。于是邻居家的工人也过来开始帮我家搬砖如下图所示,我们称这个100个工人为计算节点:
image.png
包工头心里在想一个事情,他马上需要去其他工地,现在100个工人都在帮我家搬砖,因此进度很快,但是邻居万一睡醒了也要开始搬砖怎么办,于是他抽了一个工人甲出来看着邻居家动静,一旦邻居家醒了需要开始搬砖,则把暂时帮我家搬砖的工人还给他并且工人数量至少50个。
于是甲离开了搬砖行动,专门看着邻居家主人防止他突然醒过来,帮我家搬砖的工人数目前为99个。这个负责关心邻居家主人睡觉情况并负责后续把工人还给他的甲,我们称他为管理节点。
image.png
邻居家主人睡醒了,甲于是立即从我家将50个工人安排到邻居家开始搬砖,同时和我商量,因为之前我家搬砖的劳动力多了一倍,因此1000块砖被搬了只剩50块了,而邻居家的砖还是1000块,因此除了邻居雇佣的50个工人外能否我家只留5个工人,我自己雇佣的45个工人也帮邻居家搬砖,我欣然同意,因此两家搬砖的工人数再一次改变如图所示:
image.png
这个整个过程即为弹性计算的本质,前提即是虚拟化,如果缺少了虚拟化技术,代表我和邻居家雇佣的工人来自于两个公司,没有人来统筹决定每家搬砖的工人数,因此即使邻居在睡觉,他雇佣的工人空闲着也无法过来帮我搬砖,能够做到搬砖的工人灵活调配的前提就是将两家人家雇佣的工人进行统筹考虑再进行分配。对于用户的好处在于,我和邻居家都有1000块砖要搬,但是搬砖的时间不同,我在搬砖的时候他在睡觉而他睡醒需要搬砖的时候我家的砖已经快搬完了,同样100个工人的劳动力在不同的时间段里被我们用到了极致。

2.2 虚拟化技术的瓶颈

从以上搬砖的例子中可以发现,因为工人甲负责协调我和邻居家搬砖的工人安排因此他本身不再负责搬砖,也就是100个劳动力中抽调了1个工人的劳动力来做管理工作,实际搬砖的劳动力为99个。按照原来雇佣的劳动力,我家雇佣了50个工人,邻居家雇佣了50个工人,总的劳动力为100人,因此实际搬砖的劳动力少了1个,但因为我和邻居家搬砖时间的错开并且以我们的感受都享受到了远大于50个工人的劳动力(实际我家99个,邻居醒来后他家为94个)因此满足我们的需求,也就并不太在意100个工人中有1个来作为协调我们两家工人数的管理人员。隐患在于如果我家砖搬完了,邻居家的搬砖工人上升到99个,他发现需要再快一点,要求100个工人搬砖,这时候我和邻居将同时发现劳动力因为有人去做管理工作而少了一个,我们两家总共花了100个工人的钱,却总共只能享受到99个工人的劳动力。
事实上这1个管理人员确实是整个体系中无法解决的瓶颈,代表只要采用虚拟化和弹性计算,就代表100个劳动力必须选择1个管理人员,实际上只能有99个劳动力进行搬砖。反映到云计算上就是只要物理服务器采用虚拟化技术,就必须配置管理节点,因此单台物理服务器所提供的计算力在原来的基础上需要打折扣,造成物理服务器基础上采用虚拟化技术后生成的云服务器的计算性能必然比物理服务器要差。虽然用户因为云服务器集群的弹性计算功能未必能感受到。
这个瓶颈原来在云服务提供商中都存在,似乎成为了必然,因为觉得没有办法解决因需要管理节点而造成的总计算力损失因此也没有云服务商去讨论深究这个问题。而阿里云神龙架构即破天荒的在这个瓶颈问题上开始动刀子,想做到的目标就是既然100个工人搬砖,就要全部搬砖,但同时也需要有手段来管理和控制我家和邻居家不同时间搬砖的工人数。

相关实践学习
快速体验PolarDB开源数据库
本实验环境已内置PostgreSQL数据库以及PolarDB开源数据库:PolarDB PostgreSQL版和PolarDB分布式版,支持一键拉起使用,方便各位开发者学习使用。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
阿里云资深架构师经验分享——DevSecOps最佳实践
本文将分享阿里云在DevSecOps中设计环节的实践经验,希望能够让大家理解阿里云是如何保障产品安全水位,并希望这些经验能够帮助到正在尝试落地DevSecOps解决方案的企业。
阿里云资深架构师经验分享——DevSecOps最佳实践
基于阿里云的开源应用智能管理架构设计与工程实践
本文以Websoft9技术方案为例,探讨企业级应用管理的范式。通过解析开源应用管理面临的部署复杂性、运维低效性和知识碎片化三大挑战,提出基于阿里云的三层架构:智能应用管理门户、核心功能层和基础设施层。文章详细阐述了应用编排标准化(IaC实践)、智能运维体系构建及知识资产数字化的技术实现路径,并结合金融与制造行业的案例,展示解决方案的实际效果。最后提供开发者资源与工具链支持,助力企业高效管理应用。
79 1
深度用云——释放企业潜能 | 网络先行——阿里云网络卓越架构白皮书正式发布
深度用云——释放企业潜能 | 网络先行——阿里云网络卓越架构白皮书正式发布
刷新世界纪录!阿里云PolarDB凭借创新的「三层解耦」架构刷新TPC-C基准测试世界纪录
刷新世界纪录!阿里云PolarDB凭借创新的「三层解耦」架构刷新TPC-C基准测试世界纪录
基于阿里云Serverless Kubernetes(ASK)的无服务器架构设计与实践
无服务器架构(Serverless Architecture)在云原生技术中备受关注,开发者只需专注于业务逻辑,无需管理服务器。阿里云Serverless Kubernetes(ASK)是基于Kubernetes的托管服务,提供极致弹性和按需付费能力。本文深入探讨如何使用ASK设计和实现无服务器架构,涵盖事件驱动、自动扩展、无状态设计、监控与日志及成本优化等方面,并通过图片处理服务案例展示具体实践,帮助构建高效可靠的无服务器应用。
基于阿里云容器服务(ACK)的微服务架构设计与实践
本文介绍如何利用阿里云容器服务Kubernetes版(ACK)构建高可用、可扩展的微服务架构。通过电商平台案例,展示基于Java(Spring Boot)、Docker、Nacos等技术的开发、容器化、部署流程,涵盖服务注册、API网关、监控日志及性能优化实践,帮助企业实现云原生转型。
后端服务架构的微服务化转型
本文旨在探讨后端服务从单体架构向微服务架构转型的过程,分析微服务架构的优势和面临的挑战。文章首先介绍单体架构的局限性,然后详细阐述微服务架构的核心概念及其在现代软件开发中的应用。通过对比两种架构,指出微服务化转型的必要性和实施策略。最后,讨论了微服务架构实施过程中可能遇到的问题及解决方案。
云计算的未来:云原生架构与微服务的革命####
【10月更文挑战第21天】 随着企业数字化转型的加速,云原生技术正迅速成为IT行业的新宠。本文深入探讨了云原生架构的核心理念、关键技术如容器化和微服务的优势,以及如何通过这些技术实现高效、灵活且可扩展的现代应用开发。我们将揭示云原生如何重塑软件开发流程,提升业务敏捷性,并探索其对企业IT架构的深远影响。 ####
99 3
云原生架构下的微服务治理与挑战####
随着云计算技术的飞速发展,云原生架构以其高效、灵活、可扩展的特性成为现代企业IT架构的首选。本文聚焦于云原生环境下的微服务治理问题,探讨其在促进业务敏捷性的同时所面临的挑战及应对策略。通过分析微服务拆分、服务间通信、故障隔离与恢复等关键环节,本文旨在为读者提供一个关于如何在云原生环境中有效实施微服务治理的全面视角,助力企业在数字化转型的道路上稳健前行。 ####

热门文章

最新文章