本节书摘来自异步社区《数据中心设计与运营实战》一书中的第1章,第1.3节,作者: 【美】Luiz André Barroso , 【美】Jimmy Clidaras , 【瑞士】Urs Hölzle 更多章节内容可以访问云栖社区“异步社区”公众号查看。
1.3 不只是服务器的集合
我们核心的观点是,驱动现今很多成功的互联网服务的数据中心已经不再是将五花八门的服务器放在一起,连上网线这么简单的了。运行在这些系统上的软件,诸如Gmail和Web搜索服务,是使用着超越单一服务器和单一机架规模的、成百上千的独立服务器组成的集群。因此,每个设备和服务器都是这个大集群或者服务器集合的组成部分,要被视作单一计算单元。
设计WSC的技术挑战,丝毫不亚于其他任何级别的计算机系统架构。首先,它们是由新的迅速增长的需求所驱动的新一类大规模系统。仅规模一项,就使其很难进行实验或效率模拟。因此,系统工程师必须开发新技术来指导设计决策。此外,失效处理、电力和能源方面的考虑对数据中心的设计会产生更显著的影响,也许远远超过其他较小规模的计算平台。最后,WSC有一个比单个服务器或者小服务器群构成的系统更复杂的附加的层面。WSC引入了一种软件编程的新挑战,这种挑战甚至超过了对构成WSC的单个多核系统的编程。这种额外的复杂性由应用域的规模间接产生,表现为更深层次和不均匀的存储层次结构(在本章后面讨论)、高故障率(第7章),以及更大可能的性能波动(第2章)。
本书的目的是为读者介绍这一全新的设计领域,描述了WSC的一些需求、特点,以及独一无二的挑战,分享了一些Google公司内关于的设计、规划和运营方面的经验。幸运的是,我们既是WSC的设计者,也是该平台的规划者和用户,它给我们提供了难得的机会在产品的整个生命周期中评估设计决定。我们希望我们的热情能引起大家对该领域的关注并进行广泛研究和技术交流。