《大型网站服务器容量规划》——2.2 服务器容量规划的源由

简介:

本节书摘来自异步社区《大型网站服务器容量规划》一书中的第2章,第2.2节,作者: 郑钢 更多章节内容可以访问云栖社区“异步社区”公众号查看。

2.2 服务器容量规划的源由

为什么要做容量规划呢?当资源涉及的成本变得非常可观时,势必就需要容量规划,谁也不愿意花冤枉钱。

做运维工作的读者都应该了解SLA(Service-Level Agreement),即服务等级协议,这是关于网络服务供应商和客户间的一份协议,其中定义了服务类型、服务质量和客户付款等术语。可能我们不那么关注这份协议的细节,但我们最了解的是SLA中的“几个9”,如表2.1所示。


<a href=https://yqfile.alicdn.com/2e71224e383dbaecf0ab1905f5b7ef0e5abff376.png" >

      

根据产品线的重要程度,公司会将不同产品线划分成多种级别,每种级别产品线的SLA也是不同的。如一级产品线的SLA可能是99.999%,二级产品线可能是99.99%,为保障产品线的稳定,各产品线的项目经理给每个运维人员都制定了关键绩效指标,即KPI(Key Performance Indicator)。运维人员都清楚,保证产品的服务稳定是我们的职责,即使不签KPI我们也会竭尽全力地投入到工作中(尽管完不成KPI的话可要扣工资的),所以,运维人员对服务的稳定性特别敏感,但凡会让服务不稳定的因素,运维人员都会将其排除,如下架服务器。

通常,为了业务的稳定,大多数公司在硬件,如服务器方面的投入都是过饱的,认为机器越多,服务越稳定,宁可闲着不用也要确保业务不受损。因此,空闲着很多机器资源,所以很多时候,大公司的运维部发愁的是机器该如何使用。

一般情况下,公司服务器的总体资源利用率长期处在较低水平,CPU利用率都在20%左右,总的来看,我们有大量的计算资源和存储资源闲置,造成巨大浪费,这也直接导致我们的服务成本偏高。所以,提供同样质量的服务,我们可以减少一些服务器,以更低的成本来实现。

各部门都有自己的理由,公司财政方面又很有压力,于是需要在成本和服务稳定性方面找个平衡点,要花更少的钱提供同样稳定的服务,于是容量管理项目就浮出水面。

想想为什么运维人员会拼命把机器留住呢?无非是担心机器资源减少后会导致服务不稳定,如果给运维人员提供一套容量规划的方法,让容量“可见”,让运维人员对服务质量放心,那么下架机器就不会那么为难了。

总的来说,容量管理系统对于提高资源利用率,降低服务成本有着可观的经济效益。

相关文章
|
弹性计算 容灾 关系型数据库
阿里云服务器ECS中扩容云盘后磁盘容量没有增加的解决方法
ECS控制台操作扩容只是扩大云盘的存储容量,不会扩容ECS实例的文件系统。还需要登录实例,然后进行扩容文件系统的操作。
1195 0
阿里云服务器ECS中扩容云盘后磁盘容量没有增加的解决方法
|
2月前
|
存储 弹性计算 对象存储
ECS快照问题之查看ECS快照容量失败如何解决
阿里云ECS用户可以创建的一个虚拟机实例或硬盘的数据备份,用于数据恢复和克隆新实例;本合集将指导用户如何有效地创建和管理ECS快照,以及解决快照过程中可能遇到的问题,确保数据的安全性和可靠性。
|
7月前
|
Java 数据库 Spring
Spring Boot 生产环境出现问题,且问题莫明其妙 有可能是服务器的容量不足
今天系统莫明使用不了,同事跟我说昨天还好好的,今天突然就不行了。一想服务器没有动过,不会有什么问题呀!于是查看日志,查看数据库是都没有问题。心里非常不解,但是问题却一直存在。花了大概1小时,还是没有找到问题,最后看一眼服务器的容量,发现使用率为100%,顿时知道发生了什么事,将容量解放,重启服务问题就解决了。 像这种错误,如果没有检查服务器,估计到死都不知道是这样产生的。
43 0
|
10月前
|
存储 机器学习/深度学习 弹性计算
热门实践丨如何结合实际业务进行 ECS 规格选型与容量验证
热门实践丨如何结合实际业务进行 ECS 规格选型与容量验证

热门文章

最新文章