云计算简介

简介: 云计算简介: 云计算:一群提供服务的计算机的整体 提供服务(通信网络) 云服务:用户按需消费、使用 云计算运维做什么: 7*24 小时快速响应 故障处理 备份恢复 系统安全 软件部署 监控报警 架构调优 统计分析 脚本开发(自动化) 发展方向: 资深运.

云计算简介:
云计算:一群提供服务的计算机的整体
提供服务(通信网络)
云服务:用户按需消费、使用
云计算运维做什么:
7*24 小时快速响应
故障处理
备份恢复
系统安全
软件部署
监控报警
架构调优
统计分析
脚本开发(自动化)

发展方向:
资深运维工程师
运维平台研发工程师
数据库工程师
运维总监
架构师

系统运维工程师:基础设施部署、应用环境部署、与开发协作更新应用版本、性能监控、容 量规划、备份、响应处理运维故障、优化系统性能、改善自身运维方法流程

常用的开源软件:

操作系统:centos,ubantu
网站:nginx,php-fpm,tomcat
关系型数据库:mysql nosql:redis,mongodb
代理:lvs,keepalived,haproxy
版本控制:gitlab
监控:zabbix
批量管理:ansible
打包工具:jenkins
日志分析:ELK(ElasticSearch+Logstash+Kibana)
脚本语言:shell,python

故障解决思路:
1.根据故障现象判断故障产生的影响,确定优先级
2.尽快恢复服务
a) 服务出错、假死:重启服务
b) 版本问题:保存日志待查,回滚版本
c) 资源不足:暂时关闭次要服务、紧急扩容
3.定位故障原因:
配置、版本是否变更
查看日志
4.后续完善响应监控
5.制定应急方案

运维的分类

系统运维:管理服务器、基础服务搭建、负载均衡、高可用、CDN、系统优化 
桌面运维:管理客户端、企业桌面维护、办公设备维护、网络维护
网络运维:管理网络设备、服务器上架、硬件设备故障监控、设备保修 
应用运维:参与产品设计、应用部署上线、版本更新、应用故障处理
运维研发:运维平台开发、基础设施开发(中间件、维护软件)、自动化运维 
数据库运维:数据库设计、优化、监控、备份、灾备
运维安全:制定安全制度、安全培训、风险评估、漏洞检测

服务器:能够为其他计算机提供服务的更高级的电脑(更加稳定、高效)

分类:机架式、塔式、机柜式、刀片式 

选择服务器的指标:

1.需求决定一切,着眼未来
2.不要贪图便宜,电费远比你想象的贵 
3.机房中的空间是稀缺资源,机架式比塔式性价比更高 
4.管理方便:比如螺丝少、支持远程控制 
5.硬件通用性好,尤其是驱动
6.厂商支持
7.可替代产品是否广泛
8.在一定规模范围内,云主机的性价比更高 
服务器尺寸:1U≈4.445 厘米
机柜容量:22U、37U、42U(主流) 
网络设备机柜:600 或 800mm 
服务器机柜:900 或 1000mm 
选型参数:
  支持的 CPU 颗数、CPU 核心数
  内存插槽数(最少 24 个)、最大支持内存容量 
  硬盘接口(服务器:SAS,家用机:SATA)、盘架个数、最大支持硬盘容量 
  RAID 卡支持级别、RAID 卡电池
  电源数量、整机功率

典型服务模式(C/S:Client/Server 架构):

服务器:提供资源或某种功能
客户机:使用资源、功能

架构方式:

1.SMP 服务器:主要特征是共享。系统中所有的资源(例如:CPU、内存、I/O 等)都是 共享的。扩展能力有限,最受限制的是内存,当 CPU 数量增多时,会导致内存紊乱,降低 CPU 效率。效率最高的 CPU 数量是 2~4 个
2.NUMA 服务器:主要特征是具有多个 CPU 模块,每个 CPU 模块由多个 CPU 组成,并且 具有独立的内存、I/O 等。当需要运行大内存应用时,需要向其他模块借调内存 

CPU 选择:

1.主要指标有缓存、主频、核心数量,服务器的 CPU 一般都是 XEON 
2.CPU 物理核心数量越多,并发行越强,不包括超线程。超线程在 CPU 密集型计算, 高负载的时候没有任何效果,甚至还会拖慢系统速度 
3.CPU 主频越高单次计算速度就越快 
4.CPU 缓存大的性能好 
5.不同主频的内存不要混插
6.多通道的一定要按组接入,多 CPU 的按组对称分布,一般主板内存槽同组都会标示 相同的颜色 
7.RAID 卡很重要,带高速缓存的好,带备用电池单元的好,硬 RAID 卡(自带数据存 储和专用 CPU)比软 RAID 卡好 

硬盘选择:

1.硬盘转速
2.做 RAID 不能混用 
3.SSD 在随机 I/O 读写上性能非常好 
4.在格式化 SSD 分区的时候要注意对齐,影响 I/O 速度 
5.在内核队列上选择 NOOP 效果比较好 
功耗:如果选配的最大功耗大于电源模块的最大输出就需要考虑购买多个电源模块。电源不 考虑冗余
基于智能平台管理接口(IPMI:Intelligent Platform Management Interface)协议的服务 器带外管理工具
让用户通过网络来监控服务器上各种硬件组件的健康状况,如 CPU 电压、风扇转速、系 统温度、功耗等,开放的免费标准 
DELL 的管理命令:IPMITOOL 
DELL 工具名称:iDRAC
参数:-U 登陆用户名 
  -P 登陆密码
  -H 远程主机地址
  -power 电源管理模块 
  -sel 硬件日志管理 
  -sol 串口重定向

网络设备选型:

交换机:端口数量、端口速率、背板带宽、POE 供电(有源以太网) 
路由器:内存、flash、协议支持、模块扩展
相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
4月前
|
存储 数据管理 虚拟化
云计算——存储虚拟化简介 与 存储模式及方法
云计算——存储虚拟化简介 与 存储模式及方法
162 0
|
4月前
|
存储 大数据 虚拟化
【云计算与大数据技术】虚拟化简介及虚拟化的分类讲解(图文解释 超详细)
【云计算与大数据技术】虚拟化简介及虚拟化的分类讲解(图文解释 超详细)
255 0
|
4月前
|
网络虚拟化 虚拟化 云计算
云计算——网络虚拟化简介
云计算——网络虚拟化简介
116 0
|
4月前
|
分布式计算 并行计算 Hadoop
【云计算与大数据计算】分布式处理CPU多核、MPI并行计算、Hadoop、Spark的简介(超详细)
【云计算与大数据计算】分布式处理CPU多核、MPI并行计算、Hadoop、Spark的简介(超详细)
103 0
|
7月前
|
存储 弹性计算 云计算
HCIE-Cloud Computing Day01:云计算简介
HCIE-Cloud Computing Day01:云计算简介
270 0
|
存储 云计算
知识学堂:几个开源云计算平台简介
本文讲的是知识学堂:几个开源云计算平台简介,Abiquo公司帮助用户建立,管理以及扩展复杂的计算架构。具体开源云计算产品有三类,三种产品分别是abiCloud, abiNtense和abiData。这三种产品都可以用来架构和开发公有私有混合云,以及云应用等的基础设施。
1656 0
|
存储 数据中心 云计算
《云计算:原理与范式》一第1章 云计算导论1.1 云计算简介
本节书摘来自华章出版社《云计算:原理与范式》一书中的第1章,第1.1节,作者 (澳)Rajkumar Buyya James Broberg Andrzej Goscinski,更多章节内容可以访问云栖社区“华章计算机”公众号查看
1766 0
|
存储 分布式计算 大数据
什么是HADOOP、产生背景、在大数据、云计算中的位置和关系、国内外HADOOP应用案例介绍、就业方向、生态圈以及各组成部分的简介(学习资料中的文档材料)
1. HADOOP背景介绍 1. 1.1 什么是HADOOP 1.        HADOOP是apache旗下的一套开源软件平台 2.        HADOOP提供的功能:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理 3.        HADOOP的核心组件有 A.       HDFS(分布式文件系统) B.       YARN(运算资源调度系统) C.  
3014 0