1. 云栖社区>
  2. 全部标签>
  3. #可用性#
可用性

#可用性#

已有0人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

CAP和BASE理论

CAP CAP是一个已经经过证实的理论:一个分布式系统最多只能同时满足一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)这三项中的两项。

数据库 cap 分布式系统 分布式存储 一致性 可用性 最终一致性 base理论 分区容错性 基本可用 软状态

使用云监控和函数计算,秒级恢复故障

云监控发布新feature,打通事件中心和函数服务,可以实现秒级故障恢复。 试想这样一个场景: 当ecs宕机时,在几秒内实现eip自动迁移至另一个健康的ecs实例,快速故障恢复,避免损失。 如何做到? 云监控之前推出了事件中心,定位于,将阿里云上发生的对用户有影响的事件,集中起来,统一展示,统一管理;同时,__可以实现在云产品异常事件发生的第一时间,对用户广播通知,同时打通了事件与函数服务,在事件发生时触发函数计算的执行,快速实现诸如eip迁移,slb带宽扩容,slb摘掉故障服务器等操作,以实现故障的快速恢复__。

架构 监控 函数 ECS 带宽 自动化运维 故障恢复 云监控 可用性

HBase read replicas 功能介绍系列

主要介绍HBase 在读可用性这块做的read replica 功能的大概介绍,包括:基本使用,读写流程的大概链路,设计的折中等等。

数据存储与数据库 分布式 hbase 线程 配置 replication 可用性

可用性监控-先于客户知道您的应用挂了

任何服务都避免不了出现以下问题,你的用户访问不了你的服务或者站点,用户偶尔碰到5xx,服务响应延迟比较慢,某台应用进程挂掉,导致访问时好时坏。问题在于,你是否要等你的用户来告诉你,你的程序是问题了。

redis 监控 RDS 主机 Image 钉钉 进程 云服务 云监控 可用性 服务监控

可用性监控-先于用户知道应用挂了

背景:任何服务都避免不了出现以下问题,你的用户访问不了你的服务或者站点,用户偶尔碰到5xx,服务响应延迟比较慢,某台应用进程挂掉,导致访问时好时坏。问题在于,_你是否要等你的用户来告诉你,你的程序是问题了_。

监控 主机 容器 钉钉 控制台 进程 云服务 云监控 可用性

【业务不裸奔系列】10秒创建本地健康检查(支持VPC环境)

定期探测本地指定路径或端口是否正常响应,当出现响应超时或状态码错误时,发送报警通知。快速发现进程存活但不再正常响应的情况。偷偷告诉你对进程挂掉、不响应假死特别有效果。

监控 HTTPS VPC 配置 Image OOM aliyun 进程 健康检查 云监控 可用性 不响应

利用Docker轻松实现云原生应用 - 高可用架构设计

最近对应用迁云的讨论很多,很多用户对云环境中的应用架构和运维方式还不了解。直接利用云服务器替换自有物理机并不是使用云的正确姿势。本文我们将介绍如何利用Docker和阿里云容器服务在云端实现应用的高可用。

redis 架构 监控 docker 阿里云 阿里云容器服务 HTTPS ECS 高可用 微服务 容器服务 容器 可用性 云原生 云原生应用

1
GO