阿里云SRE技术社区 + 关注
手机版

客户端证书错误避坑指南

HTTPS作为站点安全的最佳实践之一,已经得到了最广泛的支持。然而在实际生产过程中,由TLS/SSL握手失败引起的连接异常问题依然十分常见。本文将结合mPaaS(https://www.aliyun.com/product/mpaas)客户...

android 服务器 加密 配置 SSL Image 解决方案

新金融分布式架构之SOFAStack解决方案

金融行业正在流淌着一股去IOE,去集中化的IT架构转型洪流。我有幸参与到这股洪流中,见证这一重大变革。本文是我对这股洪流的一些思考和想法。

架构 高可用 数据库 互联网 微服务 可扩展性 Image 解决方案 分布式架构 容灾

【SRE学堂第一讲】OSS从入门到精通 - 产品综述

阿里云SRE团队首次推出SRE学堂,我们精选了广大客户主流部署的云产品进行由浅入深的系列介绍,目的是让使用阿里云的客户对产品有一个相对全面的了解。同时也希望读者能够反馈后续希望学习了解的产品,我们将根据需求不断推出更新。

OSS 集群 钉钉 对象存储 存储

阿里速度! SRE团队全力保障多地健康码顺利上线

2020年初,新冠肺炎疫情爆发。春节后,企业要复产,百姓要复工,政府需尽快保障各项工作有序开展。如何精准防控,统筹疫情期间的各项工作,有序稳健恢复经济社会秩序,成为当务之急。对此,阿里巴巴快速反应,除各种物资支持、政策响应外,还配合多地政府...

监控 高可用 Image 钉钉 云平台

阿里高可用架构建设实践经验

随着业务在线化互联网化的高速发展,企业对核心业务系统的稳定性、可靠性、有效性、业务连续性等有了更高的要求。采用高可用系统架构支持重要系统、为关键业务提供7x24的不间断服务,已经成为众多企业保障业务稳定、持续运转的主要选择。

架构 监控 高可用 钉钉 解决方案 云平台

稳定平滑进行云上业务IPv6化改造—— Series1:改造思路及CDN改造

随着国家工信部印发的《推进IPv6规模部署行动计划》的深入推进,近期国资委相关的大型国企都开始着手进行业务的IPv6化改造,其在阿里云上的门户及B2B、B2C等对外业务,自然进入第一批改造的范围。本文是基于在具体客户的IPv6化过程中积累的...

架构 域名 ECS 数据处理 数据流 配置 Image cdn 钉钉 slb DNS

健壮且灵活的混合云网络—— Series1:组网建设

云计算技术发展到现在,已经形成了两种主要的形态:公共云和专有云,它们分别有各自的优势。专有云能够对数据的安全性和服务质量进行最有效的把控,企业选择专有云是基于自身信息化建设的考虑,构建安全自主可控的基础架构环境等。

架构 VPC 配置 钉钉 容灾 带宽

DNS规范化—— Series1:DNS客户端行为梳理

现代系统大量依赖DNS提供的便捷的名称和IP映射关系来获取更好的适配性和稳定性(包括流量引导、均衡请求等功能),DNS的规范配置和使用变得越来越重要。因此,笔者将通过几篇系列文章来详细梳理下DNS的行为。

linux 服务器 windows 高可用 配置 浏览器 主机 操作系统 钉钉 Server DNS service

网络稳定的第二道屏障: 带外网络DHCP异常排查方案

网络管理通常可分为带外管理(out-of-band)和带内管理(in-band)两种管理模式,带外网络是通过独立于数据网络之外的专用管理通道对机房网络设备(路由器、交换机、防火墙等)、服务器设备(小型机、服务器、工作站)以及机房电源系统进行...

大数据 服务器 高可用 Image 钉钉 云平台

浅谈异地多活及阿里云容灾经验分享

异地多活,英文Multi-Site High Availability,顾名思义就是分布在异地多个站点同时对外提供服务。与传统灾备最主要的区别是“多活”里所有站点都是同时在对外提供服务的,具体有以下几点不同: - 传统的灾备中心平时不提供...

架构 高可用 集群 电商 数据同步 容灾 云平台 数据中心 异地

奠定上层系统稳定安全的基石: 专有云V3网络架构介绍

网络是奠定上层系统稳定和安全的重要基石。目前专有云版本以V3居多,且V2版本也将于2020年12月31日停止服务和技术支持。本文将对V3版本的专有云网络架构进行介绍。

安全 架构 服务器 模块 Image 钉钉 带宽

基于专有云EDAS OpenAPI构建企业级云原生CICD——Series1:概述及准备

本次最佳实践通过打通客户侧GitLab、Jenkins与专有云企业版提供的EDAS和ACK来帮助客户构建端到端企业级云原生CICD流水线。具体实现思路为通过JAVA编写一个EDAS-SDK适配插件,Jenkins通过在脚本库预先设置的SHE...

最佳实践 配置 镜像 中间件 Image 钉钉 控制台 openapi git EDAS gitlab jenkins

RocketMQ高可用探究:消息存储技术

RocketMQ是阿里开源的分布式消息中间件,跟其它中间件相比,RocketMQ的特点是纯JAVA实现、集群和HA实现相对简单、在发生宕机和其它故障时消息丢失率更低,具有良好的高可用架构及稳定性。其发展的迭代历史如下图所示,从2007年至今...

架构 性能 高可用 中间件 钉钉 索引 内存映射 磁盘 存储

云数据库高可用—— Series1:MySQL主从复制原理背景

高可用是系统架构设计中必须考虑的因素之一,主要目标是消除基础架构中的单点故障,通常表示为一个百分比,表示在给定时间段内特定系统或组件的正常运行时间,其中100%表示系统永不失效。而任何的单机系统因受限于软硬件的限制,如硬件损坏、操作系统崩溃...

日志 线程 高可用 数据库 集群 钉钉 同步 云数据库 单点故障 数据同步 云平台 binlog

铜雀:阿里云智能巡检管家

作为阿里云云平台告警信息与监控的统一门户,铜雀专注于智能化巡检及问题诊断,是阿里云SRE混合云TAM和驻场服务团队日常工作中的首要工具。它能将TAM和驻场服务团队从日常繁琐的巡检工作中解放出来,将精力投入到更有价值的客户服务中去,通过打通云...

监控 日志 配置 云平台 SRE混合云运维工具

TAC报警中心: 专有云告警生命周期一站式管理运维平台

TAC报警中心是阿里云SRE混合云团队为专有云精心打造的一站式告警运维平台,覆盖专有云所涉及的云产品、大数据、云实例以及用户所涉及的站点应用等告警,提供告警生命周期管理以及报警外发等解决方案。帮助专有云快速发现、定位异常问题,协助产品团队进...

大数据 架构 监控 配置 钉钉 监控工具 云平台 SRE混合云运维工具

封神榜:智能运维服务助手

封神榜是阿里云SRE混合云团队提供的从业务、产品、安全、故障四个维度对项目进行全方位监控的运维服务工具,可实现为不同关注点的客户提供问题、故障、性能、容量、优化建议等运维内容推送。帮助现场第一时间发现问题与故障并量化,提高复杂问题定位与处理...

安全 监控 性能 钉钉 云平台 SRE混合云运维工具

阿里云智能全球技术服务部(GTS)-SRE团队于2019年正式成立,由原专有云、公共云的TAM团队及集团高可用基础技术团队融合而成,是阿里为确保客户平台稳定、业务连续而打造的核心支撑团队,也是阿里集团高可用基础技术核心缔造团队,为集团设计和建设了异地多活、大促容量规划、限流降级、开关预案、流量调度、故障演练、资损防控等高可用架构基础设施,深度参与支持了集团历年双11大促的技术保障工作。团队核心技术源于集团双十一最佳实践,形成以PTS、AHAS等商业化产品输出的方式帮助客户一次又一次安全度过大促流量高峰,同时积极参与开源社区高可用能力的建设,团队开源的Sentinel和ChaosBlade已成为极具影响力的领域技术。 通过 SRE技术社区,我们期望:一. 将阿里云智能最先进的产品、运维技术传递给不同行业的客户和伙伴,帮助大家更全面、深入地了解阿里云的产品。二. 促进技术上互相交流,取长补短,打造阿里云产品运维人社区论坛,共同促进阿里云产品的不断完善。

6
+ 关注
2
成员
18
文章