演练系统事件处理程序? So Easy~

  1. 云栖社区>
  2. 弹性计算>
  3. 博客>
  4. 正文

演练系统事件处理程序? So Easy~

betabao 2018-08-22 19:40:04 浏览1023

演练事件处理程序有点难

ECS实例系统事件是影响实例运行状态的有计划或非预期事件。为了ECS实例上的业务平稳运行,最佳的做法是通过程序自动化地处理事件。您可以参考这篇文章:使用OpenAPI自动化处理ECS系统事件
但这里有一个问题,程序写完了不好测试。系统事件是系统在特定场景下生成的,不一定能人工触发;ECS实例跑的很稳定,总是不出问题,几个月也没等到一个事件。我们需要一种方式来方便地演练事件处理程序。

ECS演练OpenAPI

ECS提供了一对用来演练事件处理程序的OpenAPI:CreateSimulatedSystemEvents和CancelSimulatedSystemEvents,分别用来创建和取消模拟系统事件。
什么是模拟系统事件?模拟系统事件是专门用来演练系统事件处理程序的。通过设置一个模拟系统事件,您可以从OpenAPI、控制台、云监控等等事件消费渠道中看到和真实事件一样的数据。
除了产生事件数据,模拟事件还会模拟事件的生命周期变化。

  • 在用户设置了模拟系统事件后,该事件处于待执行(Scheduled)状态
  • 在到达计划执行时间(NotBefore)后,事件将转变为执行中(Executing)状态,然后很快变成已执行(Executed)状态
  • 模拟事件也会响应用户操作,比如对于SystemMaintenance.Reboot事件,用户在计划执行时间(NotBefore)之前重启实例,事件将变为已避免(Avoided)状态
  • 用户可以在事件未完结前,调用CancelSimulatedSystemEvents取消事件,事件将变为已取消(Canceled)状态

模拟事件的生命周期如下:

演练系统事件流程图.png | center | 747x483

代码示例

以下以SystemMaintenance.Reboot为例,创建了两个模拟系统事件,随即又取消了其中的一个事件:

#  coding=utf-8

# make sure the sdk version is 4.10.0 or upper, you can use command 'pip show aliyun-python-sdk-ecs' to check
# if the python sdk is not installed, use 'sudo pip install aliyun-python-sdk-ecs'
# if the python sdk is installed, use 'sudo pip install --upgrade aliyun-python-sdk-ecs'

import json
import logging

from aliyunsdkcore import client
from aliyunsdkecs.request.v20140526.CancelSimulatedSystemEventsRequest import CancelSimulatedSystemEventsRequest
from aliyunsdkecs.request.v20140526.CreateSimulatedSystemEventsRequest import CreateSimulatedSystemEventsRequest

logging.basicConfig(level=logging.INFO,
                    format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',
                    datefmt='%a, %d %b %Y %H:%M:%S')

# your access key Id
ak_id = "YOU_ACCESS_KEY_ID"
# your access key secret
ak_secret = "YOU_ACCESS_SECRET"
region_id = "cn-beijing"

client = client.AcsClient(ak_id, ak_secret, region_id)


# send open api request
def _send_request(request):
    request.set_accept_format('json')
    try:
        response_str = client.do_action_with_exception(request)
        logging.info(response_str)
        response_detail = json.loads(response_str)
        return response_detail
    except Exception as e:
        logging.error(e)


def build_create_request(event_type, not_before, instance_ids):
    request = CreateSimulatedSystemEventsRequest()
    request.set_EventType(event_type)
    request.set_NotBefore(not_before)
    request.set_InstanceIds(instance_ids)
    return request


def print_created_event_id(response):
    error_code = response.get('Code')
    if error_code is None:
        event_id_list = response.get('EventIdSet').get('EventId')
        print("Created %s simulated events: %s", len(event_id_list), event_id_list)
    else:
        print("Creating failed, error code: %s", error_code)


def get_created_event_id(response):
    error_code = response.get('Code')
    if error_code is None:
        event_id_list = response.get('EventIdSet').get('EventId')
        return event_id_list
    else:
        return []


def build_cancel_request(event_id):
    request = CancelSimulatedSystemEventsRequest()
    request.set_EventIds([event_id])
    return request


if __name__ == '__main__':
    request = build_create_request("SystemMaintenance.Reboot", "2018-09-01T00:00:00Z", ["i-2zegswzznxbp168sc5c9", "i-2zeimxypwhnj04sbgf5t"])
    response = _send_request(request)
    event_ids = get_created_event_id(response)
    if event_ids:
        print("Created %s simulated events: %s"%(len(event_ids), event_ids))
        cancel_event_id = event_ids[0]
        print("Now we cancel one event %s" % (cancel_event_id))
        cancel_request = build_cancel_request(cancel_event_id)
        cancel_response = _send_request(cancel_request)
        if not cancel_response.get('Code'):
            print("Cancel succeeded")

代码执行后的输出:

Created 2 simulated events: [u'e-2zec65b85gi9zwcv1kpz', u'e-2zec65b85gi9zwcv1kq0']
Wed, 22 Aug 2018 18:39:49 simulate_system_event.py[line:35] INFO {"EventIdSet":{"EventId":["e-2zec65b85gi9zwcv1kpz","e-2zec65b85gi9zwcv1kq0"]},"RequestId":"C1762464-CCC2-46EC-B233-92A4D9C1782C"}
Now we cancel one event e-2zec65b85gi9zwcv1kpz
Cancel succeeded
Wed, 22 Aug 2018 18:39:49 simulate_system_event.py[line:35] INFO {"RequestId":"44286901-1BC3-4BA0-AAAF-C3CF20578E0F"}

限制和注意事项

  • 用户只能在自己拥有的实例上设置和取消系统事件
  • 单用户设置的处于Scheduled状态的模拟系统事件不能超过1000个