分论坛:工具/平台创新
专题:质量工程平台(混沌工程、压测、A/B测试等)
内容简介:
云计算的初衷是“为了永不停机的计算服务”,伴随着各类企业核心系统上云,对云的稳定性也提出了越来越高的要求。云计算的业务演进离不开变更,然而变更往往伴随着风险,Google SRE认为70%的故障都是由变更导致的。面对超大规模的计算节点,如何同时保证变更安全、持续、高效进行是值得探索的问题。
本报告以阿里云ECS计算节点变更平台体系为基础,探讨变更风险左移、变更风险拦截、变更质量评价等方面的实践方法与案例。通过变更编排调度算法、金丝雀测试阶段等方式左移软件缺陷的发现阶段,通过变更与异常的关联分析、溯源分析发现变更风险并及时拦截,计算变更受损指标、基于KeyMetric变化趋势、downtime分析等手段分析变更质量,守护ECS计算节点的安全变更。演讲提纲:
1、变更风险与挑战听众收益: