021-53098865

18018650584


《Google SRE 运维解密》第四章&第五章:服务质量目标和减少琐事分享Q&A

Q1:SLO是运维和开发共同制定的吗?
是的,在定义服务级别目标的时候SRE建议和研发团队共同制定,同样的错误预算也是由双方共同使用,1减去SLO得到错误预算。

Q2:举例运维和开发共同使用错误预算的场景
SRE中错误预算是运维和开发共同需要完成的目标,当错误预算剩余特别少时,可采用限制发布的方式:
1、“一刀切”的方式,比如有5个发布分别是‚ƒ„…‚相对来说发布风险以及中断的可能性很小,那么选择至发布‚ƒ„…不发布;
2、“快/慢发布”,同样有5个发布分别是‚ƒ„…可以选择先发布‚ƒ„…延缓发布,
限制发布后开发团队反而会要求发布的代码质量,来满足双方制定的SLO &错误预算的要求,而不是运维单方面去支撑。