这 Slide 简单整理我对于系统上线后,面对异常处理的态度以及心法。

这其实是我两年前 (201510) 想对公司内说明的,后来不知道什么原因,没有说,也不想说,不过我把那样的精神与意念转化成另一种行动。

201510 系统维运的精神 from Rick Hwang

这段心得,基本上跟 SRE CH13 - Emergency Response 提到得很像,只是我很严肃看待这件事情罢了。

SRE CH33 - Lessons Learned from Other Industries 有其他行业的实践经验,其中一位是维护 911 警急呼叫系统的人,后来担任 SRE。对这样的人来说,911 警急系统出问题,不是生意受影响而已,而是会出人命的,所以他会用同样的心态看待 SRE。

换成是我,我除了是工程师,也是音乐人,对我来说,SRE 之于乐手,就是 现场 (Live),就是表演、就是生活。底下是以前写的相关文章:

这些都是很严肃,却很真实的问题。