ポストモーテム
ぽすともーてむ
Postmortem
一言でいうと
障害が起きた後に「何が起きたか・なぜか・次にどう防ぐか」を文書化する振り返りのこと。
詳しい意味
ポストモーテムは、本番障害や重大インシデント発生後に行う振り返りです。「何が起きたか(事象)」「なぜ起きたか(根本原因)」「どう影響したか(影響範囲)」「次にどう防ぐか(再発防止)」を文書化します。重要なのは「人を責めない(blameless)」文化で、個人のミスではなく、システム・プロセス・チェックの欠陥として原因を捉え、構造的な改善につなげます。Google SRE Book で推奨されてから業界標準になりました。テンプレートを揃え、社内に公開して他チームの学びにすることが多いです。テックブログで公開する企業もあります。
何に使うか
本番障害後の振り返り。重大なリリース失敗の原因調査。複数チームが関わる複雑な事故の整理。
どんな時に出るか
「ポストモーテム書いた?」「postmortemレビュー」「blameless で行こう」といった場面で登場します。
具体例
- 本番障害後にポストモーテムを書き、Action items として「監視追加」と「Runbook更新」を入れた。
- blameless ポストモーテム文化のおかげで、隠さずに事象を共有できるようになった。
別名・略称
postmortem(ぽすともーてむ)post-mortem(ぽすともーてむ)障害報告書(しょうがいほうこくしょ)blameless postmortem(ぶれいむれすぽすともーてむ)
関連語
初心者向けメモ
航空業界の「事故調査」と同じです。墜落事故が起きたら、パイロットを罰するのではなく、訓練・計器・手順のどこに穴があったかを徹底的に調べます。同じ事故を二度と起こさないための学びの仕組みが、ポストモーテムです。