SLO
えすえるおー
SLO
一言でいうと
サービスが満たすべき信頼性の目標値を、社内向けに定義した指標のこと。
詳しい意味
SLO(Service Level Objective)は、サービスが満たすべき信頼性の目標値を社内向けに定義した数値です。たとえば「月間稼働率99.9%」「P95レイテンシー300ms以下」など。関連用語に「SLI(実際に計測する指標)」「SLA(顧客との契約上の合意値、SLO より緩く設定)」「エラーバジェット(許容される失敗時間)」があります。SLO を超えてエラーバジェットを使い切りそうになったら新機能リリースを止めて信頼性向上に専念する、というのが SRE 文化の運用形。「100% を目指さない」のがポイントで、過剰な信頼性投資より「ユーザーが許容する範囲」に最適化する考え方です。
何に使うか
信頼性とリリース速度のバランスを定量的に管理したいとき。チーム間で「サービスの品質目標」を共有したいとき。SLA交渉の社内基準として。
どんな時に出るか
「SLO違反した」「エラーバジェット使い切り」「SLO/SLA/SLI整理しよう」といった場面で登場します。
具体例
- P95レイテンシーのSLOを300msに設定し、月単位でエラーバジェットを管理している。
- SLOを違反したのでリリースを一時停止して信頼性向上に専念した。
別名・略称
slo(えすえるおー)Service Level Objective(さーびすれべるおぶじぇくてぃぶ)SLA(えすえるえー)SLI(えすえるあい)エラーバジェット(えらーばじぇっと)
初心者向けメモ
学校の「目標点数」のようなものです。100点を目指して全力を出すと疲れ果てる代わりに、「85点を維持できれば十分」と決めて、そこに対する達成度で運用判断する考え方。85点を割ったら勉強に専念し、85点に余裕で乗ってる時は新しい教科に挑戦できます。