監視
かんし
Monitoring
一言でいうと
システムの状態を継続的に観察し、異常を早期に検知する仕組みのこと。
詳しい意味
監視(Monitoring)は、稼働中のシステムの状態を継続的に観察し、性能低下や障害を早期に検知する仕組み・運用の総称です。「リクエスト数」「レスポンスタイム」「エラー率」「CPU・メモリ使用率」などの指標(メトリクス)をダッシュボードで可視化し、しきい値を越えたらアラートを発報します。代表的なツールに Datadog、New Relic、Cloud Monitoring、Prometheus + Grafana、Sentry(エラー特化)など。「観察できないシステムは運用できない」というのが現代インフラの基本姿勢です。
何に使うか
本番障害を素早く検知したいとき。性能劣化の兆候を捕まえてキャパシティを増やすとき。SLA / SLO を達成しているか継続確認するとき。
どんな時に出るか
「監視ダッシュボードを見て」「監視アラートが鳴った」「監視の盲点を埋める」といった場面で登場します。
具体例
- 監視ダッシュボードでP95レイテンシーとエラー率を常時表示している。
- 監視が無いと、ユーザーから問い合わせが来るまで障害に気づけない。
別名・略称
monitoring(もにたりんぐ)モニタリング(もにたりんぐ)オブザーバビリティ(おぶざーばびりてぃ)
関連語
初心者向けメモ
病院の「ICUの心拍計」のようなものです。患者(システム)の状態を常に計測し、危険な値になったらすぐに看護師(オンコール担当者)が駆けつけられるようにする仕組みです。