GLOSSA

オートスケール

おーとすけーる

Auto Scaling

一言でいうと

アクセスの増減に応じてサーバー台数を自動で増やしたり減らしたりする仕組みのこと。

詳しい意味

オートスケール(Auto Scaling)は、アクセス数や負荷に応じてサーバーの台数を自動で増減させる仕組みです。アクセスが増えたら台数を増やし、減ったら自動で減らすことで、性能とコストの両立を図ります。クラウドの主要サービスには標準で組み込まれており(AWS Auto Scaling Groups、Cloud Run の自動スケール、Kubernetes の HPA など)、CPU使用率・リクエスト数・カスタムメトリクスなどを基準にスケール条件を定義します。「水平スケール(台数を増やす)」と「垂直スケール(1台を強くする)」の使い分けも論点です。

何に使うか

アクセスが時間帯や日によって大きく変動するとき。コストを抑えつつピーク時の性能を確保したいとき。テレビ放送や告知でアクセスが急増する可能性があるとき。

どんな時に出るか

「オートスケールしてるから大丈夫」「スケールアウトの上限を上げる」「スケールインが遅くてコストが膨らむ」といった場面で登場します。

具体例

  • Cloud Run のオートスケール設定で、最小0、最大10インスタンスにしている。
  • オートスケールしてくれる前提で性能設計したら、起動時間が想定より長くて初動が辛かった。

別名・略称

auto scaling(おーとすけーりんぐ)autoscaling(おーとすけーりんぐ)オートスケーリング(おーとすけーりんぐ)

関連語

ロードバランサーCloud Run

初心者向けメモ

コンビニの「混雑時にレジを増やす」イメージです。普段は1〜2レジで十分でも、昼休みや雨上がりは混むのでレジ係を増やします。空いたら戻す。これを自動でやってくれるのがオートスケールです。

この説明に改善点はありますか?

この説明を修正提案する新しい用語を提案する

提案は管理者が確認した後に反映されます