オートスケール
おーとすけーる
Auto Scaling
一言でいうと
アクセスの増減に応じてサーバー台数を自動で増やしたり減らしたりする仕組みのこと。
詳しい意味
オートスケール(Auto Scaling)は、アクセス数や負荷に応じてサーバーの台数を自動で増減させる仕組みです。アクセスが増えたら台数を増やし、減ったら自動で減らすことで、性能とコストの両立を図ります。クラウドの主要サービスには標準で組み込まれており(AWS Auto Scaling Groups、Cloud Run の自動スケール、Kubernetes の HPA など)、CPU使用率・リクエスト数・カスタムメトリクスなどを基準にスケール条件を定義します。「水平スケール(台数を増やす)」と「垂直スケール(1台を強くする)」の使い分けも論点です。
何に使うか
アクセスが時間帯や日によって大きく変動するとき。コストを抑えつつピーク時の性能を確保したいとき。テレビ放送や告知でアクセスが急増する可能性があるとき。
どんな時に出るか
「オートスケールしてるから大丈夫」「スケールアウトの上限を上げる」「スケールインが遅くてコストが膨らむ」といった場面で登場します。
具体例
- Cloud Run のオートスケール設定で、最小0、最大10インスタンスにしている。
- オートスケールしてくれる前提で性能設計したら、起動時間が想定より長くて初動が辛かった。
別名・略称
auto scaling(おーとすけーりんぐ)autoscaling(おーとすけーりんぐ)オートスケーリング(おーとすけーりんぐ)
初心者向けメモ
コンビニの「混雑時にレジを増やす」イメージです。普段は1〜2レジで十分でも、昼休みや雨上がりは混むのでレジ係を増やします。空いたら戻す。これを自動でやってくれるのがオートスケールです。