【えいちぴーえー(すいへいぽっどおーとすけーら)】
HPA(水平Podオートスケーラ) とは?
💡 混んだら自動で窓口を増やして、空いたら減らしてくれる仕組み
📌 このページのポイント
HPAって何をしてくれるの?
Kubernetesクラスターの中で動いているPodの数を、負荷に合わせて自動で増減してくれる仕組みだよ。アクセスが急増したら自動でPodを追加して処理を分散するんだね
どうやって「増やす必要がある」って判断するの?
無限にPodが増え続けることはないの?
ないよ!設定で最小数(minReplicas)と最大数(maxReplicas)を決めておくから、その範囲内でしか変化しないんだ。ノードのリソースも有限だから上限は大事だね
カスタムメトリクスって難しそうだけど?
PrometheusなどのモニタリングツールとPrometheus Adapterを組み合わせると、HTTPリクエスト数やキューの長さを指標にできるよ。CPUより「実際の仕事量」に近い指標でスケールできるから精度が上がるんだ
VPAとはどう使い分けるの?
組み合わせて使うこともできるの?
できるんだけど、HPAとVPAを同じメトリクスで同時に使うと競合するから注意が必要だよ。Cluster Autoscalerと組み合わせると、Pod数が増えてノードが足りなくなったときにノード自体も自動追加されて、よりスムーズに拡張できるんだ
まとめ:ざっくりこれだけ覚えればOK!
「HPA」って出てきたら「Kubernetesが負荷に合わせてPodの数を自動調整する仕組み」と思えればだいたいOK!
📖 おまけ:英語の意味
「Horizontal Pod Autoscaler」 = 水平Podオートスケーラ
💬 「Horizontal(水平)」はPodの数を増やす方向(横に広げる)を意味するよ。スペックを上げる「Vertical(垂直)」と対比して使われる言葉だね