【さーばーだうん】

サーバーダウン とは?

💡 ネットの大渋滞、つながらない恐怖
📌 このページのポイント
サーバーダウン ― 障害と復旧のフロー 正常稼働 リクエスト処理中 ● 稼働中 障害発生 サーバーダウン 応答不能 ✕ 停止 調査 復旧作業 原因特定・修正 ⚙ 対応中 復旧 ● 正常 主な原因 アクセス集中 高負荷状態 ハードウェア故障 ディスク・メモリ 対策 冗長化構成 複数台で分散 監視・アラート 異常の早期検知 ダウンタイム=サービス停止時間(短いほど良い)
サーバーダウンのイメージ
ひよこ ひよこ

サーバーダウンってなんでいきなり起きるんだ

ペンギン先生 ペンギン先生

人気商品の発売やテレビで紹介された直後にアクセスが殺到すると、サーバーが処理しきれなくなって落ちるんだよ。ハードウェアの故障やソフトウェアのバグも原因になるんだ

ひよこ ひよこ

サーバーが落ちたらどれくらい損害が出るんだ

ペンギン先生 ペンギン先生

大手ECサイトだと1時間のダウンで数億円の損失になることもあるんだよ。だから企業はサーバーを二重三重に用意して備えているんだ

ひよこ ひよこ

サーバーダウンを防ぐ方法はあるのか

ペンギン先生 ペンギン先生

サーバーを複数台用意する冗長化や、アクセスを分散させるロードバランサーが定番の対策だよ。クラウドなら自動でサーバーを増やす仕組みも使えるんだ

ひよこ ひよこ

サーバーがダウンしたとき、中の人はどうやって気づくの?

ペンギン先生 ペンギン先生

監視ツールで常にサーバーの状態をチェックしているんだよ。CPU使用率やメモリ、レスポンスタイム監視して、異常があればSlackやPagerDutyに自動で通知が飛ぶ。深夜でもアラートで叩き起こされるのがインフラエンジニアの宿命だね。

ひよこ ひよこ

「503 Service Unavailable」と「504 Gateway Timeout」って何が違うの?

ペンギン先生 ペンギン先生

503は「サーバーが今忙しくて応答できません」で、過負荷やメンテナンス中のときに返される。504はロードバランサーリバースプロキシが「バックエンドサーバーから時間内に応答がなかった」ときに返される。503は再試行すれば復旧する可能性が高いけど、504はバックエンドに深刻な問題がある可能性が高い。運用現場ではこのステータスコードの違いで対応が変わるんだよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「サーバーダウン」って出てきたら「サーバーが止まってサービスが使えなくなること」と思えればだいたいOK!
📖 おまけ:英語の意味
「Server Down」 = サーバー停止
💬 「Server(サーバー)」が「Down(落ちる)」で、サーバーが動かなくなった状態だよ。「鯖落ち」というネットスラングもあるんだ
← 用語集にもどる