【ふぇいるおーばー】
フェイルオーバー とは?
💡 障害時に「自動で予備に切り替え」てサービスを止めない仕組み
📌 このページのポイント
- メインシステムの障害を検知すると自動でバックアップに切り替わる
- RTOとRPOがフェイルオーバー設計の指標
- アクティブ-スタンバイ型(普段は1台のみ動作)とアクティブ-アクティブ型(両方稼働)がある
- クラスタリング・ロードバランサ・DNSフェイルオーバーなど実現方法が多様
フェイルオーバーって何?
メインのサーバが壊れたとき、自動でバックアップのサーバに切り替えてサービスを止めずに続ける仕組みだよ。「気づいたら切り替わっていた」というのが理想的なフェイルオーバー。
アクティブ-スタンバイって何?
普段はメインのサーバだけ動かして、バックアップのサーバは待機状態(スタンバイ)にする構成。障害時にスタンバイが自動で起動・切り替わる。コストを抑えられるが切り替えに数十秒かかることがある。
フェイルバックって何?
フェイルオーバーの切り替え時間ってゼロにできるの?
完全にゼロにするのは難しいけど、アクティブ-アクティブ構成なら限りなくゼロに近づけられるよ。両方のサーバが同時にリクエストを処理していて、片方が落ちても残りが引き継ぐから、ユーザーはほぼ気づかない。ただしデータの同期やスプリットブレイン(両方がマスターだと主張する問題)への対策が必要だよ。
クラウドだとフェイルオーバーはどう実現するの?
まとめ:ざっくりこれだけ覚えればOK!
フェイルオーバーって出てきたら「障害発生時に自動で予備システムに切り替えてサービスを継続する仕組み」と思えばOK!
📖 おまけ:英語の意味
「Failover」 = 障害時の切り替え
💬 Fail(障害)over(移行)。フェイルバック(復旧後に元のシステムに戻すこと)とセットで考えることが多い