【りかばりてすと】

リカバリテスト とは?

💡 「倒れても起き上がれるか」を確かめる復活力テスト
📌 このページのポイント
リカバリテスト ― 障害後の復旧力を検証 正常稼働 サービスUP 障害発生 サーバー停止 復旧作業 バックアップ復元 復旧後の検証 正常動作確認 RPO確認 データはどこまで 失われずに済むか → 復旧地点の目標 RTO確認 何分(何時間)で 復旧できるか → 復旧時間の目標 整合性確認 復旧後にデータが 壊れていないか → 正常動作を確認 バックアップは「取る」だけでなく「戻せる」ことを定期的にテスト!
リカバリテストのイメージ
ひよこ ひよこ

リカバリテストって、わざと壊して試すの?

ペンギン先生 ペンギン先生

そうだよ!サーバーを強制停止したり、ネットワークを切断したり、ディスクをいっぱいにしたりして、「そこから復旧できるか」を確認するんだ。障害は必ず起きるから、復旧力を事前に確認しておくのが大事なんだよ

ひよこ ひよこ

何を確認するの?

ペンギン先生 ペンギン先生

大きく3つあるよ。「データが失われていないか」(RPO)、「どのくらいの時間で復旧できるか」(RTO)、「復旧後にシステムが正常に動くか」だね。バックアップから戻しても動かなかった、なんてことが実は結構あるんだ

ひよこ ひよこ

バックアップがあれば安心じゃないの?

ペンギン先生 ペンギン先生

バックアップは「取っているだけ」じゃダメで、「復元できるか」を定期的にテストすることが重要なんだ。「シュレーディンガーのバックアップ」って言葉があって、リストアするまでバックアップが有効かどうかはわからない、という戒めだよ

ひよこ ひよこ

どのくらいの頻度でやるべき?

ペンギン先生 ペンギン先生

最低でも半年に1回、重要なシステムなら四半期に1回はリカバリテストを実施するのが望ましいね。クラウド環境ならTerraformなどのIaCで環境をゼロから再構築する訓練もあるよ。いざというときに慌てないための保険だね

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「リカバリテスト」って出てきたら「障害後にちゃんと復旧できるかを確認するテスト」と思えればだいたいOK!
📖 おまけ:英語の意味
「Recovery Testing」 = リカバリテスト
💬 recovery は「回復・復旧」で、システムが障害から回復する力をテストするという意味だよ
← 用語集にもどる