【おぶざーばびりてぃ】
オブザーバビリティ とは?
💡 「何が起きても内部の状態を外から読み解ける」システムの透明度
📌 このページのポイント
- ログ・メトリクス・トレースの「三本柱」が基盤
- 事前に想定しなかった障害でも根本原因を調査できる能力を指す
- 分散システムやマイクロサービスで特に重要性が高まる
- OpenTelemetryが計装の標準として広く使われている
オブザーバビリティってモニタリングと何が違うの?
モニタリングは「あらかじめ決めた指標がおかしくなったら知る」仕組みで、言うなれば既知の問題を見つけるためのものだよ。オブザーバビリティは「何が起きても内部で何が起きていたかを追跡できる」能力のことで、想定外の問題にも対応できることが目標なんだ。
ログ・メトリクス・トレースって何が違うの?
マイクロサービスだとオブザーバビリティが特に大事ってよく聞くね。
サービスが1つなら原因を探しやすいけど、10個・20個のサービスが連携していると1つのリクエストがどのサービスで遅くなったか・エラーが出たかを追うのがとても難しくなるんだ。分散トレーシングがないとどこに問題があるかすら分からないことがあるよ。
OpenTelemetryって何?ベンダーごとにライブラリが違うの?
まとめ:ざっくりこれだけ覚えればOK!
「オブザーバビリティ」って出てきたら「ログ・メトリクス・トレースでシステムの内部状態を外から把握できる仕組みと能力だな」と思えばだいたいOK!
📖 おまけ:英語の意味
「Observability」 = 観測可能性
💬 制御工学の概念で「外部から観測した情報だけで内部状態を推定できるか」を指す言葉。IT分野ではGoogleのSRE文化から広まったよ