【えーあいおぶざーばびりてぃ】

AIオブザーバビリティ とは?

💡 AIが「何を、どう考えたか」を見える化する
📌 このページのポイント
AIオブザーバビリティ:AIの動作を見える化・監視する リクエスト プロンプト入力 LLM (大規模言語モデル) トークン処理中... レスポンス 出力結果 観測レイヤー(AIオブザーバビリティ) トレース リクエスト〜レスポンス の全流れを記録 LangSmith / Langfuse メトリクス トークン数・レイテンシ ・コスト Arize AI など 評価 ハルシネーション率 ・回答品質スコア OpenTelemetry 連携
AIオブザーバビリティはトレース・メトリクス・評価の三層でLLMの動作を継続監視する
ひよこ ひよこ

ペンギン先生、普通のオブザーバビリティとAIオブザーバビリティって何が違うの?

ペンギン先生 ペンギン先生

普通のオブザーバビリティは「サーバーCPUが何%か」「エラーが何件か」を監視する。AIオブザーバビリティはそれに加えて「LLMが何を入力されて何を出力したか」「ハルシネーション(でたらめ生成)が起きていないか」を監視するんだ。

ひよこ ひよこ

AIだと何を見るの?

ペンギン先生 ペンギン先生

主に「トレース」「メトリクス」「評価」の三つだよ。トレースはリクエストからレスポンスまでの流れ全体を記録する。メトリクストークン使用量・レイテンシ・コスト。評価はハルシネーション率や回答品質のスコアリングだね。

ひよこ ひよこ

なんでこんなに必要なの?

ペンギン先生 ペンギン先生

AIシステムは通常のソフトウェアと違って「なぜこの出力になったか」がブラックボックスだからだよ。本番環境ハルシネーションが増えていても気づけない。監視してないと気づいたときには手遅れ、ということが起きるんだ。

ひよこ ひよこ

具体的にどんなツールを使うの?

ペンギン先生 ペンギン先生

LangSmith(LangChain製)、Langfuse(オープンソース)、Arize AIなどが有名だよ。最近はOpenTelemetry標準でAIトレースを記録する動きも出てきていて、普通の監視ツールとの統合が進んでいるんだ。

ひよこ ひよこ

AIを本番環境で使うなら、最初から入れておくべきものなんだね!

ペンギン先生 ペンギン先生

まさにそれ!AIオブザーバビリティは「作って終わり」ではなく「動かしながら品質を保つ」ための基盤。AIシステムのSREとも言える分野で、今すごく注目されているよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「AIオブザーバビリティ」って出てきたら「AIシステムの動作を見える化・監視すること」と思えばOK!
📖 おまけ:英語の意味
「AI Observability」 = AI可観測性
💬 Observability(可観測性)はシステムの内部状態を外部から把握できる度合いのこと。AIの場合は「なぜその出力になったか」を追跡できる仕組みが必要だよ
← 用語集にもどる