【がーどれーる】

ガードレール(AI) とは?

💡 AIが暴走しないように設置された「見えない柵」
📌 このページのポイント
ガードレール(AIの安全機構) ユーザー 入力 入力 フィルター 有害入力を検出 LLM 出力 フィルター 有害出力を検出 安全な 回答 ブロック 攻撃的な入力 ブロック 有害な出力 入力と出力の両方をフィルタリングし、AIの安全性を確保する仕組み
ガードレール(AI)のイメージ
ひよこ ひよこ

AIのガードレールって道路のガードレールと関係あるの?

ペンギン先生 ペンギン先生

まさにそのイメージだよ。道路のガードレールが車の飛び出しを防ぐように、AIのガードレールはAIが危険な回答や不適切な内容を出すのを防ぐ仕組みなんだ。

ひよこ ひよこ

具体的にはどうやって防いでいるの?

ペンギン先生 ペンギン先生

たとえばユーザーの入力をチェックして危険な質問をブロックしたり、AIの回答を生成した後に問題がないか検査したりするんだ。入口と出口の両方にガードレールを置くのが基本だよ。

ひよこ ひよこ

ガードレールがあれば絶対安全なの?

ペンギン先生 ペンギン先生

残念ながら100%安全とは言えないんだ。プロンプトインジェクションジェイルブレイクといった手法でガードレールを突破しようとする人もいるから、常に改善し続ける必要があるよ。

ひよこ ひよこ

ガードレールって誰が作っているの?

ペンギン先生 ペンギン先生

AIを開発している企業やサービスを提供している会社が設計しているよ。ルールを手動で設定する方法と、別のAIに判定させる方法を組み合わせることが多いんだ。安全なAIを作るうえで欠かせない技術だね。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「ガードレール」って出てきたら「AIが危ない回答をしないようにするブレーキや柵」と思えればだいたいOK!
📖 おまけ:英語の意味
「Guardrails」 = 防護柵
💬 道路の「Guardrail(ガードレール)」から来ているよ。車が道路から飛び出さないように守る柵と同じで、AIが安全な範囲から外れないようにする仕組みなんだ
← 用語集にもどる