ガードレール（AI）とは何ですか？

AIが有害な回答や不適切な出力をしないように制約をかける安全装置のこと。道路のガードレールのように、AIが危険な方向に逸れないようにする仕組み。

ガードレール（AI）のポイントは？

AIの出力を監視し、有害・不適切な内容をブロックする仕組み。入力側のガードレールと出力側のガードレールの両方がある。プロンプトインジェクションや有害コンテンツ生成への対策として重要。ルールベースとAIベースのガードレールを組み合わせて使うことが多い

【がーどれーる】

💡 AIが暴走しないように設置された「見えない柵」

📌 このページのポイント

ガードレール（AI）のイメージ

ひよこ

AIのガードレールって道路のガードレールと関係あるの？

ペンギン先生

まさにそのイメージだよ。道路のガードレールが車の飛び出しを防ぐように、AIのガードレールはAIが危険な回答や不適切な内容を出すのを防ぐ仕組みなんだ。

ひよこ

具体的にはどうやって防いでいるの？

ペンギン先生

たとえばユーザーの入力をチェックして危険な質問をブロックしたり、AIの回答を生成した後に問題がないか検査したりするんだ。入口と出口の両方にガードレールを置くのが基本だよ。

ひよこ

ガードレールがあれば絶対安全なの？

ペンギン先生

残念ながら100%安全とは言えないんだ。プロンプトインジェクションやジェイルブレイクといった手法でガードレールを突破しようとする人もいるから、常に改善し続ける必要があるよ。

ひよこ

ガードレールって誰が作っているの？

ペンギン先生

AIを開発している企業やサービスを提供している会社が設計しているよ。ルールを手動で設定する方法と、別のAIに判定させる方法を組み合わせることが多いんだ。安全なAIを作るうえで欠かせない技術だね。

まとめ：ざっくりこれだけ覚えればOK！

「ガードレール」って出てきたら「AIが危ない回答をしないようにするブレーキや柵」と思えればだいたいOK！

📖 おまけ：英語の意味

「Guardrails」＝防護柵

💬 道路の「Guardrail（ガードレール）」から来ているよ。車が道路から飛び出さないように守る柵と同じで、AIが安全な範囲から外れないようにする仕組みなんだ