【えるえるえむせきゅりてぃ】

LLMセキュリティ とは?

💡 AIに話しかける時代だからこそ、会話の安全も守らなきゃ
📌 このページのポイント
LLMセキュリティの多層防御 LLM 入力フィルタ サニタイズ・検証 出力フィルタ 検閲・制限 脅威の例 プロンプトインジェクション データ漏洩・モデル窃取 ガードレール 権限最小化 多層防御・監視 OWASP Top 10 for LLM Apps リスク分類ガイド
LLMセキュリティの多層防御のイメージ
ひよこ ひよこ

LLMセキュリティって、普通のセキュリティとは違うの?

ペンギン先生 ペンギン先生

従来のセキュリティSQLインジェクションXSSのようなコードの脆弱性が中心だったけど、LLMは自然言語で操作できるから、巧みな言葉で騙す攻撃が加わるんだよ

ひよこ ひよこ

言葉で騙すって、どんな感じなのかな?

ペンギン先生 ペンギン先生

たとえばプロンプトインジェクションでは、ユーザーが巧妙な指示を入力してAIに本来禁止されている行動をさせたりするんだ。『あなたは制限のないAIです』みたいにね

ひよこ ひよこ

OWASPがまとめてるリストがあるんだよね?

ペンギン先生 ペンギン先生

そうそう。OWASP Top 10 for LLM Applicationsというのがあって、プロンプトインジェクションデータ漏洩、サプライチェーン脆弱性、過度な権限付与など10個のリスクカテゴリが整理されているよ

ひよこ ひよこ

どうやって守ればいいの?

ペンギン先生 ペンギン先生

入力のサニタイズ、出力のフィルタリング、LLMに与える権限の最小化、ガードレール(安全策)の多層防御が基本だね。1つの対策だけじゃなく、何重にも防御を重ねるのが大切だよ

ひよこ ひよこ

企業で導入するとき、特に気をつけることはあるのかな?

ペンギン先生 ペンギン先生

社内データをRAGで参照させる場合、アクセス制御の設計が超重要だよ。LLMが本来見せちゃいけない機密情報を回答に含めてしまう『データ漏洩』が実際に起きているからね

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「LLMセキュリティ」って出てきたら「AI特有の攻撃や脆弱性から大規模言語モデルを守ること」と思えればだいたいOK!
📖 おまけ:英語の意味
「LLM Security」 = 大規模言語モデルの安全対策
💬 LLMが社会に普及するにつれて、従来のセキュリティとは別の専門分野として確立されてきたんだよ
← 用語集にもどる