【さぶんぷらいばしー】

差分プライバシー とは?

💡 データにちょっとだけノイズを混ぜて、個人情報を数学の力で守る技術
📌 このページのポイント
元データ 名前 年齢 田中 32 佐藤 45 鈴木 28 ノイズ追加 +3 -1 +0 -2 +5 統計結果 個人は特定不可 全体傾向は把握可能 個人情報を守りつつデータ分析が可能
差分プライバシー ― データにノイズを加え、個人を保護しながら有用な統計分析を実現する技術
ひよこ ひよこ

差分プライバシーって難しそうな名前だけど、何をしてるの?

ペンギン先生 ペンギン先生

簡単に言うと、データに「わざとちょっとだけウソ」を混ぜるんだよ。たとえばアンケートの回答にランダムなノイズを足すことで、一人ひとりの本当の回答はわからなくなるけど、全体の傾向はちゃんと見えるようにするんだ。

ひよこ ひよこ

ウソを混ぜたら正しい分析ができなくなりそうだけど…?

ペンギン先生 ペンギン先生

いい疑問だね!ノイズはランダムに加えるから、データが大量に集まると個々のノイズは打ち消し合って、全体としてはほぼ正確な統計が取れるんだよ。でも個人レベルでは本当の値がわからないから、プライバシーが守られるんだ。

ひよこ ひよこ

実際にどこで使われてるの?

ペンギン先生 ペンギン先生

Appleはユーザーの使用パターンを分析するときに差分プライバシーを使っているし、Googleブラウザの利用データ収集で採用しているよ。国勢調査のデータ公開にも使われていて、身近なところで活躍しているんだ。

ひよこ ひよこ

数学でプライバシーを守るって、なんだかかっこいいね!

ペンギン先生 ペンギン先生

そうだね!「このデータが入っていても入っていなくても結果はほぼ同じ」ということを数学的に保証できるのが差分プライバシーの強みなんだ。感覚的な安全ではなく、証明できる安全というのがポイントだよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「差分プライバシー」って出てきたら「データにノイズを加えて個人情報を守りながら統計分析する技術」と思えればだいたいOK!
📖 おまけ:英語の意味
「Differential Privacy」 = 差分のプライバシー
💬 Differential(差分の)+ Privacy(プライバシー)。あるデータが含まれていても含まれていなくても結果にほとんど「差」が出ないようにするという意味なんだ
← 用語集にもどる