【とっぷぴー】

Top-p(トップピー) とは?

💡 AIの選択肢を「上位○%」に絞るフィルター
📌 このページのポイント
Top-p (Nucleus Sampling) — 確率の上位を選ぶ 次の単語の候補と確率 天気 40% 気温 25% 空模様 15% 10% 5% その他 5% Top-p = 0.8 累積確率 80% に 達するまでの候補 (上位3つ)から選択 確率の低い候補は除外 Top-pが小さいほど確実な候補に絞り、大きいほど多様な出力になる
Top-pサンプリングのイメージ
ひよこ ひよこ

Top-pってTemperatureとどう違うの?

ペンギン先生 ペンギン先生

Temperatureは全候補の確率分布を「なだらか」にしたり「とがらせたり」する調整だけど、Top-pは候補そのものを絞り込む仕組みだよ。たとえば10個の候補があるとき、Temperatureは10個全部の選ばれやすさを変えるけど、Top-pは上位3個だけに絞ってから選ぶイメージだね。

ひよこ ひよこ

p=0.9ってよく見るけど、どういう意味?

ペンギン先生 ペンギン先生

確率の高い順に候補を足していって、合計が90%になるところまでの候補だけを使うという意味だよ。たとえば1位が60%、2位が20%、3位が10%なら合計90%でこの3つだけが候補になる。確率が低すぎる的外れな単語を排除できるんだ。

ひよこ ひよこ

TemperatureとTop-p、両方設定しても大丈夫?

ペンギン先生 ペンギン先生

できるけど、一般的にはどちらか一方を調整するのがおすすめだよ。両方いじると効果が複雑に絡み合って予測しにくくなるんだ。OpenAIの公式ドキュメントでも「片方を変えるならもう片方は固定」と案内されているよ。

ひよこ ひよこ

Top-pとTop-kってどう違うの?

ペンギン先生 ペンギン先生

Top-kは「確率の高い上位k個の候補だけ使う」という固定数の絞り込み。Top-pは「合計確率がp%になるまでの候補を使う」という動的な絞り込みだよ。Top-kだと確率が極端に偏っているときに不要な候補まで含んでしまうけど、Top-pなら状況に応じて候補数が自動調整されるのが利点なんだ。

ひよこ ひよこ

Top-pを極端に小さくしたらどうなるの?

ペンギン先生 ペンギン先生

p=0.1のように極端に小さくすると、ほぼ最も確率の高い1〜2個の候補からしか選ばれなくなる。Temperature=0に近い挙動になるね。逆にp=1.0だと全候補が対象になるからフィルタリングの意味がなくなる。実用的にはp=0.9〜0.95がバランスの良い範囲で、ほとんどのAPIデフォルトもこのあたりに設定されているよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「Top-p」って出てきたら「AIが次の単語を選ぶとき、確率上位の候補だけに絞る仕組みのことだな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Top-p」 = 上位p(累積確率)
💬 pは確率(probability)のこと。上位の確率を合計してpに達するまでの候補だけを使うことからこの名前がついたよ
← 用語集にもどる