【とっぷぴー】
Top-p(トップピー) とは?
💡 AIの選択肢を「上位○%」に絞るフィルター
📌 このページのポイント
- 候補を確率順に並べて、累積がpに達するまでの単語だけを選択肢にする
- p=0.1なら上位10%の候補だけ、p=1.0なら全候補から選ぶ
- Nucleus Sampling(核サンプリング)とも呼ばれる
- Temperatureと同時に調整することで、出力の質と多様性を細かく制御できる
Top-pってTemperatureとどう違うの?
Temperatureは全候補の確率分布を「なだらか」にしたり「とがらせたり」する調整だけど、Top-pは候補そのものを絞り込む仕組みだよ。たとえば10個の候補があるとき、Temperatureは10個全部の選ばれやすさを変えるけど、Top-pは上位3個だけに絞ってから選ぶイメージだね。
p=0.9ってよく見るけど、どういう意味?
確率の高い順に候補を足していって、合計が90%になるところまでの候補だけを使うという意味だよ。たとえば1位が60%、2位が20%、3位が10%なら合計90%でこの3つだけが候補になる。確率が低すぎる的外れな単語を排除できるんだ。
TemperatureとTop-p、両方設定しても大丈夫?
Top-pとTop-kってどう違うの?
Top-kは「確率の高い上位k個の候補だけ使う」という固定数の絞り込み。Top-pは「合計確率がp%になるまでの候補を使う」という動的な絞り込みだよ。Top-kだと確率が極端に偏っているときに不要な候補まで含んでしまうけど、Top-pなら状況に応じて候補数が自動調整されるのが利点なんだ。
Top-pを極端に小さくしたらどうなるの?
p=0.1のように極端に小さくすると、ほぼ最も確率の高い1〜2個の候補からしか選ばれなくなる。Temperature=0に近い挙動になるね。逆にp=1.0だと全候補が対象になるからフィルタリングの意味がなくなる。実用的にはp=0.9〜0.95がバランスの良い範囲で、ほとんどのAPIでデフォルトもこのあたりに設定されているよ。
まとめ:ざっくりこれだけ覚えればOK!
「Top-p」って出てきたら「AIが次の単語を選ぶとき、確率上位の候補だけに絞る仕組みのことだな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Top-p」 = 上位p(累積確率)
💬 pは確率(probability)のこと。上位の確率を合計してpに達するまでの候補だけを使うことからこの名前がついたよ