【てすとじけいさん】
テスト時計算 とは?
💡 本番で全力を出すために、計算パワーを惜しまない
📌 このページのポイント
- 学習済みモデルの推論フェーズで追加の計算を行い精度を向上させる
- 自己整合性やベスト・オブ・N サンプリングなどの手法がある
- 学習時の計算量(train-time compute)と対になる概念
- 数学やコーディングなど正解が明確なタスクで特に効果が高い
テスト時計算って推論時計算スケーリングとは違うの?
ほぼ同じ意味だよ。学術論文では「test-time compute」、業界では「inference-time compute」と呼ぶことが多いけど、どちらも推論フェーズで計算を増やすという同じコンセプトだね
具体的にはどんなテクニックがあるの?
たとえば「ベスト・オブ・N」は同じ質問に対してN個の回答を生成して一番良いものを選ぶ方法。自己整合性(Self-Consistency)は多数決で最も多い回答を採用する手法だよ
どんなタスクで効果があるの?
数学の証明やプログラミングのように正解がはっきりしているタスクで効果が大きいね。逆にクリエイティブな文章生成のように正解が一つでないタスクだと、効果が見えにくいこともあるよ
将来的にはどうなりそう?
学習時と推論時の計算量配分を最適化する研究が進んでいるよ。極端に言えば、小さなモデルでも推論時に十分な計算を与えれば大きなモデルに匹敵する、という可能性も示されていて、モデル設計の考え方自体が変わりつつあるんだ
まとめ:ざっくりこれだけ覚えればOK!
「テスト時計算」って出てきたら「AIが本番で余分に頭を使って精度を上げる仕組み」と思えればだいたいOK!
📖 おまけ:英語の意味
「Test-Time Compute」 = テスト時の計算量
💬 test-timeは機械学習で「推論時」を指す用語。学習(train)の対義語としてのテスト(test)だよ