【てすとじけいさん】

テスト時計算 とは?

💡 本番で全力を出すために、計算パワーを惜しまない
📌 このページのポイント
テスト時計算の手法 学習フェーズ 大量データで学習 計算コスト:固定 テスト時(推論フェーズ) Best-of-N N個生成して 最良を選択 自己整合性 複数回答を生成 多数決で決定 思考の連鎖 ステップごとに 推論を展開 自己検証 回答を自ら検証 誤りを修正 推論時に追加計算を投入する代表的な手法
テスト時計算の手法一覧
ひよこ ひよこ

テスト時計算って推論時計算スケーリングとは違うの?

ペンギン先生 ペンギン先生

ほぼ同じ意味だよ。学術論文では「test-time compute」、業界では「inference-time compute」と呼ぶことが多いけど、どちらも推論フェーズで計算を増やすという同じコンセプトだね

ひよこ ひよこ

具体的にはどんなテクニックがあるの?

ペンギン先生 ペンギン先生

たとえば「ベスト・オブ・N」は同じ質問に対してN個の回答を生成して一番良いものを選ぶ方法。自己整合性(Self-Consistency)は多数決で最も多い回答を採用する手法だよ

ひよこ ひよこ

どんなタスクで効果があるの?

ペンギン先生 ペンギン先生

数学の証明やプログラミングのように正解がはっきりしているタスクで効果が大きいね。逆にクリエイティブな文章生成のように正解が一つでないタスクだと、効果が見えにくいこともあるよ

ひよこ ひよこ

将来的にはどうなりそう?

ペンギン先生 ペンギン先生

学習時と推論時の計算量配分を最適化する研究が進んでいるよ。極端に言えば、小さなモデルでも推論時に十分な計算を与えれば大きなモデルに匹敵する、という可能性も示されていて、モデル設計の考え方自体が変わりつつあるんだ

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「テスト時計算」って出てきたら「AIが本番で余分に頭を使って精度を上げる仕組み」と思えればだいたいOK!
📖 おまけ:英語の意味
「Test-Time Compute」 = テスト時の計算量
💬 test-timeは機械学習で「推論時」を指す用語。学習(train)の対義語としてのテスト(test)だよ
← 用語集にもどる