【とーくんばじぇっと】

トークンバジェット とは?

💡 AIの「考える予算」を決める
📌 このページのポイント
トークンバジェットの構成 思考トークン 内部推論 ツール 呼び出し 最終回答 出力 思考トークン(推論) ツール呼び出し 最終回答 予算 少 速い・安い・浅い思考 シンプルなタスク向き 予算 多 遅い・高い・深い推論 複雑なタスク向き
トークンバジェットは「思考・ツール・回答」に分割して管理する
ひよこ ひよこ

ペンギン先生、「トークンバジェット」って何ですか?

ペンギン先生 ペンギン先生

AIエージェントがタスクを処理する際に使えるトークン数の上限のことだよ。「このタスクには最大で〇〇トークンまで使っていいよ」という予算を設定する概念なんだ。

ひよこ ひよこ

トークンって何なの?

ペンギン先生 ペンギン先生

AIが文章を処理するときの最小単位だよ。日本語だとおおよそ1〜2文字が1トークン、英語だと1単語前後が1トークンのイメージ。トークンが多いほど、AIがより長く・深く考えられるけど、コストと時間がかかるんだ。

ひよこ ひよこ

なんでバジェットを制限するの?

ペンギン先生 ペンギン先生

コスト管理のためだよ!たとえば「簡単な要約タスクに1000トークンで十分なのに、10000トークン使わせてしまう」と無駄にコストがかかる。反対に難しい問題に少ないトークンしか与えないと、答えが粗くなる。適切な設定が大事なんだ。

ひよこ ひよこ

推論モデル(o1系)でよく聞くのはなんで?

ペンギン先生 ペンギン先生

推論モデルは答えを出す前に「内部で考える(思考トークン)」というステップがあって、それがとても多くのトークンを使うからだよ。複雑な問題を解くのに数千トークンもかけて内部思考する。それを制御するのがトークンバジェットなんだ。

ひよこ ひよこ

実際の開発ではどうやって設定するの?

ペンギン先生 ペンギン先生

使うAPIによって違うけど、Anthropicのモデルなら「budget_tokens」パラメータで設定できるよ。タスクの複雑さに応じて動的に調整する仕組みを作ることもある。バジェット管理はAIエージェント開発の重要なコスト最適化テクニックのひとつなんだ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「トークンバジェット」って出てきたら「AIが使える思考量・コストの上限」と思えばOK!
📖 おまけ:英語の意味
「Token Budget」 = トークン予算
💬 Token(AIが処理する文字・単語の単位)のBudget(予算・上限)という意味。予算が多いほど深く考えられるけど、コストも時間もかかるよ
← 用語集にもどる