【じこかいきもでる】
自己回帰モデル とは?
💡 前の言葉を読んで次の言葉を当てる、しりとり名人のようなAI
📌 このページのポイント
自己回帰モデルって、自分に回帰するってどういうこと?
たとえば「今日は天気が」という文を生成したら、次に来る言葉を予測するんだ。予測結果の「良い」を付け加えて「今日は天気が良い」にして、またその続きを予測する。自分の出力を入力に回して使うから自己回帰と呼ぶんだよ
ChatGPTが文字をちょっとずつ表示するのもそれ?
1個ずつ出すって遅くないの?
いい質問だね。実際それが最大の弱点で、長い文章ほど生成に時間がかかる。だからSpeculative DecodingやKVキャッシュの最適化など、推論を高速化する研究がとても盛んなんだ
自己回帰じゃないモデルもあるの?
まとめ:ざっくりこれだけ覚えればOK!
「自己回帰モデル」って出てきたら「前の出力を見て次を予測するモデル」と思えればだいたいOK!
📖 おまけ:英語の意味
「Autoregressive Model」 = 自己回帰モデル
💬 Autoは自分自身、Regressiveは回帰(前に戻る)という意味で、自分の過去の出力に回帰して次を予測する仕組みを表しているよ