【もでるすいろん】
モデル推論 とは?
💡 鍛え上げたAIを「実際に使う」実行フェーズ
📌 このページのポイント
推論って「AIが考える」こと?学習と何が違うの?
ChatGPTに聞いたとき、答えが返ってくるまでの時間って何で決まるの?
推論を速くするためにはどうするの?
推論時にもGPUのメモリが足りないってどういうこと?学習じゃないのに?
まとめ:ざっくりこれだけ覚えればOK!
「モデル推論」って出てきたら「学習済みAIを実際に動かして答えを出す処理」と思えればだいたいOK!
📖 おまけ:英語の意味
「Model Inference」 = モデルによる推論・推定
💬 Inferenceは「推論・推定」の意味。統計学では「データからモデルのパラメータを推定すること」も指すが、AI文脈では「学習済みモデルを使って予測すること」を意味するよ