【もでるりょうしか】
モデル量子化 とは?
💡 高精度な地図を「住所メモ」に圧縮して、スマホでも持ち歩けるようにする技術
📌 このページのポイント
モデル量子化って、AIを「圧縮」するってこと?
数値を小さくすると精度が下がりそうだけど、大丈夫なの?
少し下がるよ。ただ、多くのモデルは必要以上に高精度な数値を持っていて、ちょっと丸めても結果がほとんど変わらないことが多いんだ。実際にint8量子化で精度低下が1%未満に収まるケースはたくさんあるよ。
どんな場面で使われるの?
量子化のやり方って一種類じゃないの?
LLMにも使われているの?大規模言語モデルって特に重そうだよね。
📖 おまけ:英語の意味
「Model Quantization」 = モデル量子化
💬 「Quantization(量子化)」は連続した値を離散的な段階に丸める処理のことで、画像圧縮でも使われる概念だよ