【せいきか】

正規化(機械学習) とは?

💡 データの尺度を揃えて学習をスムーズにする「AIの下ごしらえ」
📌 このページのポイント
正規化(Normalization)— データスケーリング 正規化前 年齢: 0〜100 年収: 0〜1000万 変換 正規化後 年齢: 0〜1 年収: 0〜1 0 1 異なるスケールのデータを統一範囲に揃えて公平に比較できるようにする
正規化(データスケーリング)のイメージ
ひよこ ひよこ

なんで正規化が必要なの?

ペンギン先生 ペンギン先生

例えば「年齢(0~100)」と「年収(0~1000万)」を一緒に学習すると、年収のスケールが大きすぎて年齢の影響が埋もれてしまうんだ。正規化で両方を0~1の範囲に揃えれば、どちらの特徴量も平等に学習に貢献できるようになるよ。

ひよこ ひよこ

バッチ正規化って何?

ペンギン先生 ペンギン先生

ニューラルネットワークの各層の入力を、ミニバッチ(データの小集団)ごとに平均0・分散1に正規化する技術だよ。これにより学習が安定して速くなるし、過学習も起きにくくなる。ディープラーニングでは定番中の定番テクニックだね。

ひよこ ひよこ

正規化正則化は違うの?

ペンギン先生 ペンギン先生

名前が似ていて紛らわしいよね。正規化(Normalization)はデータのスケールを揃える処理。正則化(Regularization)はモデルの複雑さにペナルティを与えて過学習を防ぐ手法。目的が違うけど、どちらも学習を改善する重要なテクニックだよ。

ひよこ ひよこ

レイヤー正規化ってバッチ正規化と何が違うの?

ペンギン先生 ペンギン先生

バッチ正規化ミニバッチ内のデータ全体で統計量を計算するけど、レイヤー正規化は1つのサンプル内の全ニューロンで計算するんだ。Transformerモデルではレイヤー正規化が標準的に使われているよ。バッチサイズが小さい場合や、系列データを扱うときに安定するのが強みだね。

ひよこ ひよこ

正規化って色々あって混乱するなぁ…

ペンギン先生 ペンギン先生

確かに多いよね。実は深層学習の歴史で「どこで正規化するか」が大きな研究テーマで、バッチ正規化(2015年)→レイヤー正規化(2016年)→グループ正規化(2018年)→RMSNorm(2019年)と進化してきたんだ。最新のLLMではRMSNormが使われていて、計算コストを抑えつつ性能を維持できるのがポイントだよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
正規化」って出てきたら「データやモデルの値を調整して学習を安定・高速化させる前処理テクニックだな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Normalization」 = 正規化・標準化
💬 「Normalize(正常にする・標準化する)」が語源。データを扱いやすい形に整える処理を表すよ
← 用語集にもどる