【こうばいぶーすてぃんぐ】
勾配ブースティング とは?
💡 弱い学習器が「前の失敗」を補い合って強くなる手法
📌 このページのポイント
勾配ブースティングってどういうしくみなの?
まず1つ目の簡単なモデルで予測して、その予測誤差を計算する。次に2つ目のモデルで「その誤差」を予測する。さらに3つ目のモデルで「残った誤差」を予測する…という繰り返しなんだ。100人でリレーしてバトンを渡すように、前の人の失敗を次の人がカバーしていくイメージだよ。
「勾配」って何のこと?
なんでそんなに強いの?
表形式のデータ(Excelのようなデータ)に関しては、Kaggleのコンペで圧倒的な勝率を誇っているんだ。特徴量エンジニアリング(データの加工)をしっかりやって勾配ブースティングを使えば、たいていのタスクで上位に入れると言われているよ。
勾配ブースティングにも弱点はある?
まとめ:ざっくりこれだけ覚えればOK!
「勾配ブースティング」って出てきたら「弱いモデルを順番に足して前の失敗を修正していく強力な学習手法のことだな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Gradient Boosting」 = 勾配による強化
💬 Gradientは「勾配(傾き)」、Boostingは「強化・後押し」。勾配(微分)を使って予測を少しずつ強化していく手法だよ