【きょうしありがくしゅう】

教師あり学習 とは?

💡 答え合わせしながら学ぶ「正解付き練習問題セット」
📌 このページのポイント
教師あり学習の仕組み 学習フェーズ ラベル付きデータ 入力: 画像 正解: 「猫」 モデル パターンを学習 パラメータ調整 誤差計算 予測 vs 正解 損失関数 フィードバック(重み更新) 学習済み モデル 繰返 予測フェーズ 新しいデータ 入力: 未知の画像 学習済みモデル パターン適用 予測結果 「猫」(確率: 95%) 正解ラベルなしで推論
教師あり学習の仕組み
ひよこ ひよこ

教師あり学習の「教師」って何のこと?

ペンギン先生 ペンギン先生

「正解データ」のことを教師って呼んでるんだよ。たとえばメール1000通に「スパム」「正常」ってラベルを人間が付けて、そのデータを使って学習させる。正解という「先生」に教えてもらうから「教師あり」なんだ。

ひよこ ひよこ

分類」と「回帰」って何が違うの?

ペンギン先生 ペンギン先生

分類は「どのカテゴリか」を当てるもので、回帰は「どんな数値か」を予測するものだよ。「この写真は犬か猫か」は分類、「この家の価格はいくらか」は回帰って感じだね。

ひよこ ひよこ

ラベル付けするのって大変そうだね。

ペンギン先生 ペンギン先生

そう、これが教師あり学習の最大のボトルネックなんだ。医療画像に「がんあり・なし」とラベルを付けるには専門の医師が必要で、コストがかかる。だから少ないラベル付きデータで学習する「半教師あり学習」や、そもそもラベルが不要な「教師なし学習」も研究されているよ。

ひよこ ひよこ

訓練データに含まれてない状況でも正しく動くの?

ペンギン先生 ペンギン先生

これが本質的な難しさで「分布シフト」という問題があるんだ。たとえば晴れた日の車の写真で学習したモデルは、雪道の写真でうまく動かないことがある。訓練データと実際の使用時のデータの分布が違うと精度がガタ落ちする。だから「どんなデータで学習したか」は「精度が何%か」と同じくらい重要で、本番環境のデータで定期的に再学習するのが実務の鉄則なんだよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「教師あり学習」って出てきたら「正解付きデータで答え合わせしながら学ぶ機械学習の方法だな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Supervised Learning」 = 監督された・管理された学習
💬 Supervisedは「監督・指導」の意味。正解という「先生の答え」に監督してもらいながら学ぶイメージだよ
← 用語集にもどる