【きょうしなしがくしゅう】
教師なし学習 とは?
💡 答えなしで自分でパターンを見つける「自由研究型AI」
📌 このページのポイント
正解なしで学習って、何を目指して学ぶの?
データの中に隠れている「構造」や「パターン」を見つけることが目的だよ。たとえばお客さんの購買データをクラスタリングすると、誰も教えていないのに「よく本を買うグループ」「スポーツ用品をよく買うグループ」みたいに自動でグループ分けできるんだ。
どんなときに教師あり学習より教師なし学習を選ぶの?
ラベル付けが難しいとき、またはそもそも「何が正解か分からない」ときだね。新しい異常パターンを検知する「異常検知」は、正常なデータだけで学習して「いつもと違う」を見つけるから教師なし学習が向いているよ。
グループ分けした後どうやって使うの?
分けたグループに人間が名前を付けて意味を解釈するんだ。「このグループはヘビーユーザーっぽい」「このグループはお試し層っぽい」って。発見は機械がするけど、意味づけは人間がやるんだよ。
クラスタリングって何個のグループに分ければ正解なの?
これが教師なし学習の一番つらいところで、「正解の数」が事前に分からないんだ。k-meansという有名な手法はグループ数kを最初に指定しないといけないのに、その最適なkが分からない。「エルボー法」や「シルエット係数」といった指標を使ってkを探すんだけど、最終的には「ビジネス的にこのくらいが扱いやすい」という判断が入ることも多い。機械学習なのに人間の勘が必要になる場面なんだよ。
まとめ:ざっくりこれだけ覚えればOK!
「教師なし学習」って出てきたら「正解なしでデータのかたまりや構造を自動発見する学習方法だな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Unsupervised Learning」 = 監督されていない学習
💬 「Un(否定)+ supervised(監督)」で監督なし、つまり正解データなしで自力で学ぶイメージだよ