【きょうしなしがくしゅう】

教師なし学習 とは?

💡 答えなしで自分でパターンを見つける「自由研究型AI」
📌 このページのポイント
教師なし学習 ― ラベルなしでパターンを発見 入力データ(ラベルなし) 学習 クラスタリング結果 代表的な手法 クラスタリング 次元削減(PCA) 異常検知 連関規則
教師なし学習のイメージ
ひよこ ひよこ

正解なしで学習って、何を目指して学ぶの?

ペンギン先生 ペンギン先生

データの中に隠れている「構造」や「パターン」を見つけることが目的だよ。たとえばお客さんの購買データをクラスタリングすると、誰も教えていないのに「よく本を買うグループ」「スポーツ用品をよく買うグループ」みたいに自動でグループ分けできるんだ。

ひよこ ひよこ

どんなときに教師あり学習より教師なし学習を選ぶの?

ペンギン先生 ペンギン先生

ラベル付けが難しいとき、またはそもそも「何が正解か分からない」ときだね。新しい異常パターンを検知する「異常検知」は、正常なデータだけで学習して「いつもと違う」を見つけるから教師なし学習が向いているよ。

ひよこ ひよこ

グループ分けした後どうやって使うの?

ペンギン先生 ペンギン先生

分けたグループに人間が名前を付けて意味を解釈するんだ。「このグループはヘビーユーザーっぽい」「このグループはお試し層っぽい」って。発見は機械がするけど、意味づけは人間がやるんだよ。

ひよこ ひよこ

クラスタリングって何個のグループに分ければ正解なの?

ペンギン先生 ペンギン先生

これが教師なし学習の一番つらいところで、「正解の数」が事前に分からないんだ。k-meansという有名な手法はグループ数kを最初に指定しないといけないのに、その最適なkが分からない。「エルボー法」や「シルエット係数」といった指標を使ってkを探すんだけど、最終的には「ビジネス的にこのくらいが扱いやすい」という判断が入ることも多い。機械学習なのに人間の勘が必要になる場面なんだよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「教師なし学習」って出てきたら「正解なしでデータのかたまりや構造を自動発見する学習方法だな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Unsupervised Learning」 = 監督されていない学習
💬 「Un(否定)+ supervised(監督)」で監督なし、つまり正解データなしで自力で学ぶイメージだよ
← 用語集にもどる