【仕組み解説】機械学習はどうやってデータからパターンを見つけているのか — 学習の仕組みを図解
機械学習ってよく聞くけど、AIが「学ぶ」ってどういうことなの?
自分でルールを見つけるの? たとえばどんな感じなの?
たとえば「猫の写真を判別したい」としよう。従来は「耳がとがっていて、ヒゲがあって…」みたいなルールを全部書く必要があった。でも機械学習なら、猫の写真と猫じゃない写真をたくさん見せるだけで、コンピュータが「猫っぽさ」を自分で見つけてくれるんだよ。
すごい! でもどうやって学ぶの? 種類とかあるの?
正解がないデータからも学べるの?
もう1つは何なの?
「強化学習」だよ。これは試行錯誤しながら「報酬」を最大化する行動を学ぶ方法なんだ。囲碁AIのAlphaGoが有名だね。最初はランダムに手を打つけど、勝つと報酬がもらえるので、だんだん強い手を打てるようになるんだよ。
なるほど! じゃあ具体的に「学習する」って中では何が起きてるの?
重みの微調整ってどうやるの?
「勾配降下法」っていう仕組みを使うよ。山の斜面で一番低い谷底を目指すイメージだね。今いる場所の傾きを計算して、下り坂の方向に少しずつ進む。これを繰り返すと、損失が最小になるポイント — つまり予測精度が最も高い状態にたどり着くんだ。
いっぱい学習すればするほど賢くなるってこと?
実はそうとも限らないんだ。学習データを完璧に覚えすぎると「過学習」っていう問題が起きる。テストの過去問だけ丸暗記した学生みたいなもので、見たことのない新しい問題には対応できなくなる。大事なのは「本質を理解する」こと、これを汎化って呼ぶんだよ。
ニューラルネットワークっていうのも機械学習なの?
そうだよ。ニューラルネットワークは脳の神経細胞(ニューロン)の仕組みを模したモデルで、機械学習の一手法なんだ。入力層・中間層・出力層があって、中間層を何十層、何百層と深くしたものがディープラーニング(深層学習)だよ。層が深いほど複雑なパターンを捉えられるようになるんだ。
今話題の大規模言語モデルもそこから来てるの?