【ないーぶべいず】
ナイーブベイズ とは?
💡 おめでたいほど単純な仮定なのに、なぜか意外とよく当たる分類器
📌 このページのポイント
ナイーブベイズって、名前に『ナイーブ(素朴)』ってついてるけど、バカにしてるの?
ちょっとからかった名前だよね。『すべての特徴が互いに独立している』という、現実にはありえないくらい単純な仮定を置くからナイーブ(世間知らず)と呼ばれているんだ
そんな雑な仮定で大丈夫なの?
それが面白いところで、理論的にはおかしい仮定なのに実際にはかなり良い結果が出るんだよ。スパムメールの判定なんかは今でもナイーブベイズが使われていることがあるんだ
スパムフィルターで使われてるんだ!どういう仕組みなの?
今は深層学習が主流だよね。もう使われてないのかな?
いや、今でも現役だよ。学習が超高速で、データが少なくてもそこそこ動くから、まずナイーブベイズで試してみてから深層学習に進む、というのが定番のアプローチだね。ベースラインとしてとても優秀なんだよ
まとめ:ざっくりこれだけ覚えればOK!
「ナイーブベイズ」って出てきたら「シンプルだけど実用的な確率ベースの分類器」と思えればだいたいOK!
📖 おまけ:英語の意味
「Naive Bayes」 = 素朴なベイズ
💬 naive(素朴な、世間知らずな)という名前は、特徴量の独立性という非現実的な仮定に由来するんだよ