【けっていき】

決定木 とは?

💡 Yes/Noで枝分かれする「フローチャート型AI」
📌 このページのポイント
Yes No Yes No Yes No 条件 A? 条件 B? 条件 C? 予測: A 予測: B 予測: C 予測: D ルート 中間ノード リーフ(予測)
決定木の構造
ひよこ ひよこ

決定木って木みたいな形をしてるの?

ペンギン先生 ペンギン先生

そうだよ!根(ルート)から始まって、質問のたびに枝が分かれて、最終的に葉(リーフ)に答えが書いてある感じだよ。「年齢は30以上?」→ Yes → 「年収は500万以上?」→ No → 「リスク高」みたいに判断していくんだ。

ひよこ ひよこ

ニューラルネットワークと何が違うの?

ペンギン先生 ペンギン先生

決定木の最大の強みは「なぜその判断をしたか」が分かること。ニューラルネットワークはブラックボックスになりがちだけど、決定木は人間が読める形でルールが書いてあるから、医療や金融など理由の説明が必要な場面で重宝されるんだよ。

ひよこ ひよこ

深くすれば精度が上がるってこと?

ペンギン先生 ペンギン先生

深くしすぎると「過学習」が起きるんだ。訓練データの細かいノイズまで覚えてしまって、新しいデータでは全然ダメになる。だから枝刈り(プルーニング)で木を適切な深さに制限したり、ランダムフォレストみたいに複数の木を組み合わせる手法が使われるよ。

ひよこ ひよこ

おもしろい!どの質問を最初に持ってくれば効率的なの?どうやって決めるの?

ペンギン先生 ペンギン先生

これが決定木アルゴリズムの核心で、「情報利得」や「ジニ不純度」という指標を使うんだ。「この質問で分けると、それぞれのグループがどれだけ均一になるか」を数値化して、一番均一にできる質問を根に持ってくる。ジニ不純度は「グループの中がバラバラ度」を表す数値で、0に近いほど純粋なグループ。同じデータでもIDが3かどうかみたいな無意味な特徴を選ばないように、情報の価値を計算するのが面白いところなんだよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「決定木」って出てきたら「Yes/Noで枝分かれしながら答えを出すフローチャート型のAIモデルだな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Decision Tree」 = 決定の木
💬 木(Tree)が枝分かれするように、質問のたびに選択肢が枝分かれしていく様子から名付けられたよ
← 用語集にもどる