【コンセプトドリフト】
コンセプトドリフト とは?
💡 ルールが変わったのに、古いルールブックで戦い続けるAI
📌 このページのポイント
コンセプトドリフトって、データドリフトと何が違うの?
たとえ話で説明するね。レストランの食べログAIを想像してみて。「20代女性はイタリアンを好む」と学習したとするよ。データドリフトは「来店客が20代女性から40代男性に変わった」こと。コンセプトドリフトは「20代女性が来るのは同じだけど、イタリアンじゃなく韓国料理を好むようになった」ことだよ
なるほど!入力は同じなのに正解が変わるってことなんだね!
そう。だからコンセプトドリフトはやっかいなんだ。入力データの統計量を見ても異常に気づけないことがあるからね
じゃあどうやって検出するの?
代表的な方法は3つあるよ。1つ目は予測精度のモニタリング。正解データと比較して精度が下がってきたらドリフトの兆候だね。2つ目はADWINやPage-Hinkleyテストなどの統計的手法。3つ目はウィンドウベースの手法で、直近のデータと過去のデータを比較するんだ
見つけたらどうやって直すの?
最新の正解ラベル付きデータで再学習するのが王道だよ。あとはオンライン学習で少しずつモデルを更新し続ける方法もある。古いデータを段階的に忘れて新しいパターンに適応させるんだ
突然変わることもあるの?それともゆっくり変わるの?
両方あるよ。ゆっくり変わるのを「漸進的ドリフト」、急に変わるのを「突発的ドリフト」と呼ぶんだ。コロナ禍みたいな大きなイベントだと突発的に起きるし、ファッションの流行みたいに徐々に変わることもある。さらに季節ごとに行ったり来たりする「再帰的ドリフト」もあるんだよ
いろんな種類があるんだね!AIの運用って大変なんだなあ
まとめ:ざっくりこれだけ覚えればOK!
「コンセプトドリフト」って出てきたら「AIが学習したルール自体が世の中の変化で通用しなくなること」と思えればだいたいOK!
📖 おまけ:英語の意味
「Concept Drift」 = 概念の漂流・変動
💬 Concept は「概念」、つまりモデルが学んだ「こうすれば正解」というルールそのものが漂流していくイメージだよ