【コンセプトドリフト】

コンセプトドリフト とは?

公開:
💡 ルールが変わったのに、古いルールブックで戦い続けるAI
📌 このページのポイント
データドリフト vs コンセプトドリフト データドリフト 入力データの分布が変化 20代女性 多数 40代男性 多数 コンセプトドリフト 入力→正解の関係が変化 20代女性 →イタリアン 20代女性 →韓国料理 コンセプトドリフトの種類 漸進的 じわじわ変化 突発的 急激に変化 再帰的 周期的に繰り返す
コンセプトドリフトのイメージ
ひよこ ひよこ
コンセプトドリフトって、データドリフトと何が違うの?
ペンギン先生 ペンギン先生
たとえ話で説明するね。レストランの食べログAIを想像してみて。「20代女性はイタリアンを好む」と学習したとするよ。データドリフトは「来店客が20代女性から40代男性に変わった」こと。コンセプトドリフトは「20代女性が来るのは同じだけど、イタリアンじゃなく韓国料理を好むようになった」ことだよ
ひよこ ひよこ
なるほど!入力は同じなのに正解が変わるってことなんだね!
ペンギン先生 ペンギン先生
そう。だからコンセプトドリフトはやっかいなんだ。入力データの統計量を見ても異常に気づけないことがあるからね
ひよこ ひよこ
じゃあどうやって検出するの?
ペンギン先生 ペンギン先生
代表的な方法は3つあるよ。1つ目は予測精度のモニタリング。正解データと比較して精度が下がってきたらドリフトの兆候だね。2つ目はADWINやPage-Hinkleyテストなどの統計的手法。3つ目はウィンドウベースの手法で、直近のデータと過去のデータを比較するんだ
ひよこ ひよこ
見つけたらどうやって直すの?
ペンギン先生 ペンギン先生
最新の正解ラベル付きデータで再学習するのが王道だよ。あとはオンライン学習で少しずつモデルを更新し続ける方法もある。古いデータを段階的に忘れて新しいパターンに適応させるんだ
ひよこ ひよこ
突然変わることもあるの?それともゆっくり変わるの?
ペンギン先生 ペンギン先生
両方あるよ。ゆっくり変わるのを「漸進的ドリフト」、急に変わるのを「突発的ドリフト」と呼ぶんだ。コロナ禍みたいな大きなイベントだと突発的に起きるし、ファッションの流行みたいに徐々に変わることもある。さらに季節ごとに行ったり来たりする「再帰的ドリフト」もあるんだよ
ひよこ ひよこ
いろんな種類があるんだね!AIの運用って大変なんだなあ
ペンギン先生 ペンギン先生
だからこそMLOpsモデルモニタリングが大事なんだ。モデルは作って終わりじゃなくて、継続的に性能を監視して、ドリフトを検知したらすぐ再学習できる仕組みを整えておくことが本番運用の鍵だよ
ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「コンセプトドリフト」って出てきたら「AIが学習したルール自体が世の中の変化で通用しなくなること」と思えればだいたいOK!
📖 おまけ:英語の意味
「Concept Drift」 = 概念の漂流・変動
💬 Concept は「概念」、つまりモデルが学んだ「こうすれば正解」というルールそのものが漂流していくイメージだよ
← 用語集にもどる