【いじょうけんち】

異常検知 とは?

💡 データの中の「いつもと違う」を見つけるAI技術
📌 このページのポイント
異常検知 — 正常パターンから外れたデータを検出 平均 時間 → 上限 下限 正常 異常! 異常! 正常データ 異常値 正常範囲 不正アクセス検知 設備の故障予兆 クレジットカード不正利用
異常検知のイメージ
ひよこ ひよこ

異常検知ってどういうときに使うの?

ペンギン先生 ペンギン先生

クレジットカードの不正利用検知が一番わかりやすいかな。普段は日本国内で数千円の買い物をしている人が、突然海外で数十万円の決済をしたら「異常」と判定してカードを止めるんだ。他にも工場の機械のセンサーデータがいつもと違うパターンを示したら、故障の予兆として検知するよ。

ひよこ ひよこ

普通の機械学習と何が違うの?

ペンギン先生 ペンギン先生

普通の分類問題だと「正常データ」と「異常データ」の両方を使って学習するんだけど、異常検知では異常データがほとんど手に入らないんだ。不正利用なんて全取引の0.1%もないからね。だから「正常とはどういうパターンか」を学習して、そこから大きく外れたものを異常と判定する方法が多いよ。

ひよこ ひよこ

どうやって「正常」を定義しているの?

ペンギン先生 ペンギン先生

いくつか方法があるけど、統計的な手法では「平均値から大きく離れた値は異常」と判定する。機械学習ではオートエンコーダーというモデルが面白くて、正常データを圧縮して復元する訓練をするんだ。うまく復元できないデータは「学習したことがない=異常」と判断するよ。

ひよこ ひよこ

異常検知の難しいところって何?

ペンギン先生 ペンギン先生

「何をもって異常とするかの線引き」が実は本質的に難しいんだ。閾値を厳しくすると本物の異常を見逃すし(偽陰性)、緩くするとニセモノのアラートが大量に出る(偽陽性)。特にセキュリティの分野では、アラートが多すぎると担当者が慣れてしまって本当の異常も見逃す「アラート疲れ」という問題が起きる。さらに厄介なのは、正常なパターン自体が時間とともに変化する「コンセプトドリフト」で、去年の正常が今年は異常、ということもある。結局、完璧な閾値は存在しなくて、ビジネスの文脈に応じて「見逃しと誤報のどちらが痛いか」を判断して調整し続けるしかないんだよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「異常検知」って出てきたら「普段と違うおかしなデータを自動で見つける技術のことだな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Anomaly Detection」 = 異常の検出
💬 Anomalyは「異常・例外」、Detectionは「検出」。普通と違うものを見つけ出す技術だよ
← 用語集にもどる