【ぶるーむふぃるた】
ブルームフィルタ とは?
💡 「たぶん含まれる」か「絶対ない」を超省メモリで判定
📌 このページのポイント
普通にHashSetで判定すればいいのでは?
1億個のURLが集合にあるか判定する場合、HashSetだと数GBのメモリが必要。ブルームフィルタなら同じ要素数で偽陽性率1%でも約120MBで済む。「確実に存在しない」がわかれば十分なケースが多いんだ。存在するかもしれない場合だけ本格的な検索に進む二段階チェックが典型的な使い方だよ
どうやって動くの?
どこで使われている?
削除はできるの?
まとめ:ざっくりこれだけ覚えればOK!
「ブルームフィルタ」って出てきたら「省メモリで集合の存在判定をする確率的データ構造」と思えればだいたいOK!
📖 おまけ:英語の意味
「Bloom Filter」 = ブルームのフィルタ
💬 1970年にBurton Howard Bloomが発明。半世紀以上使われている名作データ構造だよ