【アパッチルシーン】
Apache Lucene とは?
💡 検索エンジンたちの「共通の心臓部」、全文検索のデファクトライブラリ。
📌 このページのポイント
ElasticsearchとSolrって全然別物なの?
実は両方ともApache Luceneというライブラリを使っているんだよ。Luceneが検索の心臓部で、ElasticsearchやSolrはその上に使いやすいAPIや管理機能を加えたものなんだ。
じゃあLucene自体を直接使うことはあるの?
転置インデックスって何?
「どの単語が、どの文書に含まれるか」を逆引きできる索引だよ。たとえば『りんご → 文書1, 文書3』みたいに単語から文書を探せるんだ。だから全文検索がすごく速くなるよ。
BM25ってどういう仕組みなの?
検索クエリに対してどの文書が一番関連しているかをスコアで計算する方式だよ。単語の出現頻度や文書の長さを考慮して、より的確な結果を上位に出してくれるんだ。
アナライザーって聞いたことあるけど何をするの?
まとめ:ざっくりこれだけ覚えればOK!
📖 おまけ:英語の意味
「Apache Lucene」 = アパッチルシーン
💬 開発者Doug Cuttingの妻の名前に由来するという説がある名前だよ。1999年に公開されて、2001年にApache Software Foundationへ寄贈されたんだ。