【アパッチソーラー】

Apache Solr とは?

💡 Luceneの力を企業規模で使うための「検索の司令塔」。
📌 このページのポイント
Apache Solr のアーキテクチャ クライアント HTTP リクエスト Apache Solr HTTPサーバー(Jetty) クエリパーサー ファセット / ハイライト Apache Lucene(内部) SolrCloud 分散クラスタ構成 シャーディング / レプリカ ZooKeeper でクラスタ管理 ZooKeeper クラスタ状態管理 ファセット検索:カテゴリ / 価格帯 / ブランドで絞り込みUI 電子商取引・エンタープライズ検索で広く採用
Solr は Lucene を中核に検索・分散・可視化を統合するプラットフォーム
ひよこ ひよこ

Apache Solrって名前は聞いたことあるけど、何をするものなの?

ペンギン先生 ペンギン先生

Webサービスやアプリに全文検索機能を追加するためのOSSだよ。HTTPでリクエストを送ると、関連する文書を返してくれるんだ。

ひよこ ひよこ

ElasticsearchとかOpenSearchと似てるの?

ペンギン先生 ペンギン先生

そう、全部Apache Luceneがベースなんだよ。Solrの方が歴史が長くて2004年からあるんだ。Elasticsearchが2010年に登場してからは競合関係になったけどね。

ひよこ ひよこ

ファセット検索って何?

ペンギン先生 ペンギン先生

ショッピングサイトで『価格帯:1000円〜3000円』『カテゴリ:スポーツ』みたいに絞り込める機能だよ。Solrはこれが得意で、昔から電子商取引サイトで多く使われてきたんだ。

ひよこ ひよこ

SolrCloudって何?

ペンギン先生 ペンギン先生

複数台のサーバーにデータを分散させて大規模検索を実現する仕組みだよ。ZooKeeperというツールでクラスタの状態を管理するんだ。

ひよこ ひよこ

今もSolrって使われてるの?

ペンギン先生 ペンギン先生

うん、今でも大企業や官公庁系のシステムで現役だよ。Elasticsearchより設定がXMLベースで明示的なので、エンタープライズ環境では好まれることもあるんだ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
Apache Solr」って出てきたら「LuceneベースのOSS全文検索エンジン」と思えればだいたいOK!
📖 おまけ:英語の意味
「Apache Solr」 = アパッチソーラー
💬 「Solr」はもともと「Searching On Lucene w/ Replication」の略という説があるよ。Luceneを使い、データを複製(レプリケーション)しながら検索するシステムという意味だね。
← 用語集にもどる