【アパッチ パルサー】

Apache Pulsar とは?

💡 KafkaとMQのいいとこ取りをした、次世代メッセージングの申し子
📌 このページのポイント
Apache Pulsar — BrokerとStorageの分離アーキテクチャ Producer A Producer B Pulsar Brokers Broker 1 Broker 2 ルーティング・配信 BookKeeper Bookie 1 Bookie 2 永続ストレージ Consumer A Consumer B ZooKeeper(メタデータ管理) ※ Geo-Replication:別リージョンのBroker間で自動複製
Apache Pulsar:BrokerとBookKeeperを分離した拡張しやすいアーキテクチャ
ひよこ ひよこ

Apache PulsarってKafkaと何が違うの?

ペンギン先生 ペンギン先生

一番の違いはアーキテクチャだよ。KafkaはBrokerがデータも保持するけど、PulsarはBrokerとストレージApache BookKeeper)が分離してるんだ。

ひよこ ひよこ

分離してると何がいいの?

ペンギン先生 ペンギン先生

ブローカーの台数とストレージの容量を独立してスケールできるんだよ。Kafkaは両方いっしょにスケールしないといけないから、場合によってはムダが出てくるんだ。

ひよこ ひよこ

マルチテナントって複数の会社や部署が使えるってこと?

ペンギン先生 ペンギン先生

そうだよ。Pulsarは「テナント → 名前空間 → トピック」という3層の階層構造で管理できるから、組織ごとにトピックを分けてアクセス権も制御できるんだ。Kafkaは後からこの仕組みを追加したけど、Pulsarは最初から設計に組み込まれてるよ。

ひよこ ひよこ

Geo-Replicationって難しそう…

ペンギン先生 ペンギン先生

東京リージョンに届いたメッセージを大阪リージョンにも自動で複製する機能だよ。設定ひとつで有効になるから、災害対策やグローバル展開に便利なんだ。

ひよこ ひよこ

Kafkaのかわりに乗り換える企業も増えてるの?

ペンギン先生 ペンギン先生

Yahoo!やTencentなど大規模に使っている企業も多いよ。ただKafkaのエコシステムも成熟していて、どちらが優れているとは一概に言えないんだ。規模やマルチテナントの必要性によって選ぶのが現実的だね。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
Apache Pulsar」って出てきたら「Kafkaの後継候補として注目されるマルチテナント対応メッセージングシステム」と思えればだいたいOK!
📖 おまけ:英語の意味
「Apache Pulsar」 = アパッチ パルサー(脈動する星)
💬 パルサーとは宇宙で規則的に電波を放射する中性子星のこと。途切れなく高速でメッセージを放射し続けるという意味を込めた名前なんだよ
← 用語集にもどる