【かふかすとりーむず】
Kafka Streams とは?
💡 Kafkaという川の水を、別のサーバなしで川岸で加工できる
📌 このページのポイント
Kafka Streamsって、Kafkaと何が違うの?
Apache Kafkaはメッセージを「貯めて流す」基盤だよ。Kafka Streamsはそこに流れるデータをリアルタイムで加工・集計するためのライブラリだね
加工って、たとえばどんなことができるの?
注文イベントが流れてきたら金額を合計して、1分ごとの売上合計をリアルタイムで別Topicに書き出す、みたいなことができるよ。フィルタリング・マッピング・結合・ウィンドウ集計も全部できるんだ
似たものにSparkとかFlinkがあるって聞いたけど、Kafka Streamsとはどう違うの?
「ステートフルな集計」って難しそうだけど、どうやってるの?
📖 おまけ:英語の意味
「Kafka Streams」 = Kafkaのストリーム処理ライブラリ
💬 Apache Kafkaのサブプロジェクトとして開発されたライブラリだよ。streams(流れ)という名の通り、データを流れとして連続処理するんだ