【アパッチフリンク】
Apache Flink(フリンク) とは?
💡 流れるデータを止めずに処理する高速エンジン
📌 このページのポイント
ストリーム処理って、データが来るたびにすぐ処理するってこと?
SparkのStructured Streamingとはどう違うの?
Exactly-onceって何がすごいの?
分散システムでは障害でデータが重複処理されたり欠落したりしがちなんだ。Flinkはチェックポイント機構で「どんな障害が起きても各レコードを厳密に1回だけ処理する」ことを保証してくれる。お金の計算に関わるシステムでは必須の機能だね
どんな会社が使ってるの?
Alibaba、Netflix、Uber、LinkedInなど大規模データ処理が必要な企業で広く使われているよ。特にAlibabaはFlinkに大きく貢献していて、独身の日セールのリアルタイム処理にも使っているんだ
Flinkは学ぶの難しい?
まとめ:ざっくりこれだけ覚えればOK!
「Apache Flink」って出てきたら「データをリアルタイムに流しながら処理する分散エンジン」と思えればだいたいOK!
📖 おまけ:英語の意味
「Apache Flink」 = アパッチフリンク
💬 Flinkはドイツ語で「素早い」という意味。ベルリン工科大学発のプロジェクトだからドイツ語なんだよ