【ばっちしょり】
バッチ処理 とは?
💡 データを「まとめて一気に」処理する
📌 このページのポイント
リアルタイム処理と何が違うの?
リアルタイム処理はデータが来るたびに即座に処理する(チャットメッセージ、株価更新)。バッチ処理はデータを溜めてからまとめて処理する(日次売上集計、月末請求計算)。リアルタイムは低遅延だけどシステムが複雑、バッチはシンプルだけど結果が出るまで時間がかかるんだよ
どんな場面で使う?
バッチ処理の設計で大事なことは?
ストリーム処理に置き換えるべき?
全部置き換える必要はない。「ニアリアルタイムで結果が欲しい」ならストリーム(Apache Kafka + Flink)、「日次・月次で十分」ならバッチの方がシンプルでコストが安い。Lambdaアーキテクチャ(バッチ+ストリームの併用)やKappaアーキテクチャ(ストリームに統一)など、ハイブリッドな選択肢もあるよ
まとめ:ざっくりこれだけ覚えればOK!
「バッチ処理」って出てきたら「データをまとめて一括処理する方式」と思えればだいたいOK!
📖 おまけ:英語の意味
「Batch Processing」 = 一括処理
💬 Batch(ひとまとめ)にProcessing(処理)する。パン屋が生地をまとめて焼くイメージだよ