Fluentdとは何ですか？

ログやイベントデータを収集・変換・転送するオープンソースのデータコレクター。CNCFの卒業プロジェクト。

Fluentdのポイントは？

多様な入力ソース（ファイル、HTTP、syslog等）からログを収集。フィルタプラグインでデータを加工・変換。多様な出力先（Elasticsearch、S3、BigQuery等）に転送。500以上のプラグインで拡張可能

【ふるーえんとでぃー】

Fluentd とは？

💡 あらゆるログを「集めて変換して送る」統合パイプライン

📌 このページのポイント

多様な入力ソース（ファイル、HTTP、syslog等）からログを収集
フィルタプラグインでデータを加工・変換
多様な出力先（Elasticsearch、S3、BigQuery等）に転送
500以上のプラグインで拡張可能

Fluentdのイメージ

ひよこ

なぜログ収集ツールが必要なの？

ペンギン先生

マイクロサービスで10個のサービスが動いていると、ログが10箇所に分散する。障害調査で各サーバーにSSHしてログを見るのは非現実的。Fluentdが各サーバーからログを収集して、Elasticsearch等の集中管理基盤に送ることで、一箇所で全ログを検索・分析できるようになるんだよ

ひよこ

Fluent Bitとどう違うの？

ペンギン先生

Fluentdはフル機能のログコレクター（Ruby製、プラグイン豊富）。Fluent BitはC製の軽量版で、メモリ使用量が少ない（数MB）。Kubernetesでは各ノードにFluent Bitを置いてログを収集し、Fluentdのアグリゲーターに送る構成が一般的。エッジデバイスやコンテナにはFluent Bit、集約にはFluentdと使い分けるよ

ひよこ

おもしろい！設定はどう書くの？

ペンギン先生

sourceディレクティブ（入力）、filterディレクティブ（加工）、matchディレクティブ（出力）の3段構成。<source> @type tail path /var/log/app.log </source>のように書く。filterでログのパース（JSON化）やフィールド追加、不要ログのドロップができる。td-agent（公式パッケージ）でインストールすると楽だよ

ひよこ

大量ログでも大丈夫？

ペンギン先生

バッファリング機能が充実していて、出力先がダウンしてもバッファにログを溜めておける。ファイルバッファを使えばFluentd自体の再起動でもログを失わない。ただし本当に大量（1日10TB超）ならApache KafkaをFluentdとの間に挟んでバッファリングを強化するのがベストプラクティスだよ

まとめ：ざっくりこれだけ覚えればOK！

「Fluentd」って出てきたら「ログを集めて変換して転送するデータ収集ツール」と思えればだいたいOK！

📖 おまけ：英語の意味

「Fluentd」＝流暢な(データ)デーモン

💬 Fluent（流暢な）+ d（daemon）。データが流暢に流れるイメージだよ

← 用語集にもどる