【でーたどっぐ】

Datadog とは?

💡 インフラの番犬、異常を嗅ぎつけるオブザーバビリティの親玉
📌 このページのポイント
オブザーバビリティの3本柱 メトリクス Metrics CPU・メモリ・応答時間 ログ Logs イベント記録・エラー検索 トレース Traces リクエスト経路の追跡 Datadog ─ 統合オブザーバビリティ 3つの柱を横断的に分析 → 障害原因を素早く特定
Datadogの監視3本柱:メトリクス・ログ・トレースを統合管理
ひよこ ひよこ

Datadogってただの監視ツール?

ペンギン先生 ペンギン先生

「ただの」というには範囲が広すぎるんだ。サーバーCPU使用率みたいなインフラ監視はもちろん、アプリの応答速度、ログ分析、ユーザーのブラウザ体験まで、システム全体を1箇所で見渡せるオブザーバビリティプラットフォームだよ。

ひよこ ひよこ

PrometheusGrafanaと何が違うの?

ペンギン先生 ペンギン先生

PrometheusGrafanaオープンソースで自分で構築・運用するけど、Datadogは全部SaaSで提供されるから運用の手間がかからないんだ。その代わり料金はそれなりにかかるから、規模とコストのバランスで選ぶことになるよ。

ひよこ ひよこ

おもしろい!「オブザーバビリティ3本柱」って何?

ペンギン先生 ペンギン先生

メトリクスCPUやメモリの数値)、ログ(イベントの記録)、トレース(リクエストがどのサービスを通ったかの追跡)の3つだよ。この3つを横断的に分析できると、「何が起きて、なぜ起きて、どこで起きたか」を素早く突き止められるんだ。

ひよこ ひよこ

導入は大変?

ペンギン先生 ペンギン先生

Datadog Agentというソフトをサーバーインストールするだけで基本的なメトリクスは自動収集されるよ。Kubernetesならhelm installで一発。あとはWeb画面でダッシュボードを作ったりアラートを設定したりするんだ。

ひよこ ひよこ

料金が高いって聞くけど…

ペンギン先生 ペンギン先生

確かにホスト数やログ量に比例して課金されるから、大規模になるとコストが膨らみやすいんだ。「ログを全部送ったら月額がすごいことに」という話はよく聞くよ。除外フィルタやサンプリングでコスト最適化するのが実務のコツだね。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「Datadog」って出てきたら「クラウドインフラとアプリを丸ごと監視するオブザーバビリティSaaS」と思えればだいたいOK!
📖 おまけ:英語の意味
「Datadog」 = データの番犬
💬 データを見張る番犬(Dog)というイメージで、ロゴも犬のキャラクターなんだよ
← 用語集にもどる