【ディービーティークラウド】

dbt Cloud(ディービーティークラウド) とは?

💡 SQLだけでデータ変換パイプラインを組み立てるクラウド職人
📌 このページのポイント
dbt Cloud データ変換パイプライン 生データ 売上テーブル 顧客テーブル dbt Cloud stg int mart SQLモデルのDAG 分析用データ 月次サマリー KPIダッシュ用 Web IDE ブラウザで SQL編集+実行 スケジューラー 定期実行+ CI/CD連携 テスト NOT NULL Unique / 参照整合性 ドキュメント 自動生成 リネージ可視化
dbt Cloudのデータ変換パイプラインと主要機能
ひよこ ひよこ

dbtって何をするツールなの?

ペンギン先生 ペンギン先生

データウェアハウスに入っている生データを、分析しやすい形に変換するツールだよ。たとえば「売上テーブルと顧客テーブルを結合して月次サマリーを作る」みたいなことをSQLで定義して、自動実行してくれるんだ

ひよこ ひよこ

dbt Coreとdbt Cloudの違いは?

ペンギン先生 ペンギン先生

dbt CoreはオープンソースのCLIツールで、コマンドラインから使うんだ。dbt CloudはそれにWeb IDE、ジョブスケジューラー、CI/CD、履歴管理などを加えたSaaS版。チームで使うならCloudの方が圧倒的に便利だよ

ひよこ ひよこ

なんでSQLだけで変換するの?PythonとかJavaじゃダメなの?

ペンギン先生 ペンギン先生

データアナリストはSQLが得意な人が多いんだ。dbtSQLを書ける人なら誰でもデータパイプラインを作れるようにして、エンジニアとアナリストの境界を取り払ったのが革命的だったんだよ

ひよこ ひよこ

テスト機能ってどんなことができるの?

ペンギン先生 ペンギン先生

「このカラムはNULLであってはならない」「ユニークであるべき」「参照先テーブルに値が存在するべき」みたいなテストをYAMLで簡単に定義できるよ。変換結果の品質を自動チェックしてくれるんだ

ひよこ ひよこ

モダンデータスタックでは必須なの?

ペンギン先生 ペンギン先生

ほぼ必須と言っていいね。Fivetranやairbyteでデータを転送して、dbtで変換するのがモダンデータスタックの定番パターン。最近はSemantic Layerという機能でBIツールとの連携も強化しているよ

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
dbt Cloud」って出てきたら「SQLでデータ変換を管理するクラウドサービス」と思えればだいたいOK!
📖 おまけ:英語の意味
「data build tool Cloud」 = データ構築ツールのクラウド版
💬 dbtは「data build tool」の略で、全部小文字で書くのが正式表記。データを「ビルド(構築)」するというソフトウェアエンジニアリングの考え方を取り入れているんだよ
← 用語集にもどる