【めだりおんあーきてくちゃ】

メダリオンアーキテクチャ とは?

💡 データを磨いてピカピカの金メダルに仕上げる3段階変身術
📌 このページのポイント
メダリオンアーキテクチャ(3層データ品質モデル) Bronze(銅) 生データ APIログ CSVファイル DBダンプ そのまま保管 変換 Silver(銀) クレンジング済み 重複排除 スキーマ統一 テーブル結合 分析可能な状態 集計 Gold(金) ビジネス指標 売上KPI 顧客セグメント ダッシュボード用 即利用可能 データ品質 ───────────────→ 高
メダリオンアーキテクチャの3層構造
ひよこ ひよこ

メダリオンアーキテクチャって、データにメダルをあげるの?

ペンギン先生 ペンギン先生

イメージとしてはそうだね!データをBronze(銅)→Silver(銀)→Gold(金)の3層に分けて、段階的にきれいにしていく設計パターンだよ

ひよこ ひよこ

おもしろい!なんでいきなりGoldにしないの?

ペンギン先生 ペンギン先生

いい質問だね。生データにはエラーや重複がたくさんあるから、一気に加工すると問題が見つけにくいんだ。段階を踏むことで、どこで何が変わったか追跡しやすくなるよ

ひよこ ひよこ

Bronze層って具体的に何が入るの?

ペンギン先生 ペンギン先生

APIやログファイル、CSVなど外部から取り込んだ生データがそのまま入るよ。加工せずに保管するから「Single Source of Truth」として使えるんだ

ひよこ ひよこ

Databricksが作った考え方なんだよね?他でも使えるの?

ペンギン先生 ペンギン先生

もちろん。Delta Lake以外にもApache Icebergなど他のテーブル形式でも同じ考え方が適用できるよ。重要なのは「3層で品質を段階的に上げる」という設計思想そのものだね

ひよこ ひよこ

Gold層はどんなふうに使われるの?

ペンギン先生 ペンギン先生

BIツールやダッシュボードから直接参照される集計済みテーブルだよ。部門ごとに必要な指標をまとめた「データマート」とも言えるね。分析チームはGold層だけ見ればいいから効率的なんだ

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「メダリオンアーキテクチャ」って出てきたら「Bronze→Silver→Goldの3層でデータをきれいにしていく設計」と思えればだいたいOK!
📖 おまけ:英語の意味
「Medallion Architecture」 = メダル型アーキテクチャ
💬 メダル(Bronze/Silver/Gold)になぞらえてデータの品質レベルを表現しているんだよ
← 用語集にもどる