【でーためっしゅ】
データメッシュ とは?
💡 データは中央集権から分散自治へ
📌 このページのポイント
- 中央のデータチームがすべて管理する従来モデルの限界を解消
- 各事業部門がデータの所有者として品質と提供に責任を持つ
- データをAPIのように「プロダクト」として社内外に提供する考え方
- ThoughtWorksのZhamak Dehghaniが2019年に提唱
データレイクとは何が違うの?
データレイクは全社のデータを1箇所に集める「中央集権型」だよね。データメッシュは逆に、各事業部門が自分のデータを管理して「プロダクト」として社内に提供する「分散型」なんだ
なんで分散させるの?中央管理のほうが楽じゃない?
おもしろい!各部門バラバラにならない?
そこが重要なポイントで、データメッシュには「フェデレーテッドガバナンス」という全社共通のルールがあるんだ。データの品質基準やメタデータの形式は統一しつつ、管理責任は分散させる。自治体と中央政府の関係に似ているね
導入している企業はあるの?
Netflix、Zalando、JPMorganなど大手企業が導入を進めているよ。ただし組織文化の変革も必要だから一朝一夕にはいかない。まずは1〜2ドメインから始めて段階的に広げるのが現実的なアプローチだね
まとめ:ざっくりこれだけ覚えればOK!
「データメッシュ」って出てきたら「データの管理を各部門に分散させるアーキテクチャ」と思えればだいたいOK!
📖 おまけ:英語の意味
「Data Mesh」 = データの網目状構造
💬 Mesh(網目)のように、各ドメインがデータノードとしてつながるイメージ。中央集権のデータレイクと対比される概念だよ