【でーたぷろだくと】

データプロダクト とは?

💡 データを商品棚に並べるように、誰でも手に取れる品質で届ける
📌 このページのポイント
データプロダクトの構成要素 データプロダクト データ本体 スキーマ定義 品質メトリクス SLA・所有者 APIインターフェース / ドキュメント ドメインチーム (所有・管理) BIツール 他チーム MLパイプライン データカタログ(検索・発見・メタデータ管理)
データプロダクトの構成と利用の流れ
ひよこ ひよこ

データプロダクトって、データを売り物にするってこと?

ペンギン先生 ペンギン先生

売り物というより「ちゃんとした製品として扱う」という意味だよ。品質保証ドキュメントを付けて、誰でも安心して使えるデータにすることだね

ひよこ ひよこ

今までのデータ管理と何が違うの?

ペンギン先生 ペンギン先生

従来は中央のデータチームがすべてのデータを管理していたけど、データプロダクトの考え方では各業務チームが自分のデータに責任を持つんだ。売上データは営業チーム、ユーザー行動データはプロダクトチームという感じだね

ひよこ ひよこ

それだとバラバラになっちゃわない?

ペンギン先生 ペンギン先生

そこがポイントで、データプロダクトには標準化されたインターフェースメタデータが求められるんだ。商品のパッケージに成分表示が必須なのと同じで、データの仕様やSLAを明記するよ

ひよこ ひよこ

具体的にどんな情報を付けるの?

ペンギン先生 ペンギン先生

データの所有者、更新頻度、品質指標、スキーマ定義、データリネージなどだよ。データカタログに登録して、他のチームが検索して見つけられるようにするのが理想だね

ひよこ ひよこ

データメッシュと一緒に出てくるよね?

ペンギン先生 ペンギン先生

そうだね。データメッシュは「ドメインごとにデータプロダクトを作って、分散的にデータを管理しよう」というアーキテクチャだよ。データプロダクトはその最小単位になるんだ

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「データプロダクト」って出てきたら「データを製品のように品質管理して提供する考え方」と思えればだいたいOK!
📖 おまけ:英語の意味
「Data Product」 = データ製品
💬 ソフトウェアプロダクトと同じように、データにも品質やサポートが必要だという発想から生まれた言葉だよ
← 用語集にもどる