【すのーふれーく】

Snowflake とは?

💡 「コンピュートとストレージを分離」した次世代DWH
📌 このページのポイント
Snowflake — 3層アーキテクチャ クラウドサービス層 認証・認可 クエリ最適化 メタデータ管理 コンピュート層(仮想ウェアハウス) WH-S WH-M WH-XL ストレージ層 構造化データ 半構造化データ 自動圧縮・最適化 各層が独立してスケール可能 — コンピュートとストレージの分離
Snowflakeの3層アーキテクチャ
ひよこ ひよこ

BigQueryやRedshiftと何が違うの?

ペンギン先生 ペンギン先生

Snowflakeの最大の特徴はコンピュートとストレージの完全分離。BigQueryサーバーレスだけどGoogle Cloud限定。Redshiftはクラスタ型でリソース固定。Snowflakeはクエリごとに異なるサイズのウェアハウス(コンピュート)を割り当てられるから、ETLは大きく、レポートは小さくと柔軟に使い分けられるんだよ

ひよこ ひよこ

マルチクラウドの利点は?

ペンギン先生 ペンギン先生

ベンダーロックインを避けられるのが大きい。AWS上のSnowflakeからAzure上のSnowflakeにデータをレプリケートしたり、異なるクラウドのSnowflakeアカウント間でデータ共有したりできる。マルチクラウド戦略の企業や、買収でクラウド環境が混在する企業にとって大きなメリットだよ

ひよこ ひよこ

Data Sharingって何?

ペンギン先生 ペンギン先生

Snowflakeのキラー機能の1つ。データのコピーを作らずに、他のSnowflakeアカウントにデータへの読み取りアクセスを付与する。データプロバイダーがマーケットプレイスに気象データや金融データを公開し、コンシューマーが自分のSnowflake環境からクエリする。データのコピーが不要だからリアルタイムで最新データにアクセスできるんだよ

ひよこ ひよこ
ペンギン先生 ペンギン先生

Snowflakeはクレジット制で、ウェアハウスの稼働時間とサイズに応じて課金される。自動サスペンド(無操作で自動停止)と自動再開を設定しておくのが必須。Resource Monitorでクレジット使用量にアラートを設定、リソースモニターで月間上限を設けることもできる。使わないウェアハウスの停止忘れが最大の無駄遣いだよ

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「Snowflake」って出てきたら「マルチクラウド対応のクラウドデータウェアハウス」と思えればだいたいOK!
📖 おまけ:英語の意味
「Snowflake」 = 雪の結晶
💬 雪の結晶は1つとして同じ形がない。ユニークなアーキテクチャを持つDWHだよ
← 用語集にもどる