【アパッチアイスバーグ】
Apache Iceberg(アイスバーグ) とは?
💡 データレイクに「秩序」を与える氷山のような存在
📌 このページのポイント
データレイクって、ファイルをどんどん放り込むだけじゃダメなの?
スキーマ進化って何がうれしいの?
タイムトラベルって名前がかっこいいね!
Delta LakeやHudiとの違いは?
どれもオープンテーブルフォーマットだけど、Icebergはエンジン非依存の設計が強みだよ。Sparkだけじゃなく、Trino、Flink、Prestoなど色々なエンジンから同じテーブルを読み書きできるんだ
実際にどこで使われてるの?
📖 おまけ:英語の意味
「Apache Iceberg」 = アパッチ氷山
💬 氷山のように見えている部分はわずかで、水面下に膨大なメタデータ管理の仕組みが隠れているイメージだよ