【いーてぃーえる】

ETL(イーティーエル) とは?

💡 バラバラのデータを「取って・整えて・届ける」データの配達人
📌 このページのポイント
ETL(Extract → Transform → Load) Extract(抽出) DB CSV / Excel API Transform(変換) クレンジング フォーマット変換 集計・統合 Load(格納) データ ウェアハウス バラバラなデータソースから抽出し、分析しやすい形に変換して格納する
ETLのイメージ
ひよこ ひよこ

ETLって何?アルファベット3文字だけど…

ペンギン先生 ペンギン先生

ETLは「Extract(抽出)・Transform(変換)・Load(読み込み)」の頭文字だよ。簡単に言うと、あるシステムからデータを取り出して、使いやすい形に整えて、別のシステムに格納する一連の処理のことなんだ。たとえば複数の店舗の売上データを集めて、フォーマットを統一して、分析用のデータウェアハウスに入れる、みたいな流れだね。

ひよこ ひよこ

なんでそのまま移動させるだけじゃダメなの?

ペンギン先生 ペンギン先生

元のデータはシステムごとにフォーマットがバラバラだからだよ。日付が「2026/03/23」だったり「03-23-2026」だったり、通貨がドルだったり円だったり。Transform(変換)のステップで形式を統一したり、不要なデータを除いたり、欠損値を補ったりするんだ。この整形作業がないと、分析するときに正確な結果が出ないんだよ。

ひよこ ひよこ

ELTっていうのも聞いたことあるけど、ETLと何が違うの?

ペンギン先生 ペンギン先生

ELTはExtract→Load→Transformの順番で、先にデータを格納してから変換するアプローチだよ。クラウドデータウェアハウスBigQuerySnowflakeなど)は処理能力が高いから、まず生データをどんどん入れて、あとからSQL等で変換する方が効率的な場合があるんだ。ETLは「整えてから入れる」、ELTは「入れてから整える」と覚えるといいよ。

ひよこ ひよこ

ETLツールにはどんなものがあるの?

ペンギン先生 ペンギン先生

オープンソースだとApache AirflowApache NiFi、dbtなどが有名だよ。クラウドサービスだとAWS Glue、Azure Data Factory、Google Cloud Dataflowなんかがあるんだ。最近はノーコード・ローコードで設定できるツールも増えていて、プログラミングなしでETLパイプラインを構築できるようになってきたんだよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「ETL」って出てきたら「データを取り出して、整えて、別の場所に入れる処理」と思えればだいたいOK!
📖 おまけ:英語の意味
「Extract, Transform, Load」 = 抽出・変換・読み込み
💬 データウェアハウスの普及とともに1990年代に広まった概念だよ。最近は先にデータを格納してから変換するELT(Extract, Load, Transform)というアプローチも増えてきたんだ
← 用語集にもどる