【いーてぃーえる】
ETL(イーティーエル) とは?
💡 バラバラのデータを「取って・整えて・届ける」データの配達人
📌 このページのポイント
ETLって何?アルファベット3文字だけど…
なんでそのまま移動させるだけじゃダメなの?
元のデータはシステムごとにフォーマットがバラバラだからだよ。日付が「2026/03/23」だったり「03-23-2026」だったり、通貨がドルだったり円だったり。Transform(変換)のステップで形式を統一したり、不要なデータを除いたり、欠損値を補ったりするんだ。この整形作業がないと、分析するときに正確な結果が出ないんだよ。
ELTっていうのも聞いたことあるけど、ETLと何が違うの?
ETLツールにはどんなものがあるの?
オープンソースだとApache Airflow、Apache NiFi、dbtなどが有名だよ。クラウドサービスだとAWS Glue、Azure Data Factory、Google Cloud Dataflowなんかがあるんだ。最近はノーコード・ローコードで設定できるツールも増えていて、プログラミングなしでETLパイプラインを構築できるようになってきたんだよ。
まとめ:ざっくりこれだけ覚えればOK!
「ETL」って出てきたら「データを取り出して、整えて、別の場所に入れる処理」と思えればだいたいOK!
📖 おまけ:英語の意味
「Extract, Transform, Load」 = 抽出・変換・読み込み
💬 データウェアハウスの普及とともに1990年代に広まった概念だよ。最近は先にデータを格納してから変換するELT(Extract, Load, Transform)というアプローチも増えてきたんだ