この記事の要点は？

「pandasが遅くて困ってる」「DuckDBってどこで使うの？」と迷っている人向けに、インストールからCSV/Parquet分析・Python連携・pandas代替としての活用までわかりやすく解説します。

Feb 27, 2026

最終更新: May 24, 2026

【2026年版】DuckDBの始め方 — ローカルで超高速データ分析をする完全ガイド

Q: 最近「DuckDB」ってよく聞くけど、どんなデータベースなの？

DuckDBは「ローカルで動く超高速な分析用データベース」だよ。SQLiteって知ってるかな？ あれはトランザクション処理（OLTP）が得意だけど、DuckDBは大量データの集計や分析（OLAP）に特化したバージョンみたいなイメージだね。サーバーを立てる必要がなくて、自分のPCだけで完結するのがポイントだよ。

データベース DuckDB データ分析始め方ガイド

DuckDB データ分析ワークフローのイメージ

🎚 難易度 ★★☆ 中級者向け

⏱ 学習時間の目安読むだけ10分、インストール〜最初のクエリまで15分

📚 前提知識 sql-getting-started の基礎知識

✅ このガイドで学べること

DuckDBのインストールとCLI起動
CSVやParquetファイルへの直接クエリ
SQLite・PostgreSQLとの違いと使い分け
Python連携の基本

インストール手順

# macOS
brew install duckdb

# Python経由（最も手軽）
pip install duckdb

# バージョン確認・CLI起動
duckdb --version
duckdb            # CLIを起動（.quit で終了）

DuckDBコマンド・クエリ早見表

-- CSVファイルを直接クエリ
SELECT * FROM 'data.csv' LIMIT 10;
SELECT COUNT(*), AVG(price) FROM 'sales.csv' WHERE year = 2025;

-- Parquetファイルを直接クエリ
SELECT * FROM 'data.parquet' WHERE category = 'A';

-- URLからデータを取得（httpfs拡張）
INSTALL httpfs;
LOAD httpfs;
SELECT * FROM 'https://example.com/data.csv';

-- 結果をファイルに保存
COPY (SELECT * FROM 'input.csv') TO 'output.parquet' (FORMAT PARQUET);
COPY (SELECT * FROM 'input.csv') TO 'output.json' (FORMAT JSON);

-- テーブルを作成
CREATE TABLE sales AS SELECT * FROM 'sales.csv';
DESCRIBE sales;

Python連携

import duckdb

# インメモリDB
con = duckdb.connect()

# CSVを直接クエリ
df = con.execute("SELECT * FROM 'data.csv'").df()

# pandasとの連携
import pandas as pd
df = pd.read_csv('data.csv')
result = con.execute("SELECT category, SUM(amount) FROM df GROUP BY category").df()
print(result)

よくある詰まりポイント

Q: SQLiteと何が違うの？ → SQLiteは行志向（OLTP向け）ですが、DuckDBは列志向（OLAP向け）です。大量データの集計クエリはDuckDBが圧倒的に高速です。ファイルを直接クエリできる点も大きな違いです。

Q: 複数プロセスから同時アクセスできる？ → DuckDBは単一ライターのみ許可します。分析用途（1プロセスがデータを処理）には問題ありませんが、Webサーバーのような多数の同時書き込みには向きません。

Q: S3のファイルを直接クエリできる？ → httpfs 拡張を使えばS3のCSV/Parquetを直接クエリできます。SET s3_region='ap-northeast-1' などで認証情報を設定してください。

ひよこ

最近「DuckDB」ってよく聞くけど、どんなデータベースなの？

ペンギン先生

DuckDBは「ローカルで動く超高速な分析用データベース」だよ。SQLiteって知ってるかな？あれはトランザクション処理（OLTP）が得意だけど、DuckDBは大量データの集計や分析（OLAP）に特化したバージョンみたいなイメージだね。サーバーを立てる必要がなくて、自分のPCだけで完結するのがポイントだよ。

ひよこ

サーバーなしで分析できるのはお手軽だね！どうやってインストールするの？

ペンギン先生

めちゃくちゃ簡単だよ。Pythonなら「pip install duckdb」、Macなら「brew install duckdb」、Node.jsなら「npm install duckdb」で一発だね。CLIもあるから、ターミナルで「duckdb」って打つだけでSQLを試せるよ。依存関係もほぼないから、環境構築でハマることがほとんどないんだ。

ペンギン先生

ここで実際に試してみてね。「pip install duckdb」でインストールしたらPythonで「import duckdb; con = duckdb.connect(); print(con.execute('SELECT 42 AS answer').df())」と実行してみよう。DuckDBが動いてDataFrameが返ってくれば成功だよ！

ひよこ

CSVファイルをそのまま分析できるって本当なの？

ペンギン先生

本当だよ！ DuckDBの一番すごいところの一つだね。「SELECT * FROM 'sales.csv' WHERE amount > 1000」みたいに、CSVファイルをそのままテーブルとしてSQLで扱えるんだ。Parquetファイルも同じようにクエリできるし、JSONファイルにも対応してる。わざわざデータをインポートする手間がないから、ちょっとした分析がすぐ始められるよ。

ひよこ

普通のデータベースより速いって聞いたけど、なんでそんなに速いの？

ペンギン先生

DuckDBは「列指向」というデータの持ち方をしてるんだ。普通のデータベースは行ごとにデータを保存するけど、DuckDBは列ごとにまとめて保存する。たとえば「売上の合計」を出すとき、行指向だと全行を読む必要があるけど、列指向なら売上の列だけ読めばいい。だからSUM・AVG・GROUP BYみたいな集計処理がびっくりするほど速いんだよ。数千万行のCSVでも数秒で集計できることもあるよ。

ひよこ

Pythonと一緒に使うにはどうすればいいの？ pandasとの連携が気になるな。

ペンギン先生

PythonからDuckDBを使うのは本当に快適だよ。「import duckdb」して「duckdb.sql("SELECT ...")」で結果が返ってくる。しかもpandasのDataFrameをそのままSQLのテーブルとして使えるんだ。「duckdb.sql("SELECT * FROM df WHERE col > 100")」みたいにね。逆にDuckDBの結果を「.df()」でDataFrameに変換もできる。pandasで遅い集計処理をDuckDBに置き換えるだけで10倍以上速くなることもあるよ。

ひよこ

Jupyter Notebookでも使えるの？データ分析はノートブックでやることが多いかな。

ペンギン先生

もちろん使えるよ！ JupyterやGoogle Colabでもそのまま動くんだ。「%%sql」マジックコマンドを使えば、セルにSQLを直接書いて実行することもできるよ。JupySQL拡張と組み合わせると、可視化までノートブック上で完結するね。pandasでメモリが足りなくなるような大きなデータセットも、DuckDBなら遅延評価で効率よく処理してくれるよ。

ひよこ

ローカルだけじゃなくて、クラウドのデータも扱えるの？

ペンギン先生

いい質問だね！ DuckDBはAmazon S3やGoogle Cloud Storage上のファイルを直接読み込めるよ。「SELECT * FROM 's3://bucket/data.parquet'」みたいに書くだけで、ローカルにダウンロードしなくてもクエリできるんだ。httpfsという拡張機能を使えばHTTPS上のファイルも読める。データレイクとの相性が抜群なんだよ。

ひよこ

すごく便利そうだね！でもDuckDBにも苦手なことってあるの？

ペンギン先生

もちろんあるよ。DuckDBは分析クエリ（読み取り中心）が得意だけど、Webアプリのバックエンドみたいに同時に大量の書き込みが発生するユースケースには向いてないんだ。そういう用途にはPostgreSQLやMySQLが適してるね。あとマルチユーザーの同時アクセスは基本的には苦手だよ。ただしv1.5からQuack拡張でクライアント・サーバーモードが試験的に使えるようになってきたんだ。でも「手元でデータを素早く分析する」という用途では最強クラスだよ。2026年現在、データサイエンティストやアナリストの間では「まずDuckDBで試す」が定番になりつつあるね。

【2026年版】DuckDBの始め方 — ローカルで超高速データ分析をする完全ガイド

インストール手順

DuckDBコマンド・クエリ早見表

Python連携

よくある詰まりポイント

次に学ぶなら

関連コラム