B木とは何ですか？

ディスクアクセスを最小化するために設計された平衡木構造。データベースのインデックスやファイルシステムの基盤データ構造。

B木のポイントは？

1ノードに複数のキーを持つ多分木で、木の高さが低い。ディスクI/O回数を最小化する設計（1ノード=1ディスクブロック）。B+木（リーフノードだけにデータを持つ変種）がRDBMSの標準。MySQL（InnoDB）、PostgreSQLのインデックスはB+木

【びーつりー】

B木とは？

公開: 2026年3月24日

💡 データベースの高速検索を支える「幅広い」木

📌 このページのポイント

1ノードに複数のキーを持つ多分木で、木の高さが低い
ディスクI/O回数を最小化する設計（1ノード=1ディスクブロック）
B+木（リーフノードだけにデータを持つ変種）がRDBMSの標準
MySQL（InnoDB）、PostgreSQLのインデックスはB+木

B木の階層構造（各ノードに複数のキーを格納）

ひよこ

二分木と何が違うの？

ペンギン先生

二分木は1ノードに1キー・2つの子ノード。B木は1ノードに数百〜数千のキーと子ノードを持てる。木の高さがB木だと3〜4段で数百万レコードをカバーできる。ディスクから読み込む回数=木の高さだから、B木は3〜4回のディスクI/Oで目的のデータを見つけられるんだよ

ひよこ

なんでディスクI/Oが重要なの？

ペンギン先生

メモリアクセスは数十ナノ秒、ディスクアクセス（SSDでも）は数百マイクロ秒。約1万倍の差がある。B木は1回のディスクI/Oで多くのキーをまとめて読み込むから、ディスクアクセス回数を最小化できる。1ノードのサイズをディスクブロックサイズ（通常4KB〜16KB）に合わせるのが効率的なんだよ

ひよこ

B+木とB木の違いは？

ペンギン先生

B木は全ノードにデータを持つ。B+木はリーフノード（最下段）だけにデータを持ち、内部ノードはキーのみ。B+木のメリットは①内部ノードにキーを詰め込めるから木がさらに低くなる、②リーフノードがリンクリストで繋がっているから範囲検索（WHERE age BETWEEN 20 AND 30）が高速。RDBMSのインデックスはほぼB+木だよ

ひよこ

インデックスの仕組みがわかった！

ペンギン先生

CREATE INDEX idx_age ON users(age);と書くと、age列の値をキーとしたB+木が作られる。WHERE age = 25のクエリは、B+木を3〜4段たどるだけで該当行のポインタを取得できる。インデックスなしだとテーブル全行をスキャン（Full Table Scan）する必要がある。100万行のテーブルなら、3回vs100万回の比較の差だよ

まとめ：ざっくりこれだけ覚えればOK！

「B木」って出てきたら「データベースのインデックスに使われる高速検索用のデータ構造」と思えればだいたいOK！

📖 おまけ：英語の意味

「B-Tree」＝ B木

💬 BはBalanced（平衡）、Broad（幅広い）、Bayerの頭文字など諸説ある。発明者のBayerは「Bの由来は言わない」と語っているよ

← 用語集にもどる

B木 とは？

B木とは？