ハッシュインデックスとは何ですか？

ハッシュ関数を使ってキーからデータの格納位置を直接計算するインデックス。完全一致検索がO(1)で高速だが、範囲検索には使えない。

ハッシュインデックスのポイントは？

ハッシュ関数でキーからバケット番号を計算し、データ位置を直接特定する。完全一致検索（=）がO(1)の定数時間で超高速。範囲検索（BETWEEN、）や順序付きスキャンには対応できない。ハッシュ衝突の処理方式によって性能特性が変わる

【はっしゅいんでっくす】

公開: 2026年3月25日

💡 住所録いらずの一発検索、でも「あ行の人全員」は苦手です

📌 このページのポイント

ハッシュインデックスのイメージ

ひよこ

ハッシュインデックスって、B-Treeインデックスと何が違うの？

ペンギン先生

B-Treeが「辞書みたいに順番に並べて探す」のに対して、ハッシュインデックスは「計算で一発で場所を特定する」方式だよ。電話帳で名前を順番に探すのと、部屋番号が分かっていて直接ドアをノックするのの違いだね

ひよこ

一発で見つかるなら最強じゃない？

ペンギン先生

完全一致検索だけなら確かに最速クラスだよ。でも「価格が1000円以上3000円以下の商品」みたいな範囲検索ができないのが致命的な弱点なんだ。ハッシュ値には元の値の大小関係が残らないから、順番に並べて探すことができないんだよ

ひよこ

じゃあどんなときに使うの？

ペンギン先生

セッションIDやトークンでユーザーを検索するとか、一意のキーで完全一致検索する場面だね。PostgreSQLにもハッシュインデックスがあるし、Memcachedのようなキーバリューストアは内部的にハッシュテーブルそのものだよ

ひよこ

ハッシュ衝突って聞いたことあるけど、問題にならないの？

ペンギン先生

異なるキーが同じハッシュ値になることはあるけど、チェイニング（連結リスト）やオープンアドレッシングで対処できるよ。衝突が増えすぎるとO(1)ではなくなるから、適切なハッシュ関数の選択とバケットサイズの管理が大事なんだ

ひよこ

最近のデータベースだとあまり使われないの？

ペンギン先生

RDBMSではB-Treeが万能すぎてハッシュインデックスの出番は限定的だね。でもNoSQLやインメモリDBの世界ではハッシュベースの設計が主流だよ。DynamoDBのパーティションキーもハッシュで分散先を決めているし、知っておくとDB設計の引き出しが広がるよ

まとめ：ざっくりこれだけ覚えればOK！

ハッシュインデックスって出てきたら「ハッシュ関数で一発検索、ただし範囲検索は無理」と思えればだいたいOK！

📖 おまけ：英語の意味

「Hash Index」＝ハッシュ索引

💬 Hash（細かく刻む）から来ていて、キーを関数で変換して格納場所を決めるイメージだよ