【クロマ】

Chroma とは?

💡 AIの記憶倉庫。「似てるやつ持ってきて!」に即答してくれるベクトルDBの新星
📌 このページのポイント
Chroma ベクトルデータベースの仕組み データ入力 テキスト 画像 メタデータ Chroma DB Embeddingモデル ↓ ベクトル変換 ベクトルストア [0.12, -0.45, 0.78, ...] 類似度検索 クエリ 「AIの学習方法」 類似度: 0.95 類似度: 0.87 LangChain / LlamaIndex / RAGパイプラインと連携
Chromaのデータ保存・検索フローのイメージ
ひよこ ひよこ

Chromaってデータベースなの?普通のデータベースと何が違うの?

ペンギン先生 ペンギン先生

普通のデータベースは「名前が田中さん」みたいに完全一致で検索するけど、Chromaは「この文章に意味が近い文章」を探せるんだ。ベクトルという数値の配列で類似度を計算するんだよ

ひよこ ひよこ

どういう場面で使うの?

ペンギン先生 ペンギン先生

一番多いのはRAGだね。たとえば社内ドキュメントをChromaに入れておけば、ChatGPTに「うちの会社の規程ではどうなってる?」と聞いたとき、関連する文書を自動で探して回答に使えるんだよ

ひよこ ひよこ

おもしろい!PineconeとかWeaviateとか他にもベクトルDBあるけど、Chromaの強みは?

ペンギン先生 ペンギン先生

とにかく手軽さだね。pip installして数行書けばローカルで動く。プロトタイピングが爆速なんだ。あとオープンソースだからコストも抑えられるよ

ひよこ ひよこ

本番環境でも大丈夫なの?

ペンギン先生 ペンギン先生

Chroma Cloudというマネージドサービスも出てきているし、セルフホストでもDockerで立てられる。ただ、数億件規模のデータだとPineconeMilvusの方が実績があるから、規模に応じて選ぶのが大事だね

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「Chroma」って出てきたら「AIアプリ用のベクトル検索データベース」と思えればだいたいOK!
📖 おまけ:英語の意味
「Chroma」 = 色彩・色度
💬 ギリシャ語の「chroma(色)」が由来。多次元ベクトル空間の豊かさを色の多様性にたとえたネーミングだよ
← 用語集にもどる