【とりぷるすとあ】

トリプルストア とは?

💡 「誰が・どうした・何を」の3点セットで世界の知識を記述するDB
📌 このページのポイント
トリプル(主語・述語・目的語)の構造 東京 の首都である 日本 主語(S) 述語(P) 目的語(O) 東京 人口 1400万 日本 位置する アジア トリプルを連鎖させるとナレッジグラフに: 東京 日本 アジア 首都 位置
主語・述語・目的語の3つ組を連鎖させてナレッジグラフを構築する
ひよこ ひよこ

トリプルストアって「3つ」の何を保存するの?

ペンギン先生 ペンギン先生

「主語・述語・目的語」の3つ組だよ。たとえば「東京 - の首都である - 日本」みたいに、事実を1つのトリプルで表現するんだ。この形式をRDFって呼ぶよ

ひよこ ひよこ

テーブルJSONじゃダメなの?

ペンギン先生 ペンギン先生

トリプルの強みは「つながり」を自然に表現できることなんだ。「東京 - 位置する - 関東」「関東 - 含まれる - 日本」みたいにトリプルを連鎖させると、巨大な知識ネットワークが作れる。Wikidataは何十億ものトリプルでできてるよ

ひよこ ひよこ

どうやってデータを検索するの?

ペンギン先生 ペンギン先生

SPARQLっていう標準クエリ言語を使うよ。SQLに似てるけど、グラフパターンで検索するのが特徴だね。「日本の首都で、人口が100万以上の都市は?」みたいな複雑な質問もパターンマッチングで書けるんだ

ひよこ ひよこ

プロパティグラフと似てる気がするけど…

ペンギン先生 ペンギン先生

どちらもグラフ形式だけど、トリプルストアはW3Cの国際標準(RDF/SPARQL)に準拠していて、異なるシステム間でデータを共有しやすいのが強みだよ。一方プロパティグラフはノードやエッジに自由にプロパティを持たせられて開発しやすい。学術やオープンデータはトリプルストア、アプリ開発はプロパティグラフ、という棲み分けが多いね

ひよこ ひよこ

最近のAIとも関係あるの?

ペンギン先生 ペンギン先生

大ありだよ!LLM(大規模言語モデル)はハルシネーション(嘘をつく問題)があるけど、ナレッジグラフと組み合わせれば正確な事実に基づいた回答ができる。RAGの知識ソースとしてトリプルストアを使う研究も進んでいて、AI時代にむしろ注目度が上がっているんだ

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
トリプルストアって出てきたら「主語・述語・目的語の3つ組でデータを保存するDB」と思えればだいたいOK!
📖 おまけ:英語の意味
「Triple Store」 = 3つ組格納庫
💬 Triple(3つ組)をStore(格納)するデータベースという意味だよ。RDFのデータ単位が3要素のトリプルだから、この名前になったんだ
← 用語集にもどる