【じょうたいくうかんもでる】

状態空間モデル(SSM) とは?

💡 Transformerとは別の仕組みで、長い文章を効率よく処理するAI
📌 このページのポイント
Transformer vs 状態空間モデル(SSM) Transformer T1 T2 T3 T4 全トークン間を相互に計算 計算量:二乗で増加 O(n²) 長文に不利 vs SSM(Mamba等) 状態 h1 状態 h2 状態 h3 状態 h4 前の状態だけを引き継ぐ 計算量:線形で増加 O(n) 長文・長音声に強い 使い分けのポイント Transformer: 単語の記憶想起 一般テキスト生成に強い SSM: 超長シーケンス処理 音声・DNA解析に強い
TransformerはO(n²)の計算量、SSMはO(n)の線形計算で長文処理が効率的
ひよこ ひよこ

ペンギン先生、「SSM(状態空間モデル)」って「Mamba」と一緒に聞くんだけど、何なの?

ペンギン先生 ペンギン先生

状態空間モデル(SSM)は、時系列データを処理するAIアーキテクチャの一種だよ。MambaはSSMを使った有名な実装で、TransformerとはまったくAIの構造が違うんだ。

ひよこ ひよこ

Transformerと何が違うの?

ペンギン先生 ペンギン先生

Transformerは「全単語間の関係を一度に計算する」仕組みで、文章が長くなるとメモリと計算量が二乗で増える。SSMは「現在の状態」という圧縮した情報だけを持ち続けるので、長い文章でも線形にしか増えないんだ。

ひよこ ひよこ

じゃあSSMの方が優れてるの?

ペンギン先生 ペンギン先生

一長一短だよ。SSMは長いシーケンスをメモリ効率よく処理できるけど、「特定の単語を正確に思い出す」記憶想起はTransformerの方が得意な場合がある。だから最近はTransformerとSSMを組み合わせたハイブリッドモデルも登場しているよ。

ひよこ ひよこ

どんな場面でSSMが活躍するの?

ペンギン先生 ペンギン先生

非常に長いシーケンスが必要な場面だよ。たとえば1時間の音声をそのまま処理する、長大なゲノムDNA配列を解析する、といった用途で強みを発揮する。通常のテキストAIよりも科学・医療分野での活用が先行しているんだ。

ひよこ ひよこ

Mambaは今後LLMのメインになる可能性はあるの?

ペンギン先生 ペンギン先生

完全に置き換えるのは難しいと言われているけど、「TransformerとSSMのハイブリッド」という形で大型LLMに取り込まれていく可能性は高いよ。AI研究の最前線でTransformerの代替として真剣に研究されているんだ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「SSM(状態空間モデル)」って出てきたら「Transformerの代替候補の新しいAIアーキテクチャ」と思えばOK!
📖 おまけ:英語の意味
「State Space Model」 = 状態空間モデル
💬 システムの動的な「状態(State)」を「空間(Space)」上で表現してモデル化する手法だよ。制御工学の古典的手法をAIに応用したものなんだ
← 用語集にもどる