【しーけんすでーた】

シーケンスデータ とは?

💡 順番が命、シャッフルしたら意味が消える
📌 このページのポイント
シーケンスデータ ― 順番に意味がある 順番通り(意味がある) 犬が 猫を 追いかけた ✔ 意味が通る 順番シャッフル(意味が変わる) 猫が 追いかけた 犬を ✘ 意味が逆に! 他の例 ── 株価の推移 / 音声波形 / DNA塩基配列 / 音楽の音符
順番を変えると意味が変わるシーケンスデータ
ひよこ ひよこ

シーケンスデータって、ただのデータの列とは違うの?

ペンギン先生 ペンギン先生

大きく違うよ。普通のデータは行を入れ替えても問題ないけど、シーケンスデータは順番が命なんだ。「犬が猫を追いかけた」と「猫が犬を追いかけた」、単語は同じでも順番が違うだけで意味が変わるよね

ひよこ ひよこ

言葉以外にもあるの?

ペンギン先生 ペンギン先生

たくさんあるよ。株価の日々の値動き、心電図の波形、音楽の音符の並び、DNAの塩基配列もシーケンスデータだね。どれも順番をバラバラにしたら意味を失ってしまうんだ

ひよこ ひよこ

普通のAIモデルじゃ扱えないの?

ペンギン先生 ペンギン先生

順番を無視するモデルだと情報が抜け落ちちゃうね。だから昔はRNNLSTMという「前の情報を覚えながら次を処理する」モデルが使われていたんだ。今はTransformerが主流で、全体の位置関係を一度に把握できるようになったよ

ひよこ ひよこ

ChatGPTもシーケンスデータを扱ってるってこと?

ペンギン先生 ペンギン先生

その通り!文章はまさにシーケンスデータだからね。Transformerは位置エンコーディングという仕組みで各トークン位置情報を埋め込んで、順序を理解しているんだ

ひよこ ひよこ

長いシーケンスだと大変そうだね

ペンギン先生 ペンギン先生

鋭いね。Transformerはシーケンスの長さの2乗に比例して計算量が増えるから、長いシーケンスは課題なんだ。だからコンテキストウィンドウの拡張や、効率的なアテンション手法の研究が活発に進んでいるよ

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「シーケンスデータ」って出てきたら「順番に意味があるデータの並び」と思えればだいたいOK!
📖 おまけ:英語の意味
「Sequence Data」 = 順序データ・系列データ
💬 sequence は「連続」「順序」という意味で、データが一列に並んでいるイメージだよ
← 用語集にもどる