【しーけんすでーた】
シーケンスデータ とは?
💡 順番が命、シャッフルしたら意味が消える
📌 このページのポイント
シーケンスデータって、ただのデータの列とは違うの?
大きく違うよ。普通のデータは行を入れ替えても問題ないけど、シーケンスデータは順番が命なんだ。「犬が猫を追いかけた」と「猫が犬を追いかけた」、単語は同じでも順番が違うだけで意味が変わるよね
言葉以外にもあるの?
たくさんあるよ。株価の日々の値動き、心電図の波形、音楽の音符の並び、DNAの塩基配列もシーケンスデータだね。どれも順番をバラバラにしたら意味を失ってしまうんだ
普通のAIモデルじゃ扱えないの?
ChatGPTもシーケンスデータを扱ってるってこと?
その通り!文章はまさにシーケンスデータだからね。Transformerは位置エンコーディングという仕組みで各トークンの位置情報を埋め込んで、順序を理解しているんだ
長いシーケンスだと大変そうだね
鋭いね。Transformerはシーケンスの長さの2乗に比例して計算量が増えるから、長いシーケンスは課題なんだ。だからコンテキストウィンドウの拡張や、効率的なアテンション手法の研究が活発に進んでいるよ
まとめ:ざっくりこれだけ覚えればOK!
「シーケンスデータ」って出てきたら「順番に意味があるデータの並び」と思えればだいたいOK!
📖 おまけ:英語の意味
「Sequence Data」 = 順序データ・系列データ
💬 sequence は「連続」「順序」という意味で、データが一列に並んでいるイメージだよ