【おんせいあしすたんと】

音声アシスタント とは?

💡 話しかけるだけでAIがお手伝い
📌 このページのポイント
音声アシスタントの処理フロー 音声入力 ② 音声認識 STT変換 ③ 意図理解 NLU処理 ④ 応答生成 TTS変換 音声で応答 代表的な音声アシスタント Siri (Apple) Alexa (Amazon) Googleアシスタント (Google) Cortana (Microsoft)
音声アシスタントの処理フローのイメージ
ひよこ ひよこ

音声アシスタントってどうやって言葉を理解しているの?

ペンギン先生 ペンギン先生

まず「音声認識」で人の声をテキストに変換して、次に「自然言語処理」でその意味を理解するんだよ。そして適切な答えを組み立てて、音声合成で声に変えて返してくれるんだ。すごい技術の組み合わせだよね。

ひよこ ひよこ

「OK Google」とか「Hey Siri」って何のために言うの?

ペンギン先生 ペンギン先生

あれは「ウェイクワード」と言って、音声アシスタントを起動するための合図なんだ。常にすべての会話を処理していたら大変だから、この特定の言葉を聞いたときだけ本格的に聞き取りを始めるんだよ。

ひよこ ひよこ

音声アシスタントって賢くなってるの?

ペンギン先生 ペンギン先生

どんどん賢くなっているよ!昔は決まったフレーズしか理解できなかったけど、今は文脈を理解して会話の流れに沿った受け答えができるようになっているんだ。大規模言語モデルの技術が組み込まれて、さらに進化が加速しているよ。

ひよこ ひよこ

プライバシーは大丈夫なの?

ペンギン先生 ペンギン先生

いい質問だね。音声データがクラウドに送られることがあるから、プライバシーの懸念はあるんだ。最近はデバイス上で処理を完結させる技術も進んでいるよ。設定で音声履歴を削除できるサービスも多いから、気になる人はチェックしてみてね。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「音声アシスタント」って出てきたら「話しかけるだけで色々やってくれるAIの仕組み」と思えればだいたいOK!
📖 おまけ:英語の意味
「Voice Assistant」 = 音声の助手
💬 「Voice(音声)」で指示を出す「Assistant(助手)」という意味。キーボードやタッチ操作なしで使えるのが大きな特徴なんだ
← 用語集にもどる