【きかいほんやく】

機械翻訳 とは?

💡 言葉の壁を越えるAI翻訳技術
📌 このページのポイント
機械翻訳 ― 翻訳プロセスのフロー 入力(原文) "Hello World" エンコーダ 意味を理解 中間表現 ベクトル デコーダ 文を生成 出力 日本語 "Hello World" → "こんにちは世界" 機械翻訳の進化 ルールベース 文法規則で翻訳 精度に限界あり 統計的機械翻訳 大量の対訳データ から確率で翻訳 ニューラル翻訳 深層学習で翻訳 文脈を理解 LLM翻訳 大規模言語 モデルで高精度
機械翻訳のイメージ
ひよこ ひよこ

機械翻訳っていつ頃からあるの?

ペンギン先生 ペンギン先生

実は1950年代から研究されていた歴史の長い分野なんだ。最初はルールベースといって、文法規則を人手で書いて翻訳する方式だった。その後、大量の対訳データから統計的に翻訳する方式になり、2016年頃にニューラル機械翻訳が登場して品質が劇的に上がったんだよ。

ひよこ ひよこ

ニューラル機械翻訳って何が違うの?

ペンギン先生 ペンギン先生

それまでの方式は文を単語やフレーズ単位で翻訳して組み立てていたんだけど、ニューラル機械翻訳は文全体を一度に理解して翻訳するんだ。だから文脈に応じた自然な訳文が出せるようになった。TransformerというモデルがGoogle翻訳に導入されたとき、翻訳品質が一気に人間に近づいたと話題になったよ。

ひよこ ひよこ

もう人間の翻訳者はいらなくなるの?

ペンギン先生 ペンギン先生

まだまだ人間は必要だよ。日常的な文章はかなり正確になったけど、文学作品の微妙なニュアンス、法律文書の厳密な解釈、ジョークの翻訳なんかはAIには難しい。だから「機械翻訳+人間が修正」というポストエディットの働き方が広まっているよ。

ひよこ ひよこ

機械翻訳の限界って何だろう?

ペンギン先生 ペンギン先生

「翻訳の忠実さと自然さのトレードオフ」が本質的に難しいんだ。原文に忠実に訳すと不自然な文になるし、自然な訳にすると原文のニュアンスが失われることがある。特に「翻訳不可能な表現」というのが本当にあって、日本語の「お疲れ様」を英語にどう訳すかは文脈によって全然変わるし、完璧な訳は存在しない。言語は文化と密接に結びついているから、単なる単語の置き換えでは済まない。評価指標のBLEUスコアが高くても人間が読むとイマイチということもよくあって、「良い翻訳とは何か」という定義自体が研究者の間でも合意が取れていないんだよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「機械翻訳」って出てきたら「AIが自動で言語を翻訳する技術のことだな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Machine Translation」 = 機械による翻訳
💬 Translationは「翻訳」。機械(コンピューター)が翻訳を行うことだよ
← 用語集にもどる