【ドメインてきおう】

ドメイン適応 とは?

💡 「教科書で勉強したけど本番は方言だらけ」──そのギャップを埋めるAIの適応術
📌 このページのポイント
ドメイン適応の仕組み ソースドメイン (ラベル付きデータ豊富) 晴れの道路画像 ニュース文書 ターゲットドメイン (ラベルなし/少量) 雨の道路画像 SNS投稿 ドメインシフト(分布の違い) ドメイン適応 特徴量の分布を整合させる ターゲットでも高精度に動作
ドメイン適応のイメージ
ひよこ ひよこ

ドメイン適応って、転移学習とはどう違うの?

ペンギン先生 ペンギン先生

転移学習は「ある問題で学んだ知識を別の問題に活かす」という大きな概念だよ。ドメイン適応はその中の一種で、特に「同じタスクだけどデータの分布が違う」場合に対処する技術なんだ。たとえば同じ物体検出でも、昼の画像で学習したモデルを夜の画像で使いたいときに活躍するよ。

ひよこ ひよこ

データの分布が違うと、そんなに精度が落ちるの?

ペンギン先生 ペンギン先生

かなり落ちることがあるよ。たとえば天気がいい日の道路画像で学習した自動運転モデルを、雨や霧の日に使うと認識精度が大幅に下がるんだ。これを「ドメインシフト」と呼ぶんだけど、ドメイン適応はまさにこのギャップを埋めるための技術だよ。

ひよこ ひよこ

具体的にはどうやって適応させるの?

ペンギン先生 ペンギン先生

代表的な方法はいくつかあるよ。一つはソースとターゲットの特徴量分布を近づける「分布整合」で、Maximum Mean Discrepancy(MMD)やドメイン敵対的学習(DANN)が有名だね。もう一つは、画像のスタイルだけを変換する「スタイル変換」を使ってターゲットドメイン風のデータを生成するアプローチもあるよ。

ひよこ ひよこ

ターゲットドメインにラベルがなくてもできるの?

ペンギン先生 ペンギン先生

できるよ。ターゲットにラベルが全くない場合を「教師なしドメイン適応」と呼ぶんだ。少しだけラベルがある場合は「半教師ありドメイン適応」、全部ある場合は「教師ありドメイン適応」と区別されるよ。実務ではラベル付けが高コストだから、教師なしの手法が特に研究されているんだ。

ひよこ ひよこ

最近はどんな場面で使われているの?

ペンギン先生 ペンギン先生

シミュレーション環境で学習したロボットを現実世界で動かす「Sim-to-Real」はホットな応用分野だね。他にも医療画像で、ある病院のCTスキャンで学習したモデルを別の機種のCTに適応させるケースも多いよ。LLMの世界でも、一般的なテキストで学習したモデルを法律文書や医療文書に適応させるときに使われているんだ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
ドメイン適応」って出てきたら「学習データと本番データの分布のズレを埋めて、違う環境でもモデルが使えるようにする技術」と思えればだいたいOK!
📖 おまけ:英語の意味
「Domain Adaptation」 = 領域適応
💬 「ドメイン」は「領域」や「分野」を意味して、異なるドメイン間でモデルを適応させることからこの名前がついたよ
← 用語集にもどる