【あのてーしょん】

アノテーション とは?

💡 AIの教科書に「赤ペン」で正解を書き込む作業
📌 このページのポイント
アノテーション — データに正解ラベルを付与 画像のアノテーション 🐱 画像 ラベル:「猫」 品種: 三毛猫 信頼度: 98% テキストのアノテーション 「この映画は 最高だった!」 テキスト 感情: ポジティブ アノテーションの流れ 生データ収集 画像/テキスト/音声 ラベル付与 人手 or 半自動 品質チェック 正確性の確認 AI学習に利用 教師あり学習
アノテーションのイメージ
ひよこ ひよこ

アノテーションって具体的に何をするの?

ペンギン先生 ペンギン先生

たとえば犬と猫を見分けるAIを作りたいとき、何千枚もの写真1枚1枚に「これは犬」「これは猫」というラベルを貼っていくんだ。自動運転なら、道路の写真に「ここが車」「ここが歩行者」「ここが信号」と範囲を四角で囲んでいく。この地道な作業がアノテーションだよ。

ひよこ ひよこ

全部手作業なの?大変じゃない?

ペンギン先生 ペンギン先生

昔は全部手作業だったけど、今はAIで下書きして人間が修正する「半自動アノテーション」が主流になりつつあるよ。それでも最終的には人間のチェックが欠かせない。アノテーションの品質がAIの精度を直接左右するから「ゴミを入れればゴミが出る」とも言われるんだ。

ひよこ ひよこ

アノテーションの仕事ってあるの?

ペンギン先生 ペンギン先生

あるよ!クラウドソーシングでアノテーション業務を募集している企業はたくさんある。専門のアノテーション会社も存在するし、医療画像のような専門分野では、その分野の専門家が行うこともある。AIの裏側を支える重要な仕事なんだ。

ひよこ ひよこ

アノテーションの品質ってどうやって管理するの?

ペンギン先生 ペンギン先生

代表的な方法は「複数人アノテーション」で、同じデータを複数の人に独立してラベル付けさせて一致度を測るんだ。「コーエンのカッパ係数」という指標で一致度を数値化できるよ。一致度が低いデータは「そもそも正解が曖昧」なケースが多い。実は大規模言語モデルの登場で、LLMにアノテーションさせる研究も進んでいて、人間と遜色ない品質が出るタスクもあるんだ。ただし最終的な品質保証にはやはり人間のレビューが欠かせないよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「アノテーション」って出てきたら「AIに教えるためにデータに正解を書き込む作業のことだな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Annotation」 = 注釈、注記
💬 ラテン語の「annotare(メモを書く)」が語源。データにメモ(正解情報)を書き加えるという意味だよ
← 用語集にもどる