【ぶったいけんしゅつ】

物体検出 とは?

💡 画像の中の「何が」「どこに」を見つけ出すAIの目
📌 このページのポイント
物体検出(Object Detection)のフロー 入力画像 写真・動画 AIモデル YOLO / SSD / Faster R-CNN 特徴を抽出・分析 検出結果 人 98% 車 95% 犬 92% 位置 + 種類 + 確信度 ① 物体の位置特定 バウンディングボックス ② 物体の分類 「人」「車」「犬」など ③ 確信度スコア どれくらい確かか 画像から「何が」「どこに」あるかを自動で検出する技術
物体検出のフローイメージ
ひよこ ひよこ

画像認識と物体検出ってどう違うの?

ペンギン先生 ペンギン先生

画像認識は「この写真には猫が写っている」と判定するだけだけど、物体検出は「この写真のここに猫がいて、あそこに犬がいる」と、位置まで特定するんだ。四角い枠で囲んで「ここに猫(確信度95%)」みたいに表示するよ。

ひよこ ひよこ

どんな場面で使われるの?

ペンギン先生 ペンギン先生

自動運転が一番わかりやすいかな。カメラで前方を撮影して、歩行者・車・信号・標識をリアルタイムで検出してるんだ。あとは監視カメラの不審者検出、小売店の棚の在庫管理なんかにも使われているよ。

ひよこ ひよこ

リアルタイムで検出できるの?すごく処理が重そうだけど。

ペンギン先生 ペンギン先生

YOLOというモデルが画期的だったんだ。名前は「You Only Look Once(一度見るだけ)」の略で、画像を一回処理するだけで全部の物体を同時に検出できる。それまでは画像を何回もスキャンする必要があったから、速度が劇的に上がったんだよ。

ひよこ ひよこ

おもしろい!物体検出って完璧なの?

ペンギン先生 ペンギン先生

まだまだ難しい場面があるよ。例えば物体同士が重なり合っている「オクルージョン」という状況だと精度が落ちるし、小さい物体の検出も苦手なんだ。特に自動運転では遠くの小さな歩行者を確実に見つける必要があるから、見落としが命に関わる。精度と速度のトレードオフをどう最適化するかは、この分野の研究者がずっと取り組んでいる難題だよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「物体検出」って出てきたら「画像の中の物を見つけて場所まで特定する技術のことだな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Object Detection」 = 物体の検出
💬 Detectionは「見つけ出すこと」。画像認識が「何が写っているか」なら、物体検出は「何がどこにあるか」まで答える技術だよ
← 用語集にもどる