【こんぴゅーたびじょん】

コンピュータビジョン とは?

💡 カメラの映像をコンピューターに「見えるように」する技術
📌 このページのポイント
コンピュータビジョンの処理フロー 🖼️ 画像入力 前処理 リサイズ ノイズ除去 正規化 特徴抽出 エッジ検出 パターン認識 CNN等 分類・検出 物体認識 位置特定 セグメンテーション 結果出力 コンピュータビジョンの活用例 顔認証 自動運転 医療画像診断 OCR / 品質検査 / AR など多くの分野で活用
コンピュータビジョンの処理フロー
ひよこ ひよこ

コンピュータビジョンって写真を見て何ができるの?

ペンギン先生 ペンギン先生

いろいろできるよ。「この画像は猫か犬か」を当てる画像分類、「画像の中のどこに何があるか」を特定する物体検出、「どのピクセルがどの物体に属するか」を区別するセグメンテーションなどが主なタスクだよ。

ひよこ ひよこ

なんで2010年代から急に精度が上がったの?

ペンギン先生 ペンギン先生

畳み込みニューラルネットワークCNN)の登場とGPUの普及のおかげだよ。2012年にAlexNetというCNNがImageNetコンペで圧倒的な精度を出して、それ以降ディープラーニング画像認識の標準になったんだ。

ひよこ ひよこ

スマホで顔を認識するのもコンピュータビジョンなの?

ペンギン先生 ペンギン先生

そうだよ!顔ロック解除・写真アプリの人物グループ分け・ARフィルターも全部コンピュータビジョンの技術だよ。防犯カメラの人物追跡や自動運転車の歩行者認識も同じ技術の延長線上にあるんだ。

ひよこ ひよこ

人間の目より正確に認識できるって本当?

ペンギン先生 ペンギン先生

特定のタスクや条件下では本当だよ。でも「敵対的サンプル」という厄介な問題があって、人間には全く見えない微小なノイズを画像に加えるだけで、AIが全く違う物体に誤認識することがある。たとえばパンダの画像にノイズを加えるとテナガザルと認識するような現象で、人間の目には同じ画像に見える。自動運転の場合、道路標識に小さなステッカーを貼るだけでAIが誤認識するリスクがあって、セキュリティ上の深刻な問題なんだ。「精度が高い」と「信頼できる」は別の話で、ロバスト性の研究は現在も活発に続いているんだよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「コンピュータビジョン」って出てきたら「コンピューターに画像や映像を理解させる技術の総称のことだな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Computer Vision」 = コンピューターの視覚
💬 人間の「視覚(Vision)」をコンピューターで再現するという意味。1960年代から研究が始まった歴史ある分野だよ
← 用語集にもどる