【ジェミニ】

Gemini(AIモデル) とは?

💡 文字も画像も動画もまるごと理解する、Googleの万能AI
📌 このページのポイント
Gemini — マルチモーダルAI 入力モダリティ テキスト 画像 音声 動画 Gemini 統合マルチモーダル処理 100万+ トークン Googleサービス Google 検索・要約 Gmail / Docs Android / Pixel モデルサイズ Ultra — 最高性能 Pro — バランス型 Nano — 軽量端末向け
Geminiのマルチモーダル処理とサービス展開
ひよこ ひよこ

GeminiってGoogleのAIだよね?前はBardって名前じゃなかった?

ペンギン先生 ペンギン先生

そうそう。最初はBardという名前のチャットサービスだったけど、モデル名のGeminiに統一されたんだよ。モデルとサービスの名前を揃えて分かりやすくした、というわけだね

ひよこ ひよこ

他のAIと比べて何が得意なの?

ペンギン先生 ペンギン先生

最大の特徴は「マルチモーダル」、つまりテキストだけじゃなく画像・音声・動画もまとめて理解できることだよ。しかも後付けじゃなくて、最初からマルチモーダルで訓練されているのがポイントなんだ

ひよこ ひよこ

Ultra、Pro、Nanoって何が違うの?

ペンギン先生 ペンギン先生

Ultra は最高性能で複雑な推論に強い。Pro はバランス型で日常的なタスクに向いている。Nano はスマートフォンに載せられる軽量版だよ。同じ料理を「レストラン・家庭料理・お弁当」で楽しめるような使い分けだね

ひよこ ひよこ

Googleのサービスとつながるのは便利そう!

ペンギン先生 ペンギン先生

そこがGeminiの最大の強みかもしれないね。Gmail、Googleドキュメントスプレッドシート、マップなど、何十億人が使うサービスにAIが組み込まれるわけだから。検索結果の要約もGeminiが担当しているよ

ひよこ ひよこ
ペンギン先生 ペンギン先生

Gemini 1.5 Proで実現したんだ。100万トークンは本で言うと約10冊分。1時間の動画をまるごと読み込んで「この場面で何が起きた?」と質問できるレベルだよ。長文処理では頭一つ抜けているね

ひよこ ひよこ

おもしろい!他社のモデルとどう棲み分けていくの?

ペンギン先生 ペンギン先生

GoogleTPUという自社チップとクラウドインフラを持っているのが大きいよ。モデル開発から配信インフラまで一気通貫で最適化できる。AI競争は「モデルの賢さ」だけでなく「どれだけ多くのユーザーに届けられるか」の勝負でもあるんだ

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
Gemini」って出てきたら「Googleマルチモーダル対応AIモデル」と思えればだいたいOK!
📖 おまけ:英語の意味
「Gemini」 = 双子座
💬 星座の「ふたご座」を意味する英語だよ。Google BrainとDeepMindという2つの研究チームが合併して生まれたモデルだから「双子」なんだね
← 用語集にもどる