グーグルが「Gemini 3」を発表しました。前世代で培ったマルチモーダルと“考える力”、そしてエージェント性を束ね、初日から検索のAIモード、Geminiアプリ、AI StudioとVertex AIで横展開する“同時多面デビュー”。まずは「Gemini 3 Pro」がプレビュー入りし、強化推論モードの「Deep Think」は安全評価ののちにGoogle AI Ultra向けへ段階展開するという慎重な立ち上げです。
性能は数字で押してきました。Gemini 3 ProはLMArenaでElo 1501を記録し、MMMU-Pro 81%、Video-MMMU 87.6%、SimpleQA Verified 72.1%と発表。数学や科学領域の信頼度を底上げした、と位置づけます。Deep ThinkではHumanity’s Last Exam 41.0%、GPQA Diamond 93.8%、ARC-AGI-2で45.1%(コード実行あり、ARC Prize Verified)と、難関系での一段高いスコアを提示しました。
“使いどころ”は三本柱で語られます。学ぶでは、テキスト・画像・動画・音声・コードをまたいだ統合理解に100万トークンの長文脈を組み合わせ、論文や長尺講義の要点化から可視化コード生成まで一気通貫。作るでは、WebDev ArenaでElo 1487、Terminal-Bench 2.0で54.2%、SWE-bench Verifiedで76.2%を示し、ゼロショットからの“Vibe Coding”でリッチなUIや3D表現を素早く形に。計画するでは、Vending-Bench 2で首位となり、長期の見通しと道具の使い方が乱れにくい“段取り力”をアピールしています。
開発体験も大きく更新されました。新発表の「Google Antigravity」は、エージェントをIDEの“主役”へ引き上げ、エディタ/ターミナル/ブラウザへの直接アクセスで、仕様策定から実装・検証までを半自動で回す設計です。併せて、ブラウザ制御のComputer Use(Gemini 2.5系)や画像編集モデル「Nano Banana」と密結合し、端から端までのエージェント・ワークフローを提示。API側でも“thinking level”“media resolution”“thought signatures”といったパラメータを追加し、マルチターンで推論状態を安定保持する工夫が入っています。
提供・料金の現実感も押さえられています。開発者向けのGemini 3 Proは、20万トークン以下のプロンプトで入力$2/百万トークン、出力$12/百万トークンのプレビュー価格を提示。AI Studioではレート制限付きで無料試用の導線も確保され、企業向けにはVertex AIとGemini Enterpriseでの配備を推奨する構図です。さらに“URLコンテキスト”“検索グラウンディング”“クライアント/サーバーのBashツール”など、実務のエージェント開発を押し上げる機能群が同時投入されました。
安全面では、Frontier Safety Frameworkにもとづく内製評価に加えて、英国AISIなどの外部機関やApollo、Vaultis、Dreadnodeといった専門家の独立評価を受けたと説明。シンパシー(迎合)的な出力の抑制、プロンプトインジェクション耐性、サイバー濫用への防御を強化した“最もセキュアなGemini”を掲げています。
総じて、Gemini 3は“長い文脈×道具の一貫使用×現実的なAPI更新”で、生成AIを“相棒”から“実行役”へ前進させる動きです。SIやプロダクトの現場では、Deep Thinkで精度を取りにいく場面と、通常プロでスループットを出す場面を切り分け、AntigravityやCLI、Vertex AIの管理枠で権限と監査を設計。費用は入出力のバランスと長文脈の活用度合いで効いてくるため、提示価格と自社のタスク粒度を照らし合わせて“1件あたりの原価”を先に見える化しておくのが、明日からの実務の第一歩になりそうです。