最先端の知能と自律性を備えた「ジェミニ3.5」が公開されました。第一弾の「3.5 フラッシュ」は長期タスクに強く、検索やアプリでも標準化が進みます。速度と精度の両立は本当に可能なのか。提示された指標と提供形態から実像を掘り下げます。
ジェミニ3.5 フラッシュの実力と提供形態
Google Japanは、新モデル「ジェミニ3.5」を発表し、「3.5 フラッシュ」を本日提供開始しました。フラッシュは高速性を維持しつつ、エージェント開発とコーディングでフラッグシップ級の知能を示します。Terminal Bench 2.1で76.2パーセント、GDPval AAで1,656 Elo、MCP Atlasで83.6パーセント、CharXiv Reasoningで84.2パーセントと示されています。出力トークンは毎秒で他の最先端モデル比4倍の速さとされ、Artificial Analysisのインデックスでリーダー部門に位置づけられました。一般はジェミニアプリや検索のAIモード、開発者はGoogle AntigravityとGoogle AI StudioやAndroid StudioのGemini API、企業はGemini Enterprise Agent PlatformとGemini Enterpriseで利用できます。上位の「ジェミニ3.5 プロ」は社内活用が始まり、来月の提供予定と案内されています。
フラッシュは複数ステップのワークフローを短時間で処理し、多くのケースでコストを半分以下に抑えられると説明されています。Antigravityのハーネスと組み合わせ、サブエージェントを協調実行するエンジンとして機能します。人の監督のもとで複雑なコーディングや業務フローを高い信頼性で進めます。マルチモーダル基盤の強化により、インタラクティブなWeb UIやグラフィックス生成にも対応します。業界パートナーとの連携では、銀行やフィンテックで数週間の工程を自動化し、データサイエンスでも難度の高い環境からインサイトを抽出した事例が示されています。Shopifyはサブエージェントの並列実行で、グローバルな加盟店成長予測の精度を高めています。消費者向けには、日本を含む各国でアプリと検索の標準モデルがフラッシュに更新されました。新しい「ジェミニ スパーク」もフラッシュを全面採用し、Trusted Testersへの展開を開始しました。来週には米国のGoogle AI Ultraユーザーへベータ提供予定です。安全面はFrontier Safety Frameworkに準拠し、サイバーセキュリティとCBRNの防御を強化しました。安全な質問への誤拒否を減らし、Interpretability toolsなどの訓練と緩和策を導入したとしています。
見解 速度、費用、安全性の三点でエージェント実装の前提が整いました。導入は長期タスクの洗い出しと監督設計から始めるのが現実的です。
詳しくは「Google Japan」の公式ページまで。 レポート/DXマガジン編集部





















