Gemini 3.1 Pro — コーディング・推論性能で業界トップを争夺

Googleは2026年2月19日、Gemini 3.1 Proを発表した。Claude Opus 4.6と並ぶトップレンジの推論モデルとして、コーディング・ソフトウェアエンジニアリングベンチマークで優れた成績を収めている。

主な機能と特徴

テキスト、画像、音声、ビデオ、PDF、さらにはコードリポジトリ全体を同時処理可能。100万トークンのコンテキストウィンドウで、大規模な情報分析が可能。

複雑な問題解決能力を備え、計画立案・実行・監視・適応を行うマルチステップタスクに対応。金融やスプレッドシートアプリケーション、ドキュメント分析などで最適化されている。

トークン効率が改善され、「MEDIUM」という思考レベルパラメータを導入。コスト、パフォーマンス、速度のトレードオフをユーザーは調整できる。

Custom Toolsエンドポイント: gemini-3.1-pro-preview-customtoolsでview_fileやsearch_codeなどのカスタムツールをエージェントワークフローで優先
Nano Banana画像生成: テキストからアニメーションSVGを直接生成

ベンチマーク	Gemini 3.1 Pro	Claude Opus 4.6	GPT-5.2
LiveCodeBench (Elo)	2887	-	2393
SWE-Bench Verified	80.6%	80.8%	80.0%
SciCode	59%	52%	-
Terminal-Bench 2.0	68.5%	65.4%	54.0%
SWE-Bench Pro	54.2%	-	56.8%

注目ポイント:

Gemini 3.1 Proは現在のライデルモデルだが、2026年後半には次期モデル（Gemini 4？）の登場が期待されている。コンテキストウィンドウの拡大、マルチモーダル理解、推論能力の更なる向上が予想される。

Gemini 3.1 Proは、GoogleのAI戦略における最重要的アップデートとして、Claude Opus 4.6と並ぶトップレンジモデルとしての地位を確立した。特にコーディング・ソフトウェアエンジニアリング分野での性能は目を引くものがあり、開発者にとって有力な選択肢となっている。

公式情報: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/
ベンチマーク詳細: https://almcorp.com/blog/gemini-3-1-pro-complete-guide/