Gemini 3.1 Pro — コーディング・推論性能で業界トップを争夺
GoogleのGemini 3.1 Proは、2026年2月に発表された最新推論モデル。SWE-Bench Verified 80.6%、LiveCodeBenchで2887スコアを達成し、Claude Opus 4.6と並ぶトップレンジモデルとして注目される。
Gemini 3.1 Pro — コーディング・推論性能で業界トップを争夺
Googleは2026年2月19日、Gemini 3.1 Proを発表した。Claude Opus 4.6と並ぶトップレンジの推論モデルとして、コーディング・ソフトウェアエンジニアリングベンチマークで優れた成績を収めている。
主な機能と特徴
マルチモーダル × 100万トークンコンテキスト
テキスト、画像、音声、ビデオ、PDF、さらにはコードリポジトリ全体を同時処理可能。100万トークンのコンテキストウィンドウで、大規模な情報分析が可能。
進化した推論とエージェント機能
複雑な問題解決能力を備え、計画立案・実行・監視・適応を行うマルチステップタスクに対応。金融やスプレッドシートアプリケーション、ドキュメント分析などで最適化されている。
効率化と思考の選択肢
トークン効率が改善され、「MEDIUM」という思考レベルパラメータを導入。コスト、パフォーマンス、速度のトレードオフをユーザーは調整できる。
Googleエコシステム統合
- Google Workspace: Gmail、Docs、Sheets、Slides、Meetに統合
- Nano Banana 2: プロンプトからスタジオ品質の画像を生成(2026年2月26日発表)
- Veo 3.1: 8秒間のビデオ生成(720p/1080p)に対応
- NotebookLM: ドキュメントからポッドキャストを生成
- Personal Intelligence: Gmail、Photos、Drive、Searchに接続し、パーソナライズされた回答を提供
コーディング特化機能
- Custom Toolsエンドポイント:
gemini-3.1-pro-preview-customtoolsでview_fileやsearch_codeなどのカスタムツールをエージェントワークフローで優先 - Nano Banana画像生成: テキストからアニメーションSVGを直接生成
ベンチマーク性能
| ベンチマーク | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2 |
|---|---|---|---|
| LiveCodeBench (Elo) | 2887 | - | 2393 |
| SWE-Bench Verified | 80.6% | 80.8% | 80.0% |
| SciCode | 59% | 52% | - |
| Terminal-Bench 2.0 | 68.5% | 65.4% | 54.0% |
| SWE-Bench Pro | 54.2% | - | 56.8% |
注目ポイント:
- 13/16のベンチマークでトップ
- ARC-AGI-2では前モデルから性能が2倍以上向上
- 出力の切り詰め問題が解決
今後の展開
Gemini 3.1 Proは現在のライデルモデルだが、2026年後半には次期モデル(Gemini 4?)の登場が期待されている。コンテキストウィンドウの拡大、マルチモーダル理解、推論能力の更なる向上が予想される。
まとめ
Gemini 3.1 Proは、GoogleのAI戦略における最重要的アップデートとして、Claude Opus 4.6と並ぶトップレンジモデルとしての地位を確立した。特にコーディング・ソフトウェアエンジニアリング分野での性能は目を引くものがあり、開発者にとって有力な選択肢となっている。
関連記事
Google、Gemini 3 Deep Thinkを発表。科学・研究向け推論モードを大幅強化
Googleが2026年2月にGemini 3 Deep Thinkを発表。科学計算、数学的推論、複雑な問題解決に特化した深い推論モードで、研究者・エンジニア向けに最適化。
2026年、無料で利用可能なAIツール10選。ChatGPT、Claude、Geminiなど主要サービスが無料プラン拡充
OpenAI、Anthropic、Googleなど主要AI開発企業が相次いで無料プランを拡充。2026年現在、プロダクション品質のAIツールが無料で利用可能に。
GoogleがOpenClaw経由のGemini利用ユーザーのアカウントを永久停止——月額$250請求継続のまま
2026年2月23日、Hacker Newsで140pt/107コメントを集めたレポートによると、GoogleはOpenClaw(サードパーティクライアント)経由でGeminiを使用していたGoogle AI Pro/Ultraユーザーを予告なしに永久停止した。技術的・経済的背景を整理する。
人気記事
Cursor Automations リリース - トリガーとスケジュールに基づく常駐エージェント
Cursorが新しいAutomations機能をリリース。トリガーとスケジュールに基づいて動作する常駐エージェントを構築できる。
Cursor v2.7 リリース - JetBrains IDEでのCursor利用が可能に
Cursor v2.7では、Agent Client Protocol (ACP)を通じてIntelliJ IDEA、PyCharm、WebStormなどのJetBrains IDEでCursorが利用可能になった。
Cursor v2.6 リリース - MCP Appsとチーム向けプラグイン管理機能
Cursor v2.6では、エージェントチャット内でのインタラクティブなUI、プライベートプラグインのチーム共有機能強化、デバッグモードの改善などが発表された。
最新記事
Claude Code v2.1.72 リリース - 自動メモリ保存とループ機能追加
AnthropicがClaude Code v2.1.72をリリース。自動メモリ保存、/copyコマンド、/loopコマンド、Cronスケジュールツール、Voiceキーバインディングなど多数の新機能を搭載。
OpenAI Symphony — エージェントの監視から「仕事の管理」へのパラダイムシフト
OpenAIが新プロジェクトSymphonyを公開。GitHub Issue (Linear)から自動的にエージェントを実行し、PRを作成まで行う自律型オートメーションツール。
Claude Code v2.1.70 リリース - APIエラー修正とパフォーマンス改善
AnthropicがClaude Code v2.1.70をリリース。第三方ゲートウェイでのAPI 400エラー修正、Windows/WSLのクリップボード問題対応、Remote Controlポーリング頻度大幅削減など多数の改善点を含む。