Gemini 3.1 Pro — コーディング・推論性能で業界トップを争夺
GoogleのGemini 3.1 Proは、2026年2月に発表された最新推論モデル。SWE-Bench Verified 80.6%、LiveCodeBenchで2887スコアを達成し、Claude Opus 4.6と並ぶトップレンジモデルとして注目される。
Gemini 3.1 Pro — コーディング・推論性能で業界トップを争夺
Googleは2026年2月19日、Gemini 3.1 Proを発表した。Claude Opus 4.6と並ぶトップレンジの推論モデルとして、コーディング・ソフトウェアエンジニアリングベンチマークで優れた成績を収めている。
主な機能と特徴
マルチモーダル × 100万トークンコンテキスト
テキスト、画像、音声、ビデオ、PDF、さらにはコードリポジトリ全体を同時処理可能。100万トークンのコンテキストウィンドウで、大規模な情報分析が可能。
進化した推論とエージェント機能
複雑な問題解決能力を備え、計画立案・実行・監視・適応を行うマルチステップタスクに対応。金融やスプレッドシートアプリケーション、ドキュメント分析などで最適化されている。
効率化と思考の選択肢
トークン効率が改善され、「MEDIUM」という思考レベルパラメータを導入。コスト、パフォーマンス、速度のトレードオフをユーザーは調整できる。
Googleエコシステム統合
- Google Workspace: Gmail、Docs、Sheets、Slides、Meetに統合
- Nano Banana 2: プロンプトからスタジオ品質の画像を生成(2026年2月26日発表)
- Veo 3.1: 8秒間のビデオ生成(720p/1080p)に対応
- NotebookLM: ドキュメントからポッドキャストを生成
- Personal Intelligence: Gmail、Photos、Drive、Searchに接続し、パーソナライズされた回答を提供
コーディング特化機能
- Custom Toolsエンドポイント:
gemini-3.1-pro-preview-customtoolsでview_fileやsearch_codeなどのカスタムツールをエージェントワークフローで優先 - Nano Banana画像生成: テキストからアニメーションSVGを直接生成
ベンチマーク性能
| ベンチマーク | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2 |
|---|---|---|---|
| LiveCodeBench (Elo) | 2887 | - | 2393 |
| SWE-Bench Verified | 80.6% | 80.8% | 80.0% |
| SciCode | 59% | 52% | - |
| Terminal-Bench 2.0 | 68.5% | 65.4% | 54.0% |
| SWE-Bench Pro | 54.2% | - | 56.8% |
注目ポイント:
- 13/16のベンチマークでトップ
- ARC-AGI-2では前モデルから性能が2倍以上向上
- 出力の切り詰め問題が解決
今後の展開
Gemini 3.1 Proは現在のライデルモデルだが、2026年後半には次期モデル(Gemini 4?)の登場が期待されている。コンテキストウィンドウの拡大、マルチモーダル理解、推論能力の更なる向上が予想される。
まとめ
Gemini 3.1 Proは、GoogleのAI戦略における最重要的アップデートとして、Claude Opus 4.6と並ぶトップレンジモデルとしての地位を確立した。特にコーディング・ソフトウェアエンジニアリング分野での性能は目を引くものがあり、開発者にとって有力な選択肢となっている。
関連記事
Google、Gemini 3 Deep Thinkを発表。科学・研究向け推論モードを大幅強化
Googleが2026年2月にGemini 3 Deep Thinkを発表。科学計算、数学的推論、複雑な問題解決に特化した深い推論モードで、研究者・エンジニア向けに最適化。
2026年、無料で利用可能なAIツール10選。ChatGPT、Claude、Geminiなど主要サービスが無料プラン拡充
OpenAI、Anthropic、Googleなど主要AI開発企業が相次いで無料プランを拡充。2026年現在、プロダクション品質のAIツールが無料で利用可能に。
GoogleがOpenClaw経由のGemini利用ユーザーのアカウントを永久停止——月額$250請求継続のまま
2026年2月23日、Hacker Newsで140pt/107コメントを集めたレポートによると、GoogleはOpenClaw(サードパーティクライアント)経由でGeminiを使用していたGoogle AI Pro/Ultraユーザーを予告なしに永久停止した。技術的・経済的背景を整理する。
人気記事
Claude Code v2.1.93 リリース - PreToolUseフック延期決定やフリッカーFREE渲染など
AnthropicがClaude Code v2.1.93をリリース。PreToolUseフックの延期決定機能、フリッカー-freeレンダリングオプション、PermissionDeniedフック、名前付きサブエージェントのタイプアヘッド対応などを含む。
Claude Code v2.1.92 リリース - forceRemoteSettingsRefreshやBedrockセットアップウィザードなど
AnthropicがClaude Code v2.1.92をリリース。forceRemoteSettingsRefreshポリシー設定、Bedrockセットアップウィザード、costコマンドの改善など多数の機能追加とバグ修正を含む。
Claude Code v2.1.84 リリース - PowerShellツールプレビューと環境設定の強化
Claude Code v2.1.84がリリース。Windows向けのPowerShellツール、環境変数によるモデル選択のカスタマイズアイドルセッション処理の改善などが含まれる。
最新記事
Claude Code v2.1.93 リリース - PreToolUseフック延期決定やフリッカーFREE渲染など
AnthropicがClaude Code v2.1.93をリリース。PreToolUseフックの延期決定機能、フリッカー-freeレンダリングオプション、PermissionDeniedフック、名前付きサブエージェントのタイプアヘッド対応などを含む。
Claude Code v2.1.92 リリース - forceRemoteSettingsRefreshやBedrockセットアップウィザードなど
AnthropicがClaude Code v2.1.92をリリース。forceRemoteSettingsRefreshポリシー設定、Bedrockセットアップウィザード、costコマンドの改善など多数の機能追加とバグ修正を含む。
Claude Code v2.1.91 リリース - MCPツール結果の永続化とEditツールの最適化
Claude Code v2.1.91ではMCPツールの結果サイズの上書き、シェル実行の制御強化、Editツールの効率改善などが行われた。