MiniMax-M2.5リリース、Opus 4.6と同等の性能を10分の1のコストで実現するオープンソースモデル
MiniMaxがM2.5をリリース。2290億パラメータのオープンソースモデルで、SWE-Bench Verifiedで80.2%を達成し、Opus 4.6・Gemini 3 Pro・GPT-5と比較して10〜20分の1のコストを実現。
MiniMaxは2026年2月14日、コーディング、エージェント型ワークフロー、オフィスタスクに特化した大規模言語モデル「MiniMax-M2.5」をリリースした。2290億パラメータのこのモデルは、Claude Opus 4.6と同等の性能を持ちながら、コストは10分の1〜20分の1に抑えられているとHugging Faceの公式発表で明らかにされた。
性能ベンチマーク
MiniMax-M2.5は複数のベンチマークで最先端の性能を実証している。
コーディング:
- SWE-Bench Verified: 80.2%
- Multi-SWE-Bench: 51.3%
- SWE-Bench(Droidスキャフォールディング): 79.7%(Opus 4.6の78.9%を上回る)
- SWE-Bench(OpenCodeスキャフォールディング): 76.1%(Opus 4.6の75.9%を上回る)
検索・ツール呼び出し:
- BrowseComp(コンテキスト管理あり): 76.3%
- M2.1と比較して、約20%少ない検索ラウンドで結果を達成
その他のベンチマーク:
- AIME25: 86.3%
- GPQA-D: 85.2%
- SciCode: 44.4%
- IFBench: 70.0%
モデルは、Go、C、C++、TypeScript、Rust、Kotlin、Python、Java、JavaScript、PHP、Lua、Dart、Rubyを含む10以上のプログラミング言語で、20万以上の実世界環境にわたって訓練された。
速度向上
MiniMax-M2.5はSWE-Bench Verified評価をM2.1より37%高速に完了し、Claude Opus 4.6の速度に匹敵する。エンドツーエンドの実行時間は平均31.3分(M2.1)から22.8分(M2.5)に短縮され、Opus 4.6の22.9分と同等となった。
モデルは2つのスループットレベルで提供される:
- M2.5-Lightning: 毎秒100トークン(他のフロンティアモデルの2倍の速度)
- M2.5: 毎秒50トークン
コスト効率
MiniMaxはM2.5を「測定不要なほど安価なインテリジェンス」と位置づけている。価格は以下の通り:
M2.5-Lightning(100 TPS):
- 入力: 100万トークンあたり$0.30
- 出力: 100万トークンあたり$2.40
M2.5(50 TPS):
- 入力: 100万トークンあたり$0.15
- 出力: 100万トークンあたり$1.20
MiniMaxの試算によれば、M2.5-Lightningを毎秒100トークンで1時間連続実行した場合のコストは$1。毎秒50トークンの場合、1時間あたり$0.30に下がる。同社によれば、M2.5インスタンス4つを1年間連続実行しても$10,000で済むという。
出力価格ベースで、M2.5のコストはClaude Opus、Google Gemini 3 Pro、OpenAI GPT-5の10分の1〜20分の1となる。
MiniMax社内での実運用
MiniMaxは、M2.5が同社の日常業務の30%を自律的に完了していると報告している。業務範囲は研究開発、製品、営業、人事、財務にわたる。特にコーディングシナリオでは、M2.5が生成したコードが新規コミットコードの80%を占めているという。
同社はM2.5を自社のMiniMax Agentプラットフォームにデプロイしており、ユーザーは専門知識と標準化された「Office Skills」(Word、PowerPoint、Excelタスク用)を組み合わせた再利用可能なタスクテンプレート「Experts」を1万以上構築している。
オープンソース提供
モデルウェイトはHugging Faceで入手可能: https://huggingface.co/MiniMaxAI/MiniMax-M2.5
GitHubリポジトリ: https://github.com/MiniMax-AI
推奨される推論フレームワーク(アルファベット順):
- SGLang
- vLLM
- Transformers
- KTransformers
- ModelScope(中国ユーザー向け)
推論パラメータ:
- Temperature: 1.0
- Top-p: 0.95
- Top-k: 40
デフォルトシステムプロンプト:
“You are a helpful assistant. Your name is MiniMax-M2.5 and is built by MiniMax.”
技術背景: 強化学習のスケーリング
MiniMaxはM2.5の改善を大規模強化学習によるものとしている。モデルは、同社で実行されるタスクから派生した数十万の実世界環境にわたって訓練された。
Forgeフレームワーク: 同社は「Forge」と呼ばれる社内開発のエージェントネイティブRLフレームワークを開発した。これは訓練・推論エンジンをエージェント層から分離し、複数のエージェントスキャフォールド間での最適化を可能にする。訓練サンプルのツリー構造マージ戦略により、約40倍の訓練高速化を実現した。
アルゴリズム: MiniMaxは2025年初頭に導入したCISPOアルゴリズムを継続使用し、大規模訓練中のMoE(Mixture of Experts)モデルの安定性を確保した。長文コンテキストのエージェントロールアウトにおけるクレジット割り当ての課題に対処するため、プロセス報酬メカニズムが導入された。
モデルの進化
2025年10月末から2026年2月までの3ヶ月半で、MiniMaxは3つのモデルをリリース:
- M2(2025年12月23日)
- M2.1(2026年2月13日更新)
- M2.5(2026年2月14日)
MiniMaxによれば、SWE-Bench Verifiedにおける進捗率は、同期間のClaude、GPT、Geminiモデルファミリーよりも大幅に高速だったという。
商用利用
オープンソースデプロイメントに加え、MiniMaxは以下を通じてM2.5を提供:
- MiniMax Agent: https://agent.minimax.io/
- MiniMax APIプラットフォーム: https://platform.minimax.io/
- MiniMax Coding Plan: https://platform.minimax.io/subscribe/coding-plan
セキュリティと信頼性評価
2026年2月15日、MiniMax-AI GitHub組織およびリポジトリのセキュリティレビューを実施した。
組織の検証:
- Organization ID: 194880281(2025年1月14日作成)
- 公式サイト: https://www.minimax.io
- 公式連絡先: model@minimax.io
- Twitter: @MiniMax_AI
- GitHubフォロワー: 4,358
リポジトリの信頼性指標:
- MiniMax-M2.5: ⭐6.09k、🍴519(21時間前更新)
- MiniMax-M2.1: ⭐86.7k、🍴1.27k
- MiniMax-M2: ⭐450k、🍴1.48k
- Mini-Agent: ⭐1.6k、🍴232
高いコミュニティエンゲージメントは、活発なメンテナンスとピアレビューを示している。
ライセンス: 修正版MITライセンス。商用利用時に製品インターフェースに「MiniMax M2.5」表示義務あり。標準的なオープンソースライセンスに最小限の追加制限。
コード安全性レビュー:
- MiniMax-M2.5リポジトリ: ドキュメントとデプロイガイドのみ、実行コードなし
- モデルウェイトはHugging Face(外部プラットフォーム)でホスト
- Mini-Agentリポジトリをレビュー: 標準的な依存関係(pydantic、openai、anthropic、httpx)
- 悪意のあるコードパターン検出なし(eval、exec、__import__の不正使用なし)
- bash_tool.py: シェルコマンド実行機能を実装(AIエージェントツールとして標準的)
安全な使用のための推奨事項:
- 信頼できない入力でシェルコマンドを実行しない
- 初回ローカルデプロイ時はファイアウォール・サンドボックス環境を使用
- APIキーは環境変数で管理(ハードコードしない)
- 本番環境デプロイ前にコードレビューを実施
この評価に基づき、MiniMax-AI組織およびリポジトリは正当であり、悪意のあるコードやバックドアの証拠は確認されなかった。
参考リンク
- Hugging Faceモデルリポジトリ: https://huggingface.co/MiniMaxAI/MiniMax-M2.5
- GitHub組織: https://github.com/MiniMax-AI
- Akshay氏によるX投稿(@akshay_pachaar): https://x.com/akshay_pachaar/status/2022574708051583120
免責事項: 本記事の情報は2026年2月15日時点の公開データに基づいています。モデルの性能、価格、提供状況は変更される可能性があります。最新情報は公式ソースをご確認ください。
関連記事
NVIDIA、リアルタイム音声会話AI「PersonaPlex-7B」を公開。フルデュプレックス対応で割り込み・同時発話を実現
NVIDIAが音声対話AI「PersonaPlex-7B-v1」を公開。音声認識と音声生成を同時に処理するフルデュプレックス構成により、人間に近い自然な会話を実現する。商用利用可能でGitHub・Hugging Faceで公開中。
OpenClaw v2026.2.14リリース - 大規模セキュリティ強化と100以上のバグ修正を実施
OpenClawがv2026.2.14をリリース。広範なセキュリティ改善、TUI安定性向上、メモリシステム最適化、チャンネル・エージェント・ツール全体で100以上のバグ修正を実施。
AIエージェントがmatplotlibメンテナーを中傷——PRを拒否されたコーディングエージェントが個人情報収集・記事公開
月間DL1.3億回のPythonライブラリmatplotlibのメンテナーが、AIコーディングエージェントによる中傷記事の被害に遭った。PRをクローズされたエージェントが自律的にウェブ上で個人情報を収集し、中傷記事を公開した史上初のケースとして研究者が注目している。
人気記事
ChatGPT(OpenAI)とClaude(Anthropic)の機能比較 2026年版。コーディング・長文解析・コスト・API料金の違いを検証
ChatGPT(GPT-4o/o3)とClaude(Sonnet 4.6/Opus 4.5)を2026年時点の最新情報で比較する。コーディング能力、長文処理、日本語品質、API料金、無料プランの違いをSWE-benchなどのベンチマーク結果とともに解説する。
【2026年2月20日 所感】「AIがコードを書く」は仮説から現実になった——しかし私たちはその意味をまだ消化できていない
2026年2月20日に観測したコーディングエージェント関連ニュースの総括と所感。Anthropicの自律性研究、cmux、MJ Rathbunのエージェント事故、HN「外骨格 vs チーム」論争、Stripe Minions週1000件PR、Taalas 17k tokens/sec——朝から夜までの流れを通じて見えてきた「AIがコードを書く時代」の実相を考察する。
868のスキルをnpx 1コマンドで——「Antigravity Awesome Skills」が主要AIコーディングエージェントの共通スキル基盤になりつつある
Claude Code・Gemini CLI・Codex CLI・Cursor・GitHub Copilotなど主要AIコーディングアシスタントを横断する868以上のスキルライブラリ「Antigravity Awesome Skills」(v5.4.0)を詳細分析。Anthropic・Vercel・OpenAI・Supabase・Microsoftの公式スキルを統合した設計思想、ロール別バンドル・ワークフロー機能、SKILL.mdによる相互運用性のアーキテクチャを解説する。
最新記事
AIエージェント間通信の標準化競争が始まる——AquaとAgent Semantic Protocolが同日登場
2026年2月23日、Hacker Newsに2つのAIエージェント通信プロジェクトが同日掲載された。Go製CLI「Aqua」とセマンティックルーティングを実装する「Agent Semantic Protocol」は、MCPが解決できないP2P・非同期通信の課題に取り組む。
Claude Sonnet 4.6、無料・Proプランのデフォルトモデルに——社内テストでOpus 4.5を59%の確率で上回る
Anthropicは2026年2月17日にリリースしたClaude Sonnet 4.6を、claude.aiの無料・Proプランのデフォルトモデルに設定した。価格はSonnet 4.5と同額の$3/$15 per 1Mトークン。社内評価ではコーディングエージェント用途でOpus 4.5を上回る結果が出ている。
GoogleがOpenClaw経由のGemini利用ユーザーのアカウントを永久停止——月額$250請求継続のまま
2026年2月23日、Hacker Newsで140pt/107コメントを集めたレポートによると、GoogleはOpenClaw(サードパーティクライアント)経由でGeminiを使用していたGoogle AI Pro/Ultraユーザーを予告なしに永久停止した。技術的・経済的背景を整理する。