Cursor Composer 2.5 登場:2.0 から何が変わった?特徴と使いどころ
AI コードエディタ Cursor が、自社開発モデル Composer 2.5 をリリースしました。
2026 年 3 月に登場した Composer 2 から約 2 か月、さらに一段上の「知能」と「使いやすさ」を目指したアップデートです。
本記事では、Composer 2.5 の特徴、Composer 2 との違い、どんな場面で活きるのかを、公式情報をもとにわかりやすくまとめます。
Composer 2.5 とは?
Composer は Cursor が自社で開発・提供している、コーディング特化の AI モデルです。
エージェント機能(Agent)や Composer パネルから選択して使え、ファイルの読み書きやターミナル操作など、実際の開発作業を自律的に進められます。
Composer 2.5 は、その Composer シリーズの最新版として 2026 年 5 月 18 日に公開されました。
ベースモデルは Composer 2 と同じ Moonshot AI の Kimi K2.5 を引き続き採用しています。
つまり、基盤となる大規模言語モデル自体は変わらず、学習手法と後処理(ポストトレーニング)を大幅に強化したアップデートと言えます。
Composer 2.5 の主な特徴
Cursor 公式ブログでは、Composer 2.5 を次のように位置づけています。
- 長時間タスクへの耐性が向上:大規模なリファクタリングや複数ファイルにまたがる機能追加など、時間のかかる作業を最後まで粘り強く進めやすくなった
- 複雑な指示への追従性が向上:細かい条件や制約が多い依頼でも、意図を取り違えにくくなった
- 協働体験の改善:コミュニケーションスタイルや作業の「力加減(effort calibration)」が調整され、実務で使いやすくなった
- コスト効率:同等クラスのフロンティアモデルと比べて、最大 10 倍のコスト効率を実現している(Cursor 公式の説明)
ベンチマークの数字だけでは測れない「説明の仕方」や「作業の進め方」といった振る舞い面の改善も、Composer 2.5 の大きなポイントです。
Composer 2 から何が変わった?
Composer 2 と 2.5 の違いは、大きく分けて「性能」「学習手法」「価格(高速版)」の 3 点に整理できます。
ベンチマークスコアの向上
公開されているベンチマークでは、Composer 2.5 は Composer 2 を上回るスコアを記録しています。
| ベンチマーク | Composer 2 | Composer 2.5 |
|---|---|---|
| SWE-bench Multilingual | 73.7% | 79.8% |
| CursorBench | 61.3%(v2) | 63.2%(v3.1) |
| Terminal-Bench 2.0 | 61.7% | (公式数値未公開) |
特に SWE-bench Multilingual では約 6 ポイントの改善が見られ、多言語環境でのバグ修正能力が強化されたことがうかがえます。
なお CursorBench はバージョンが異なるため、単純な横並び比較には限界があります。
学習データと手法の強化
Composer 2.5 で最も大きな技術的変更は、学習規模と手法の拡張です。
- 合成タスク(Synthetic Tasks)が 25 倍に増加:Composer 2 と比べて、より難易度の高い課題でモデルを鍛えた
- Targeted RL with Textual Feedback:長い作業の途中で起きた特定のミス(誤ったツール呼び出し、説明の不備など)に対して、局所的なテキストフィードバックで修正を促す新しい強化学習手法を導入
- Feature Deletion などの合成タスク生成:実際のコードベースをもとに、機能を削除して再実装させるなど、検証可能な報酬で学習する仕組みを拡充
- 学習インフラの最適化:Sharded Muon や Dual Mesh HSDP など、大規模 MoE モデルの学習効率を高める技術を適用
Composer 2 でも「数百のアクションが必要な長期タスク」を解けるよう強化されていましたが、2.5 ではその学習の規模と精度がさらに一段階上がっています。
振る舞い(Behavior)のキャリブレーション
Composer 2.5 では、コード生成能力だけでなく、実務での使い勝手を意識した調整も行われています。
- 説明の仕方(communication style)の改善
- タスクの規模に応じた作業量の調整(effort calibration)
- コーディングスタイルの一貫性向上
これらは SWE-bench のような数値ベンチマークでは測りにくい領域ですが、日々 Agent を使う開発者にとっては体感差が大きい改善点です。
料金体系:Composer 2 との比較
標準版のトークン単価は Composer 2 と同じく据え置きです。
| バリアント | 入力 | 出力 |
|---|---|---|
| Composer 2.5(標準) | $0.50 / 100万トークン | $2.50 / 100万トークン |
| Composer 2.5 Fast(デフォルト) | $3.00 / 100万トークン | $15.00 / 100万トークン |
| Composer 2 Fast(参考) | $1.50 / 100万トークン | $7.50 / 100万トークン |
Fast 版は Composer 2 時代より単価が上がっていますが、同等の知能を維持したまま他社フロンティアモデルの Fast 版より低コスト、と Cursor は説明しています。
また、リリースから 1 週間は Composer 2.5 の利用枠が 2 倍になるキャンペーンも実施されています。
「機能追加」と「モデル更新」の違いに注意
「Composer 2.5」という名前はモデルのアップデートを指します。
一方、Cursor エディタ本体の バージョン 2.5(2026 年 2 月リリース)には、Plugins、非同期 Subagents、サンドボックスのネットワーク制御など、IDE 側の機能追加が含まれています。
混同しやすいので整理しておきましょう。
| 名称 | 種類 | 主な内容 |
|---|---|---|
| Composer 2.5 | AI モデル | 知能・振る舞い・長時間タスク耐性の向上 |
| Cursor 2.5 | エディタ本体 | Plugins、非同期 Subagents、サンドボックス制御など |
Composer 2.5 を最大限活かすには、Cursor 2.5 で追加された非同期 Subagents などと組み合わせると、大規模タスクの処理効率がさらに上がります。
こんな場面で Composer 2.5 が向いている
- 大規模リファクタリング:複数ファイル・複数モジュールにまたがる変更を、一貫性を保ちながら進めたいとき
- 複雑な機能追加:細かい仕様や制約が多い依頼を、Agent に任せて最後まで完走させたいとき
- コストを抑えつつ高品質な Agent を使いたい:Claude Opus や GPT 系の高額モデルより、Composer 2.5 で同等の作業をこなしたいとき
- 日常的なコーディング支援:Fast 版がデフォルトのため、レスポンス重視の日常開発にもそのまま使える
逆に、短い質問や 1 ファイル程度の小さな修正なら、Composer 2 との体感差は限定的かもしれません。
Composer 2.5 の真価は、「長く、複雑で、粘り強い作業」にこそ発揮されるモデルです。
Composer 2.5 の使い方
Composer 2.5 は Cursor エディタのモデル選択画面から選べます。
- Agent または Composer パネルを開く
- モデル選択で Composer 2.5(または Composer 2.5 Fast)を選ぶ
- 通常どおりタスクを依頼する
Individual プランでは Composer 専用の利用枠(Usage Pool)が用意されており、Pro プランに含まれる範囲内で試せます。
今後の展望:次世代 Composer への布石
Cursor 公式は、Composer 2.5 と並行して、SpaceXAI との共同開発による次世代モデルの訓練も進めていると述べています。
Colossus 2 の 100 万 H100 相当の計算資源と、10 倍規模の学習コストを投入し、Kimi K2.5 ベースではなく ゼロからの大規模モデルを目指す、とのことです。
Composer 2.5 はその過渡期における、現時点で最も実用的な Composer モデルと位置づけられます。
まとめ
- Composer 2.5 は Cursor 自社開発の最新コーディングモデルで、2026 年 5 月 18 日に公開された
- ベースモデル(Kimi K2.5)は Composer 2 と同じだが、学習規模(合成タスク 25 倍)と新手法(Textual Feedback RL)で大幅に強化された
- 長時間タスク、複雑な指示への追従、協働体験(説明・作業量の調整)が主な改善点
- SWE-bench Multilingual は 73.7% → 79.8% と向上
- 標準版の単価は Composer 2 と同じ $0.50 / $2.50(100 万トークンあたり)
- 「Composer 2.5(モデル)」と「Cursor 2.5(エディタ)」は別物なので、混同しないこと
Opus など高額モデルに頼りがちな Agent 利用を、Composer 2.5 に切り替えることで、コストを抑えつつ長時間タスクの品質を維持できる可能性があります。
まずはリリース 1 週間の 2 倍利用枠キャンペーン期間中に、普段の開発タスクで試してみるのがおすすめです。
