Cursor Composer 2 — 自研编码模型发布
来源:The Rundown AI,2026-03-20
核心要点
Cursor 背后的 Anysphere 公司发布了第三代自研模型 Composer 2,在独立基准测试中媲美 OpenAI 和 Anthropic 前沿编码模型,但成本仅为其一小部分。
性能数据
| 基准测试 | Composer 2 | 对比模型 | 结果 |
|---|---|---|---|
| Terminal-Bench 2.0 | 61.7% | Opus 4.6 (58%) | 超越 |
| CursorBench | 61.3% | GPT-5.4 (~66%) | 差距 < 5% |
| SWE-bench Multilingual | 73.7 | — | — |
| 三代进化 (2025.10→现在) | 38% → 61.3% | — | +23.3% |
价格对比
| 模型 | 输出价格 | 相对成本 |
|---|---|---|
| Composer 2 快速档 | $0.50/M tokens | 基准 |
| GPT-5.4 | ~$5/M tokens | 10x |
| Opus 4.6 | ~$10/M tokens | 20x |
- 输入价格:$0.50/M
- 输出价格:$0.50/M
训练细节
- 持续预训练:首次进行持续预训练(Continued Pretraining)后再进行 RL
- 分布式 RL:训练分布在全球 3-4 个集群上
- 团队规模:约 40 人专注于软件工程任务
战略意义
- 垂直整合:Cursor 从使用第三方模型转向自研模型
- 经济逻辑改变:高性能 + 低成本可能改变开发者为 GPT-5.4/Opus 付全价的决策
- 应用层突破:在应用层公司中实现接近前沿的性能
关联
- ai-ecosystem/overview — AI 生态系统概述
- product-trends/cursor-3-agent-orchestration — Cursor 3.0 Agent Orchestration
- harness-engineering/overview — Harness Engineering