Extreme Harness Engineering — 1M LOC, 1B Tokens/Day, 0% Human Review
来源:Latent Space Podcast + AI Briefing 2026-04-08
核心数据
OpenAI Frontier & Symphony 团队的极端规模 harness 工程实践:
| 指标 | 数值 |
|---|---|
| 代码量 | 100 万行 |
| 日 Token 量 | 10 亿 |
| 人工审核 | 0% |
| 人工代码 | 0% |
完全由 AI 驱动的开发流程
核心观点
Ryan Lopopolo 的洞察
"codec 和 harness 是构建 AI 产品的核心基础设施,模型能力每提升一代,任务复杂度就会跃升一次"
系统化思维
关键在于系统化思维:
- 持续定位 agent 出错点
- 将人工干预转化为自动化规则
- 逐步建立对自动化的信任
Codex Harness 的作用
Codex harness 已经完成了 SDLC(软件开发生命周期)中大部分 wiring 工作:
- 开发者只需专注于用 prompt 描述问题
- 让模型自己 "cook"
- 从需求到代码、测试、合并、上线的全流程自动化
可复用的工程原则
1. 定位出错点 → 自动化规则
不要试图一次性完善系统,而是:
- 观察 agent 在哪里失败
- 将人工干预转化为自动化规则
- 逐步减少人工参与
2. 建立对自动化的信任
信任不是一蹴而就的,而是通过:
- 小规模试验
- 渐进式扩大范围
- 持续监控和反馈
3. 利用模型能力提升
随着模型能力提升:
- 任务复杂度自然跃升
- 之前不可能的自动化变得可行
- 系统需要持续演进以适应新能力
实际效果
参考案例(The General Intelligence Company):
- 团队效率提升 400%
- 平均每位工程师每天 25 个 PR
- 有时甚至 AI token 的花费超过人力薪资
关联
- harness-engineering/overview — Harness Engineering 概览
- harness-engineering/three-scaling-dimensions — 三个 Scaling 维度
- ai-ecosystem/overview — AI 生态系统
Sources
- AI 简报 2026-04-08
- AI 简报 2026-04-08 — Latent Space Podcast with Ryan Lopopolo