Vibe Coding 的真实代价 — 当随心编码的应用爆红然后崩了
来源:Every Newsletter Morning Brief,2026-03-21
故事背景:Proof 的诞生与崩溃
Dan Shipper(Every 联合创始人兼 CEO)在运营一家约二十人公司的同时,用 AI(主要是 OpenAI Codex + GPT-5.4)独自构建了一个名为 Proof 的 agent-native 文档编辑器。
项目数据:
- 1 月初开始提交代码,最初是 macOS App
- 两周半前转型为纯 Web 版本
- 正式发布版本仅约 10 天历史
- 发布后产生了 4,000+ 篇文档
- 仓库现有 1,600 次提交、600+ 个 PR、约 14 万行代码
- 对比数据:2020-2024 年中位数全职开发者每年提交 417 次
崩溃时刻: 发布后次日凌晨 4 点,服务器开始神秘崩溃。Dan 在连续 24 小时未睡的情况下,只能看着 Codex agent 尝试修复一个他自己都不理解的代码库。
核心观点: 如果你能随心编码,你就能随心修复——只是可能速度很慢。
随心编码的边界:能做到什么
1. 极快的速度和复杂度
Vibe coding 已经能在极短时间内构建复杂应用并推向生产:
- Dan 在兼顾公司管理的同时,10 天内就将 Proof 推到了公司内部关键工具的地位
- 并向小圈子订阅者开放
2. Codex(GPT-5.4)的强大表现
相比其他模型(如 Claude Opus)在代码库增大时的失效,GPT-5.4 表现稳定。
子 agent(Subagents)功能: 显著提升并行效率:
- 一个子 agent 推送最新修复上线
- 一个子 agent 监控新错误
- 一个子 agent 编写最高优先级 bug 的修复方案
- 主 orchestrator 协调所有子 agent
3. Every 的 Compound Engineering 插件
在项目后期,Dan 大量使用了 Every 自研的 compound engineering 插件,其深度研究规划和代码审查能力进一步放大了 Codex 的效能。
随心编码的新瓶颈
瓶颈一:编码模型倾向于局部修补,而非追溯根因
模型往往解决眼前问题,而不是先退后一步找到根本原因。
结果: 没有人工引导,代码库容易变成一个「热修复补丁拼图」,越补越乱。
瓶颈二:模型的训练数据不含最新最佳实践
Proof 基于 Yjs 和 Hocus Pocus 这两个协同文档库构建。
问题: Dan 发现 GPT-5.4 的训练数据中不包含 Yjs 的最佳实践,导致模型提出了架构上有缺陷的方案。
解决方案: 让模型在动手前先做充分的网络调研——但这依赖最佳实践已公开在网络上,对于私有企业软件库并不适用。
瓶颈三:修复循环耗时随代码库规模线性增长
AI 修复的标准循环: 假设修复方案 → 编码 → 本地测试 → 预发布测试 → 推送生产 → 监控效果
在小代码库上这个循环很快,在大型复杂代码库上可能需要数小时。
为什么人类工程师不会消失
核心论点
每个 bug 修复本质上都是一场科学实验,模型无法跳过实验循环。
经验的价值
有经验的工程师能凭借多年积累的失败经验快速缩小可能性空间。
这种「直觉」不一定每次都对,但正确率足够高,足以把「Agent 花数天找 bug」缩短为「立即稳定」。
"分配经济"(Allocation Economy)
稀缺资源不再是编写代码的能力,而是知道把智能引导到哪里。
专业知识的意义越来越在于:
- 提出正确的第一个问题
- 快速缩小假设空间
- 减少无效的实验循环
模型进步并不能消除这个问题: 最前沿的最佳实践正在被一线工程师摸索出来,这些实践不会出现在几个月甚至几年内的训练数据中。
立即可应用的行动步骤
1. 在用 AI 写代码前,先让它做充分研究
如果你用的库比较新或小众,明确要求 AI 先做网络调研再提方案:
"在给我写任何代码之前,请先搜索 [库名] 的最新最佳实践,
特别是关于 [你的使用场景] 的内容,然后给我一个架构方案。"
2. 引导 AI 找根因,而非局部修补
当 AI 给你一个 bug 修复时,先问:
"在修复这个 bug 之前,请先分析整个错误链路,
告诉我这个问题的根本原因是什么,而不只是表面症状。"
3. 用子 agent 并行化调试工作流
如果你用 Codex 或类似工具,可以设置:
- Agent A:监控日志和错误
- Agent B:编写修复方案
- Agent C:负责测试和部署
- 你自己:优先级判断和 agent 方向引导
4. 构建你的个人「直觉库」
记录每次 AI 出错的模式,尤其是它倾向于在哪类问题上绕弯路。
这份记录就是你作为人类在 AI 时代的核心竞争力。
核心洞察
"你的专业价值不在于写代码,而在于减少 AI 的无效实验次数"
这个视角对非技术人员同样适用:在任何 AI 辅助工作中,能够快速判断「这条路走不通」的经验直觉,比让 AI 把所有路都试一遍的代价要低得多。
你的核心竞争力 = 正确的第一个问题 + 快速缩小假设空间 + 知道何时叫停 AI
关联
- harness-engineering/overview — Harness Engineering
- claude-code/overview — Claude Code
- product-trends/vibecoding-success-stories — Vibecoding 成功案例