Back/harness engineering

Vibe Coding 的真实代价 — 当随心编码的应用爆红然后崩了

Updated 2026-04-11
2 min read
308 words

Vibe Coding 的真实代价 — 当随心编码的应用爆红然后崩了

来源:Every Newsletter Morning Brief,2026-03-21

故事背景:Proof 的诞生与崩溃

Dan Shipper(Every 联合创始人兼 CEO)在运营一家约二十人公司的同时,用 AI(主要是 OpenAI Codex + GPT-5.4)独自构建了一个名为 Proof 的 agent-native 文档编辑器。

项目数据:

  • 1 月初开始提交代码,最初是 macOS App
  • 两周半前转型为纯 Web 版本
  • 正式发布版本仅约 10 天历史
  • 发布后产生了 4,000+ 篇文档
  • 仓库现有 1,600 次提交、600+ 个 PR、约 14 万行代码
  • 对比数据:2020-2024 年中位数全职开发者每年提交 417 次

崩溃时刻: 发布后次日凌晨 4 点,服务器开始神秘崩溃。Dan 在连续 24 小时未睡的情况下,只能看着 Codex agent 尝试修复一个他自己都不理解的代码库。

核心观点: 如果你能随心编码,你就能随心修复——只是可能速度很慢。

随心编码的边界:能做到什么

1. 极快的速度和复杂度

Vibe coding 已经能在极短时间内构建复杂应用并推向生产:

  • Dan 在兼顾公司管理的同时,10 天内就将 Proof 推到了公司内部关键工具的地位
  • 并向小圈子订阅者开放

2. Codex(GPT-5.4)的强大表现

相比其他模型(如 Claude Opus)在代码库增大时的失效,GPT-5.4 表现稳定。

子 agent(Subagents)功能: 显著提升并行效率:

  • 一个子 agent 推送最新修复上线
  • 一个子 agent 监控新错误
  • 一个子 agent 编写最高优先级 bug 的修复方案
  • 主 orchestrator 协调所有子 agent

3. Every 的 Compound Engineering 插件

在项目后期,Dan 大量使用了 Every 自研的 compound engineering 插件,其深度研究规划和代码审查能力进一步放大了 Codex 的效能。

随心编码的新瓶颈

瓶颈一:编码模型倾向于局部修补,而非追溯根因

模型往往解决眼前问题,而不是先退后一步找到根本原因。

结果: 没有人工引导,代码库容易变成一个「热修复补丁拼图」,越补越乱。

瓶颈二:模型的训练数据不含最新最佳实践

Proof 基于 YjsHocus Pocus 这两个协同文档库构建。

问题: Dan 发现 GPT-5.4 的训练数据中不包含 Yjs 的最佳实践,导致模型提出了架构上有缺陷的方案。

解决方案: 让模型在动手前先做充分的网络调研——但这依赖最佳实践已公开在网络上,对于私有企业软件库并不适用。

瓶颈三:修复循环耗时随代码库规模线性增长

AI 修复的标准循环: 假设修复方案 → 编码 → 本地测试 → 预发布测试 → 推送生产 → 监控效果

在小代码库上这个循环很快,在大型复杂代码库上可能需要数小时。

为什么人类工程师不会消失

核心论点

每个 bug 修复本质上都是一场科学实验,模型无法跳过实验循环。

经验的价值

有经验的工程师能凭借多年积累的失败经验快速缩小可能性空间。

这种「直觉」不一定每次都对,但正确率足够高,足以把「Agent 花数天找 bug」缩短为「立即稳定」。

"分配经济"(Allocation Economy)

稀缺资源不再是编写代码的能力,而是知道把智能引导到哪里。

专业知识的意义越来越在于:

  • 提出正确的第一个问题
  • 快速缩小假设空间
  • 减少无效的实验循环

模型进步并不能消除这个问题: 最前沿的最佳实践正在被一线工程师摸索出来,这些实践不会出现在几个月甚至几年内的训练数据中。

立即可应用的行动步骤

1. 在用 AI 写代码前,先让它做充分研究

如果你用的库比较新或小众,明确要求 AI 先做网络调研再提方案:

"在给我写任何代码之前,请先搜索 [库名] 的最新最佳实践,
特别是关于 [你的使用场景] 的内容,然后给我一个架构方案。"

2. 引导 AI 找根因,而非局部修补

当 AI 给你一个 bug 修复时,先问:

"在修复这个 bug 之前,请先分析整个错误链路,
告诉我这个问题的根本原因是什么,而不只是表面症状。"

3. 用子 agent 并行化调试工作流

如果你用 Codex 或类似工具,可以设置:

  • Agent A:监控日志和错误
  • Agent B:编写修复方案
  • Agent C:负责测试和部署
  • 你自己:优先级判断和 agent 方向引导

4. 构建你的个人「直觉库」

记录每次 AI 出错的模式,尤其是它倾向于在哪类问题上绕弯路。

这份记录就是你作为人类在 AI 时代的核心竞争力。

核心洞察

"你的专业价值不在于写代码,而在于减少 AI 的无效实验次数"

这个视角对非技术人员同样适用:在任何 AI 辅助工作中,能够快速判断「这条路走不通」的经验直觉,比让 AI 把所有路都试一遍的代价要低得多。

你的核心竞争力 = 正确的第一个问题 + 快速缩小假设空间 + 知道何时叫停 AI

关联

Sources

Linked from