Vibe Coding 的真实代价 — 当随心编码的应用爆红然后崩了

来源：Every Newsletter Morning Brief，2026-03-21

故事背景：Proof 的诞生与崩溃

Dan Shipper（Every 联合创始人兼 CEO）在运营一家约二十人公司的同时，用 AI（主要是 OpenAI Codex + GPT-5.4）独自构建了一个名为 Proof 的 agent-native 文档编辑器。

项目数据：

1 月初开始提交代码，最初是 macOS App
两周半前转型为纯 Web 版本
正式发布版本仅约 10 天历史
发布后产生了 4,000+ 篇文档
仓库现有 1,600 次提交、600+ 个 PR、约 14 万行代码
对比数据：2020-2024 年中位数全职开发者每年提交 417 次

崩溃时刻： 发布后次日凌晨 4 点，服务器开始神秘崩溃。Dan 在连续 24 小时未睡的情况下，只能看着 Codex agent 尝试修复一个他自己都不理解的代码库。

核心观点： 如果你能随心编码，你就能随心修复——只是可能速度很慢。

随心编码的边界：能做到什么

1. 极快的速度和复杂度

Vibe coding 已经能在极短时间内构建复杂应用并推向生产：

Dan 在兼顾公司管理的同时，10 天内就将 Proof 推到了公司内部关键工具的地位
并向小圈子订阅者开放

2. Codex（GPT-5.4）的强大表现

相比其他模型（如 Claude Opus）在代码库增大时的失效，GPT-5.4 表现稳定。

子 agent（Subagents）功能： 显著提升并行效率：

一个子 agent 推送最新修复上线
一个子 agent 监控新错误
一个子 agent 编写最高优先级 bug 的修复方案
主 orchestrator 协调所有子 agent

3. Every 的 Compound Engineering 插件

在项目后期，Dan 大量使用了 Every 自研的 compound engineering 插件，其深度研究规划和代码审查能力进一步放大了 Codex 的效能。

随心编码的新瓶颈

瓶颈一：编码模型倾向于局部修补，而非追溯根因

模型往往解决眼前问题，而不是先退后一步找到根本原因。

结果： 没有人工引导，代码库容易变成一个「热修复补丁拼图」，越补越乱。

瓶颈二：模型的训练数据不含最新最佳实践

Proof 基于 Yjs 和 Hocus Pocus 这两个协同文档库构建。

问题： Dan 发现 GPT-5.4 的训练数据中不包含 Yjs 的最佳实践，导致模型提出了架构上有缺陷的方案。

解决方案： 让模型在动手前先做充分的网络调研——但这依赖最佳实践已公开在网络上，对于私有企业软件库并不适用。

瓶颈三：修复循环耗时随代码库规模线性增长

AI 修复的标准循环： 假设修复方案 → 编码 → 本地测试 → 预发布测试 → 推送生产 → 监控效果

在小代码库上这个循环很快，在大型复杂代码库上可能需要数小时。

为什么人类工程师不会消失

核心论点

每个 bug 修复本质上都是一场科学实验，模型无法跳过实验循环。

经验的价值

有经验的工程师能凭借多年积累的失败经验快速缩小可能性空间。

这种「直觉」不一定每次都对，但正确率足够高，足以把「Agent 花数天找 bug」缩短为「立即稳定」。

"分配经济"（Allocation Economy）

稀缺资源不再是编写代码的能力，而是知道把智能引导到哪里。

专业知识的意义越来越在于：

提出正确的第一个问题
快速缩小假设空间
减少无效的实验循环

模型进步并不能消除这个问题： 最前沿的最佳实践正在被一线工程师摸索出来，这些实践不会出现在几个月甚至几年内的训练数据中。

立即可应用的行动步骤

1. 在用 AI 写代码前，先让它做充分研究

如果你用的库比较新或小众，明确要求 AI 先做网络调研再提方案：

"在给我写任何代码之前，请先搜索 [库名] 的最新最佳实践，
特别是关于 [你的使用场景] 的内容，然后给我一个架构方案。"

2. 引导 AI 找根因，而非局部修补

当 AI 给你一个 bug 修复时，先问：

"在修复这个 bug 之前，请先分析整个错误链路，
告诉我这个问题的根本原因是什么，而不只是表面症状。"

3. 用子 agent 并行化调试工作流

如果你用 Codex 或类似工具，可以设置：

Agent A：监控日志和错误
Agent B：编写修复方案
Agent C：负责测试和部署
你自己：优先级判断和 agent 方向引导

4. 构建你的个人「直觉库」

记录每次 AI 出错的模式，尤其是它倾向于在哪类问题上绕弯路。

这份记录就是你作为人类在 AI 时代的核心竞争力。

核心洞察

"你的专业价值不在于写代码，而在于减少 AI 的无效实验次数"

这个视角对非技术人员同样适用：在任何 AI 辅助工作中，能够快速判断「这条路走不通」的经验直觉，比让 AI 把所有路都试一遍的代价要低得多。

你的核心竞争力 = 正确的第一个问题 + 快速缩小假设空间 + 知道何时叫停 AI

关联

harness-engineering/overview — Harness Engineering
claude-code/overview — Claude Code
product-trends/vibecoding-success-stories — Vibecoding 成功案例

Vibe Coding 的真实代价 — 当随心编码的应用爆红然后崩了

Vibe Coding 的真实代价 — 当随心编码的应用爆红然后崩了

故事背景：Proof 的诞生与崩溃

随心编码的边界：能做到什么

1. 极快的速度和复杂度

2. Codex（GPT-5.4）的强大表现

3. Every 的 Compound Engineering 插件

随心编码的新瓶颈

瓶颈一：编码模型倾向于局部修补，而非追溯根因

瓶颈二：模型的训练数据不含最新最佳实践

瓶颈三：修复循环耗时随代码库规模线性增长

为什么人类工程师不会消失

核心论点

经验的价值

"分配经济"（Allocation Economy）

立即可应用的行动步骤

1. 在用 AI 写代码前，先让它做充分研究

2. 引导 AI 找根因，而非局部修补

3. 用子 agent 并行化调试工作流

4. 构建你的个人「直觉库」

核心洞察

关联

Sources

Linked from