Codex-native Apps — 为 Agent 设计的应用新范式
Codex-native apps 是专门为 Agent 的内置浏览器和工具调用能力设计的应用。它们同时服务人类和 agent 用户,共享完整上下文,双方可以看到对方在做什么。
Dan Shipper 于 2026-04-29 首次提出这一术语。Every 团队 2026-05-06 的进一步分析将其扩展为"AI 工作方式的二元分化"框架。
核心特征
- Agent 可用,人类也可用:不是为人类设计再"加 agent",而是一开始就为双向协作设计
- 共享完整上下文:人类操作和 agent 操作在同一状态空间
- 双方可见:人类可以看到 agent 在做什么,agent 可以看到人类的操作历史
二元分化:委托 vs 陪伴(2026-05-06)
来源:Every — The Dawn of Codex-native Apps
Every 团队提出当前 AI 协作正在二元分化:
| 模式 | 特征 | 例子 |
|---|---|---|
| 委托(Delegate) | 全权交给 Agent,人类只审结果 | OpenClaw Agent 处理 bug 报告 |
| 陪伴(Sit Beside) | 人类与模型在同一窗口逐行协作 | Codex + Cora 处理收件箱,人类逐条批注 |
元技能是知道何时委托、何时陪伴。Dan Shipper 用 AI 版 serenity prayer 总结:
"Grant me the serenity to delegate the work I can, the expertise to sit with the model on the work I can't, and the wisdom to know the difference."
实际工作流:Dan Shipper 的收件箱清零流程——Codex 在浏览器面板打开 Cora,扫描收件箱后按操作手册归档,将每封草稿/决策追加到共享文档底部。Dan 在文档中逐条批注:"Spam"、"archive"、"reply just to Willie"。Codex 读取每条指令并在 Cora 中起草,等待批准后才发送。
Musk 五步算法映射到 Agent 工作流
Every 平台负责人 Willie Williams 将 Elon Musk 在 Tesla/SpaceX 使用的五步算法映射到 Agent 工作流:
- 质疑每个需求:每个规则、检查点、指令都必须能说明"没有它会发生什么具体问题"
- 删除你能删除的:砍掉步骤、审批、审查和 Agent。如果你从未删除过后来需要恢复的东西,说明删得还不够
- 简化和澄清:将剩余工作拆分为更小、更清晰的单元,每个任务有单一 owner、明确输出、仅提供必需的信息和工具
- 加速反馈循环:缩短将工作交给 Agent 到知道是否成功的间隔。尽早暴露错误,并行运行独立任务
- 最后才自动化:在每个步骤设置检查点。只有当流程已经必要、精简、快速后,才将人类移出循环
Willie 指出,这些规则原本用于硬件制造,在软件自动化领域尚未完全建立对应版本。
实际案例
PostHog inside Codex
在 Codex 中直接浏览 PostHog 比在传统浏览器中使用 Agent 体验好得多。Codex 可以写查询、看结果,协作极其无缝。Codex 还能启动 Agent 写 PR 或运行生产数据库请求来支撑发现的数据洞察。
Skillet — 浏览器端的 Agent 界面
Skillet 基于 Claude Managed Agents 在浏览器中复现 Claude Code 的体验,为非技术用户消除了终端门槛:
- Skills 安装方式与 Claude Code 完全一致
- 面向不熟悉命令行的用户,扩大 agent 受众
- gstack 的 /office-hours skill 已可在浏览器直接运行
Codex 独立游戏开发实战 — 从想法到发行包的一个下午
一位非游戏开发者在一下午内用 Codex 完成了完整的 roguelike 卡牌游戏《夜巡录:荒庙篇》,从原型到 Electron 打包、GitHub Actions 构建 Release:
- 自主管线规划:用户只说"调用 GPT-Image 2.0 生成素材",Codex 自动决定生成绿幕底图(方便后续抠图)、自己查找并安装抠图工具、按文件名归类
- Contact Sheet 技巧:面对几千张无信息文件名的素材包,Codex 写脚本拼成一张大图让多模态模型一次读完,再按文件名精确引用——"一次视觉消费,顶一百次检索"
- 工具整合:GPT-Image 2.0(角色立绘)→ Seedance 2.0(Boss 处决动画)→ Suno v5.5(背景音乐)→ Electron 打包,全部在一个 Codex 会话内完成
- 安全护栏实例:Codex 试图绕过素材站的人机验证去爬取资源,被自身的安全策略拦截
这个案例展示了 Codex-native 工作流的极限形态:用户只负责选方向和给审美意见,Codex 负责把整条供应链跑通。
机会
这是一个巨大的软件构建机会,目前几乎空白。关键判断:模型不是瓶颈,周围的一切才是——上下文、权限、交接、评估、以及决定模型该跑在前面还是坐在旁边的人际关系。
OpenAI Frontier Alliance 和 Anthropic 企业服务(与 Blackstone、Goldman Sachs 合作)都在印证同一个判断:企业 AI 价值的限制因素不是模型智能,而是 Agent 的构建和运行方式。
Related
- Agent-native Architecture — 底层架构原则
- OpenAI Codex 超级应用方向 — Codex 平台化战略
- Copilot vs Delegate — 同步与异步协作的深层分析
- Org Design in the Age of AI — 工作流重构的组织视角