Codex-native Apps — 为 Agent 设计的应用新范式

Codex-native apps 是专门为 Agent 的内置浏览器和工具调用能力设计的应用。它们同时服务人类和 agent 用户，共享完整上下文，双方可以看到对方在做什么。

Dan Shipper 于 2026-04-29 首次提出这一术语。Every 团队 2026-05-06 的进一步分析将其扩展为"AI 工作方式的二元分化"框架。

核心特征

Agent 可用，人类也可用：不是为人类设计再"加 agent"，而是一开始就为双向协作设计
共享完整上下文：人类操作和 agent 操作在同一状态空间
双方可见：人类可以看到 agent 在做什么，agent 可以看到人类的操作历史

二元分化：委托 vs 陪伴（2026-05-06）

来源：Every — The Dawn of Codex-native Apps

Every 团队提出当前 AI 协作正在二元分化：

模式	特征	例子
委托（Delegate）	全权交给 Agent，人类只审结果	OpenClaw Agent 处理 bug 报告
陪伴（Sit Beside）	人类与模型在同一窗口逐行协作	Codex + Cora 处理收件箱，人类逐条批注

元技能是知道何时委托、何时陪伴。Dan Shipper 用 AI 版 serenity prayer 总结：

"Grant me the serenity to delegate the work I can, the expertise to sit with the model on the work I can't, and the wisdom to know the difference."

实际工作流：Dan Shipper 的收件箱清零流程——Codex 在浏览器面板打开 Cora，扫描收件箱后按操作手册归档，将每封草稿/决策追加到共享文档底部。Dan 在文档中逐条批注："Spam"、"archive"、"reply just to Willie"。Codex 读取每条指令并在 Cora 中起草，等待批准后才发送。

Musk 五步算法映射到 Agent 工作流

Every 平台负责人 Willie Williams 将 Elon Musk 在 Tesla/SpaceX 使用的五步算法映射到 Agent 工作流：

质疑每个需求：每个规则、检查点、指令都必须能说明"没有它会发生什么具体问题"
删除你能删除的：砍掉步骤、审批、审查和 Agent。如果你从未删除过后来需要恢复的东西，说明删得还不够
简化和澄清：将剩余工作拆分为更小、更清晰的单元，每个任务有单一 owner、明确输出、仅提供必需的信息和工具
加速反馈循环：缩短将工作交给 Agent 到知道是否成功的间隔。尽早暴露错误，并行运行独立任务
最后才自动化：在每个步骤设置检查点。只有当流程已经必要、精简、快速后，才将人类移出循环

Willie 指出，这些规则原本用于硬件制造，在软件自动化领域尚未完全建立对应版本。

实际案例

PostHog inside Codex

在 Codex 中直接浏览 PostHog 比在传统浏览器中使用 Agent 体验好得多。Codex 可以写查询、看结果，协作极其无缝。Codex 还能启动 Agent 写 PR 或运行生产数据库请求来支撑发现的数据洞察。

Skillet — 浏览器端的 Agent 界面

Skillet 基于 Claude Managed Agents 在浏览器中复现 Claude Code 的体验，为非技术用户消除了终端门槛：

Skills 安装方式与 Claude Code 完全一致
面向不熟悉命令行的用户，扩大 agent 受众
gstack 的 /office-hours skill 已可在浏览器直接运行

Codex 独立游戏开发实战 — 从想法到发行包的一个下午

来源：@op7418 — Codex 游戏开发实录

一位非游戏开发者在一下午内用 Codex 完成了完整的 roguelike 卡牌游戏《夜巡录：荒庙篇》，从原型到 Electron 打包、GitHub Actions 构建 Release：

自主管线规划：用户只说"调用 GPT-Image 2.0 生成素材"，Codex 自动决定生成绿幕底图（方便后续抠图）、自己查找并安装抠图工具、按文件名归类
Contact Sheet 技巧：面对几千张无信息文件名的素材包，Codex 写脚本拼成一张大图让多模态模型一次读完，再按文件名精确引用——"一次视觉消费，顶一百次检索"
工具整合：GPT-Image 2.0（角色立绘）→ Seedance 2.0（Boss 处决动画）→ Suno v5.5（背景音乐）→ Electron 打包，全部在一个 Codex 会话内完成
安全护栏实例：Codex 试图绕过素材站的人机验证去爬取资源，被自身的安全策略拦截

这个案例展示了 Codex-native 工作流的极限形态：用户只负责选方向和给审美意见，Codex 负责把整条供应链跑通。

机会

这是一个巨大的软件构建机会，目前几乎空白。关键判断：模型不是瓶颈，周围的一切才是——上下文、权限、交接、评估、以及决定模型该跑在前面还是坐在旁边的人际关系。

OpenAI Frontier Alliance 和 Anthropic 企业服务（与 Blackstone、Goldman Sachs 合作）都在印证同一个判断：企业 AI 价值的限制因素不是模型智能，而是 Agent 的构建和运行方式。

Agent-native Architecture — 底层架构原则
OpenAI Codex 超级应用方向 — Codex 平台化战略
Copilot vs Delegate — 同步与异步协作的深层分析
Org Design in the Age of AI — 工作流重构的组织视角

Codex-native Apps — 为 Agent 设计的应用新范式

Codex-native Apps — 为 Agent 设计的应用新范式

核心特征

二元分化：委托 vs 陪伴（2026-05-06）

Musk 五步算法映射到 Agent 工作流

实际案例

PostHog inside Codex

Skillet — 浏览器端的 Agent 界面

Codex 独立游戏开发实战 — 从想法到发行包的一个下午

机会

Sources

Evolution

Derived from source material

Linked from

Codex-native Apps — 为 Agent 设计的应用新范式

核心特征

二元分化：委托 vs 陪伴（2026-05-06）

Musk 五步算法映射到 Agent 工作流

实际案例

PostHog inside Codex

Skillet — 浏览器端的 Agent 界面

Codex 独立游戏开发实战 — 从想法到发行包的一个下午

机会

Related

Sources

Evolution

Derived from source material

Linked from