全员 Token-Maxxing — 硅谷 2026 年的军备竞赛
来源:晚点团队访谈五源资本合伙人孟醒(2026-04-26)
概念定义
"Token-Maxxing"指 2026 年硅谷各大公司围绕 AI token 消耗展开的全员竞赛——从代码生产到内部排行榜,token 消耗量本身被当作生产力指标。这一概念由五源资本孟醒提出,描述硅谷正在用旧规则的最大化策略应对 AI 时代的全新游戏。
核心观察
Meta 的 token 排行榜
- 全员使用 Claude Code,内部设立 token 消耗排行榜
- 工程师年度 token 预算据传 20 万美元
- 一边砸 token 一边裁员上万人
- 代码安全红线被效率优先压倒
YC 沦为滞后指标
- W26 batch 80% 是垂直 agent
- 5 个月迭代速度让项目在 Demo Day 前已失去投资价值
- YC 的 batch 制度按"月"设计,但 AI 时代需要按"周"感知变化
xAI 的雪崩
- 早期团队走了 90%
- 马斯克从 SpaceX/特斯拉调人接管
- 制造业管理思维不适合大模型公司——缺少全局规划,只有脉冲式冲刺
Gary Tan 的 Tokenmaxxing 实践(2026-05-11)
来源:YC CEO Gary Tan — Tokenmaxxing
从 400 万美元到 200 美元
Gary Tan 用 Claude Code Max 账号,花 200 美元和约 5 天,做出带 RAG 和 agentic retrieval 的博客系统。同一项目第一次做花了约 400 万美元、6-7 个人、18 个月。
Tokenmaxxing 的操作定义
"如果有增量工作能让东西更完整、更好,你就应该 token max。"
Gary 把"写文章"拆成了收集、交叉验证、提炼和发布四个可自动化环节。过去人要花一个月读完的材料,现在可以花更多 token,让机器读 20 个来源,标出 13 个一致观点和 7 个反对观点。
工作流工程细节
| 环节 | 做法 |
|---|---|
| 规划 | 开工前画 ASCII 图(数据流、状态机、用户路径) |
| 品味前置 | Brian Chesky 的 10-star experience 方法 + 10x check |
| 多轮审稿 | 产品、设计、工程、测试四视角 |
| 浏览器 QA | 封装 Playwright,自动判断界面/数据变更并检查 |
| Claude + Codex 分工 | Claude 当 ADHD CEO(想象、推进),Codex 当 200 IQ CTO(硬核问题) |
测试覆盖率作为护栏
Gary 要求 80%-90% 测试覆盖。没有测试就把用户扔进去,他直接称为 slop——比人写的烂代码更危险,因为你不知道它会在什么边界坏掉。
控制权的分水岭
Gary 把个人 AI 的控制权问题拉到了核心:未来每个人都会有自己的 AI,问题在于它到底属于谁。个人电脑革命给人的礼物是每个人可以拥有自己的计算机;个人 AI 革命也会提出同样的问题。
两种 Tokenmaxxing 的对比
| 维度 | 孟醒的观察 | Gary Tan 的实践 |
|---|---|---|
| 视角 | 宏观投资/产业 | 微观个人工作流 |
| 核心矛盾 | 100x 效率 vs 1x 营收 | 时间稀缺 vs 机器时间无限 |
| 组织形态 | 公司级 token 军备竞赛 | 个人级 workflow 工程 |
| 关键指标 | token 消耗排行榜 | 可交付产出 / 测试覆盖率 |
| 风险 | 安全红线被效率压倒 | slop(无测试的 AI 生成代码) |
核心矛盾:100 倍效率悖论
效率提升了 100 倍,但营收只增长 50% 或 1 倍。差距在哪?
孟醒的判断:DCF 估值模型失效——terminal value 假设公司稳定经营,但 AI 随时可能颠覆一切。SaaS 第一个被重新定价。这与 SaaS Extinction、软件护城河是假的、Token Optimization Economics 形成同一组观察。
Gary Tan 的视角补充了另一面:时间最贵的人,最需要把重复劳动交给机器;时间最多的人,也可以用机器时间更快试错。 Token 的意义不只是生成更多文本,而是把一个人能同时推进的探索数量放大。
安全焦虑的副产品
- Sam Altman 家被扔燃烧瓶、开枪袭击
- 反 AI 游行
- 参议员警告"人类可能失去对星球的控制"
- AI 末日论意识形态向现实暴力外溢——参见 ai-ecosystem/ai-doomer-ideology-violence
Counterpoints & Gaps
孟醒的"100 倍效率 vs 50% 营收"对比来源待考。如果 token 消耗高速增长但营收滞后,可能源于:
- 测试/迭代阶段的 token 是 capex 不是 opex
- 旧产品定价体系还没把 AI 价值翻译给客户
- 真正的 AI native 公司还没产生
Gary Tan 的 400x 工作量说法也引发争议——行数不是完美指标。但他用工具去掉空行和注释后计算 logical lines of code,结果倍数反而更高。
需要后续观察:是否会出现"Token 利用率"指标,把消耗和价值产出挂钩。
Related
- product-trends/token-optimization-economics — Token 经济学的需求-供给视角
- harness-engineering/extreme-harness-engineering-token-billionaires — 1B Tokens/Day 的 harness 工程
- ai-ecosystem/h100-price-surge — 算力价格逆势上涨
- ai-ecosystem/dylan-patel-token-supply-demand-2026 — Token 供需死局