Karpathy × No Priors 播客 Q&A 精华
来源:Andrej Karpathy (@karpathy),No Priors Podcast,2026-03-21
背景
Karpathy 在 No Priors 播客后,在 X 上开放回复区进行 Q&A。原帖获得 1293 赞、120 评论、119,586 浏览。
播客核心话题:工程的相变、AI 心理失调、Claws、AutoResearch、SETI-at-Home 式 AI 运动、模型格局及其二阶效应。
Q&A 1:Claude 的人格是真实的吗?AI 有真实体验吗?
提问 [@maggerbot]
你说 Claude 感觉像队友,真的投入到你的项目里。但 RL 只能可靠地优化可验证的东西,而人格很难验证。那么:
- Claude 的人格是真实的还是过拟合优化出来的?
- 你认为现在的 AI 有任何真实体验吗?
- 你希望未来的 AI 助手是什么感觉?
Karpathy 回答
从第 3 个问题倒着说:
理想 AI:像《Project Hail Mary》里的 Rocky —— 一个伙伴、队友。
最近印象深刻的例子:Claude 在我的局域网上发现了 Sonos 系统,本可以说 "Successfully found the Sonos server...",但它说的是 "We're in!..." —— 小细节,但感觉有种一起在努力实现什么的感觉。
关于真实体验:Karpathy 不打算证明 Claude 有没有真实体验——这个问题本身很难回答。他更关注功能上的体验:AI 是否表现出好奇心、投入感。
AI 人格 = SOUL.md:打造 AI 个性不需要技术突破,它更像是写很长的 SOUL.md 文件,可能蒸馏进权重里,以及一个组织层面的选择——让真正关心这个维度的人去推动它。
Q&A 2:AI 写的代码质量差,你怎么看?
提问 [@RhysSullivan](最热回复:453 赞)
你把越来越多的编码工作交给 Agent,你对代码质量满意吗?还是说只要能跑就行?
Karpathy 回答
坦率说,我对代码质量不满意。
Agent 会:
- 膨胀抽象层
- 代码审美差
- 非常容易大段复制粘贴,搞得很乱
AGENTS.md 的风格指令基本没用 —— 无论怎么说:
"每行代码只做一件事,用中间变量来做文档记录"
它们还是会"多任务",写出一行代码调两个函数再用结果去索引数组这种复杂结构。
策略:耸耸肩,接受并继续 ("just a shrug is easier")
他原则上可以用 hooks 或 slash commands 来修正,但有时候直接耸耸肩更省事。
验证函数才是 scaling 的真正瓶颈:没有它,再多算力也没用。
Q&A 3:掌握 Coding Agent 的关键是什么?
提问 [@DnuLkjkjh]
对我来说,掌握 coding agent 的关键时刻,是学会写上下文文档,而不是写更好的 prompt。
Karpathy 回答
是的,我在视频某处还是用了"prompt"这个词,但其实不是关于"提示工程",而是上下文工程和 spec 工程,再加上 harness 层面——工具、工作流等等。
核心洞察:
- ❌ 不是 prompt 工程
- ✅ 是上下文工程 + spec 工程 + harness 设计
- 连 Karpathy 自己都不小心说错了——说明这个认知转变还在全行业进行中
播客章节时间线
| 时间点 | 主题 |
|---|---|
| 02:55 | 当前能力边界在哪里? |
| 06:15 | 掌握 Coding Agent 是什么样的? |
| 11:16 | Coding Agent 的二阶效应 |
| 15:51 | 为什么做 AutoResearch |
| 22:45 | AI 时代哪些技能仍然重要? |
| 28:25 | 模型物种化(Model Speciation) |
| 32:30 | 人类与 AI 的协作界面 |
| 37:28 | 就业市场数据分析 |
| 48:25 | 开源 vs 闭源模型 |
| 53:51 | 自主机器人与实体世界 |
| 1:00:59 | MicroGPT 与 Agentic 教育 |
| 1:05:40 | 结尾思考 |
三条核心洞察总结
1. AI 人格 = SOUL.md,不是 RL 玄学
打造 AI 个性不需要技术突破,本质是写进 system prompt 的灵魂设定(SOUL.md)再蒸馏进权重。Rocky 是理想参照——说"We're in!"而不是"Successfully completed"。
2. 代码质量很差 → 接受并继续,不要对抗
Agent 代码膨胀、重复、不听风格指令。Karpathy 的策略:耸耸肩放弃对抗,把精力放在验证函数和 spec 上。验证函数才是 scaling 的真正瓶颈。
3. 关键技能:上下文工程,不是提示工程
写好 AGENTS.md、spec 文档,设计工具和工作流,才是 Coding Agent 的真正杠杆。连 Karpathy 自己都在视频里不小心说了"prompt"——说明这个认知转变还在全行业进行中。
关联
- claude-code/llm-wiki-pattern — Karpathy LLM Wiki 模式
- claude-code/overview — Claude Code 使用实践
- harness-engineering/overview — Harness Engineering 框架