企业知识提取瓶颈
What it is
企业知识提取瓶颈指组织内部大量 tribal knowledge(部落知识/隐性知识)无法被结构化为 AI 可用的上下文,导致 Agent 部署时"知道该做什么"却"不知道组织怎么做事"。Tom Blomfield、Garry Tan、Aaron Levie 在 2026 年 5 月从不同角度提出同一问题:AI 工具已就绪,但企业知识基础设施严重滞后。
Why it matters
- Blomfield 角度(Monzo/YC):创业公司早期决策依赖创始人直觉,但这些直觉从未被记录。当组织扩大到 100+ 人时,新成员无法复现这些决策逻辑。
- Tan 角度(Y Combinator):YC 孵化的公司普遍存在"知识断裂"——早期员工离职带走关键上下文,后续团队重复犯错。
- Levie 角度(Box):企业级 AI 部署的最大障碍不是模型能力,而是"企业记忆"的碎片化。SLA、合规流程、客户历史分散在 20+ 个系统里,Agent 无法形成统一上下文。
核心矛盾
| 维度 | 现状 | 理想 |
|---|---|---|
| 知识形态 | 邮件、Slack、Notion、会议记录、人脑 | 结构化、可查询、版本化的上下文 |
| 知识所有权 | 分散在个人和部门 | 组织级基础设施 |
| 知识时效性 | 过时的文档 + 无文档的现行做法 | 实时同步的"当前真相" |
| AI 消费方式 | 检索增强生成(RAG)碎片 | 完整的组织认知图谱 |
解决方案方向
- 知识基础设施层:Notion/Confluence → 结构化的 Agent 可消费格式(llms.txt、Markdown API、JSON 端点)
- 对话捕获:将 Slack/Teams 中的决策讨论自动归档为结构化知识
- 决策日志:像记录代码一样记录商业决策(Decision Log)
- 专家萃取:通过访谈将 tribal knowledge 转化为显性知识
与 Harness Engineering 的对应
这与 harness-engineering/overview 中的 "Context Substrate" 概念直接相关:Agent 的能力不仅取决于模型质量,更取决于可用的上下文质量。企业知识提取瓶颈是 "Context Substrate" 在组织层面的具体表现。
Open questions
- 知识结构化是"先整理再接入 AI"还是"让 AI 直接从混乱中学习"?
- 企业是否愿意为知识基础设施付费,还是将其视为成本中心?
- 当 Agent 可以直接读取所有企业数据时,隐私和权限边界如何定义?
Related
- harness-engineering/agent-memory-vs-context-substrate — Agent 记忆与上下文基底
- harness-engineering/overview — Harness Engineering 核心概念
- product-trends/org-design-ai-age — AI 时代的组织设计
- claude-code/claude-code-knowledge-management — Claude Code 的知识管理实践