Project Glasswing — AI 安全合作倡议
Project Glasswing 是 Anthropic 于 2026 年 4 月发起的跨行业合作倡议,旨在利用 Claude Mythos Preview 保护关键软件基础设施。
核心机制
资源投入
| 项目 | 金额 |
|---|---|
| 模型使用额度 | $100M |
| 开源安全组织捐赠 | $4M |
| 总计 | $104M |
合作伙伴(40+ 家)
12 家大型企业:AWS、Apple、Google、Microsoft、Cisco、CrowdStrike、JPMorgan Chase、Broadcom、Linux Foundation、NVIDIA、Palo Alto Networks 等
40+ 关键基础设施组织参与
合作伙伴评价摘录:
- Cisco: "AI 能力已跨过根本性改变保护关键基础设施紧迫性的门槛"
- AWS: "每天分析超过 400 万亿个网络流量以寻找威胁"
- Microsoft: "在 CTI-REALM 开源安全基准测试中,Mythos Preview 相比前代模型有显著提升"
- CrowdStrike: "漏洞被发现到被对手利用的窗口已崩溃——过去需要数月,现在 AI 只需几分钟"
- Palo Alto Networks: "这些模型需要交到开源所有者和防御者手中,在攻击者获得访问之前找到并修复漏洞"
运作方式
- Mythos Preview 不向合作伙伴收费
- 通过 Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 提供访问
- 发现的漏洞首先报告给维护者,修复后才公开细节
- 部分漏洞细节以加密哈希形式发布,修复后揭示具体内容
- 90 天公开报告:将分享漏洞修复和改进
定价(研究预览期后)
| 类型 | 价格 |
|---|---|
| 输入 token | $25 / 百万 |
| 输出 token | $125 / 百万 |
安全研究新模式
预防性防御
在攻击者获得类似能力之前,先发制人地识别和修复漏洞。
行业协作
竞争对手(Google、Microsoft、Apple)在网络安全威胁面前放下分歧共同合作。
负责任披露
建立处理 AI 发现的高危漏洞的流程:
- AI 发现漏洞
- 报告给软件维护者
- 维护者修复
- 修复后公开细节
意义
Project Glasswing 代表了 AI 安全领域的新范式:
- 防御性 AI:将超能力模型用于防御而非攻击
- 协作安全:行业内竞争对手在生存威胁面前合作
- 模型治理:展示如何在限制潜在滥用的同时发挥强大 AI 能力的价值
Counterpoints & Gaps
- 覆盖范围:40 家合作伙伴能否覆盖足够广泛的软件生态?
- 响应速度:软件维护者能否及时修复 AI 发现的大量漏洞?
- 攻击者优势:防御者发现漏洞的速度能否赶上攻击者利用 AI 发现漏洞的速度?