Skip to content
Back/AI Ecosystem

CrabTrap — Agent 安全 HTTP 代理

View in Graph
Updated 2026-04-23
2 min read
275 words

CrabTrap

来源:Brex / Pedro,2026-04-21

概述

CrabTrap 是 Brex 开源的 HTTP/HTTPS 代理,用于拦截 AI agent 发出的每个网络请求,并使用 LLM-as-a-judge 判断该请求是否符合该 agent 的允许流量策略。它旨在解决 agent 部署到生产环境时的核心安全难题:agent 需要真实凭证(API keys、OAuth tokens),但可能产生幻觉 destructive actions 或被 prompt-injected。

为什么现有方案不够

方案 局限
MCP gateways 只覆盖使用 MCP 协议的流量
LLM provider guardrails 绑定单一模型,不透明,难以自定义策略
NVIDIA OpenShell 偏向 per-sandbox egress control

Brex 的观察:虽然 OpenClaw 是 GitHub 上增长最快的项目,但企业成功部署案例极少。CrabTrap 是 Brex 为改变这一现状而构建的基础设施。

架构:两阶段评估

Stage 1:静态规则

对 URL 进行确定性模式匹配(prefix、exact、glob),可限定 HTTP 方法。Deny 规则永远优先。静态规则编译为 cached regexps,微秒级执行。

Stage 2:LLM-as-a-judge

若静态规则未匹配,请求进入 LLM judge。Judge 接收完整请求上下文 + 分配给该 agent 的自然语言策略,返回结构化 JSON 决策(ALLOW 或 DENY)及原因。

Agent Request → CrabTrap Proxy
                ├── Static Rules (match → ALLOW/DENY)
                └── LLM Judge (unmatched → ALLOW/DENY + reason)

传输层拦截

设置 HTTP_PROXYHTTPS_PROXY 环境变量,无需 SDK、wrapper 或 per-tool 集成。对于 HTTPS,CrabTrap 执行 TLS interception:生成自签 CA 证书 per host,与客户端协商 TLS,再与上游建立独立 TLS 连接。可配合 iptables 规则阻止绕过代理的直接出站连接。

防 Prompt Injection 设计

Judge 接收的请求以结构化 JSON 呈现(method、URL、headers、body),用户控制内容被 escape 而非作为 raw text 插值。安全相关 headers 优先处理,总 header 内容限制 4KB;body 截断至 16KB 并附带警告;multipart 请求替换为结构化 summary。

策略生成与评估

Policy Builder(Agentic Loop)

不先写规则再希望匹配现实,而是观察现实并推断策略:

  1. 分析 agent 历史流量
  2. 采样代表性网络调用
  3. 起草匹配真实行为的策略

Eval System

在策略上线前,CrabTrap 可 replay 历史审计日志对抗 draft policy,报告哪些决策会变化。结果可按 method、URL、原决策、一致状态切片。并发 judge 调用使 replay 数千请求在几分钟内完成。所有历史请求记录于 PostgreSQL,通过 admin API 和 web dashboard 查询。

生产实践经验

  1. 从流量推导的策略出奇地强。 指向几天真实流量产生的策略在绝大多数 held-out 请求上匹配人类判断。从观察行为出发并编辑 down,远比从空白页开始有效。

  2. Latency 是首个被问到的问题,但结果是非问题。 Agent 很快 settle into predictable traffic patterns,高流量模式变为静态规则后,LLM judge 只在长尾陌生端点触发。一个生产用例中,LLM 激活率低于 3%。

  3. Proxy 成为发现工具,不仅是执行工具。 审计轨迹首次让 agent 产生的 noise 可见。Brex 开始用 denial logs 和流量分析不仅调整策略,还回去收紧 agent 本身——移除工具、砍掉整类浪费时间和 token 的请求。

开源动机

CrabTrap 是实验性的。Brex 开源的三个原因:

  • 它是有用的基础设施——Brex 开始时没找到安全部署 harness 的方案
  • 更多用户 surface 更多 edge cases 和模式
  • 未来方向包括更深认证功能(SSO、RBAC)、escalation workflows、从 denial 模式推导策略建议

关联

Sources

Synthesized from 1 source
  • CrabTrap: an LLM-as-a-judge HTTP proxyPrimary source for this page.Whole pagehighbody

Evolution

1 event
  1. absorbed

    Derived from source material

    This page is currently synthesized from 1 source.

    From CrabTrap: an LLM-as-a-judge HTTP proxyTo CrabTrap — Agent 安全 HTTP 代理
    Sources: raw/to-learn/CrabTrap an LLM-as-a-judge HTTP proxy to secure agents in production.md

Linked from