Back/product trends

计算机使用 Agent 的全面爆发 — 从 CLI 到 GUI

Updated 2026-04-10
2 min read
265 words

计算机使用 Agent 的全面爆发 — 从 CLI 到 GUI

来源:Ben's Bites Newsletter,2026-02-26

核心论点

Agent 从使用 CLI 到像人类一样使用图形界面,是"下一个大事件"。

Cursor、Perplexity、Google 三家同时在同一周发布计算机使用能力,这不是巧合,而是行业共识的爆发点

行业动态

多条新闻同时指向同一方向

公司 动作
Cursor Agent 现在可以用计算机测试自己的工作,并返回视频演示
Cursor 收购了 Autotab
Anthropic 收购了 Vercept
Perplexity 发布了 Perplexity Computer,配备研究、设计、代码等工具的通用 Agent
Google 在三星 Galaxy S26 发布会上预览了 Gemini 在 Android 上自主点餐的演示

两笔收购的目标都是改善"计算机使用 Agent"能力。

Ben 的判断

"Agent 从使用 CLI 到像人类一样使用图形界面,是'下一个大事件'。"

Anthropic 的安全政策与军事合同争议

Anthropic 修订了"负责任扩展政策(RSP)v3":

  • 新版本被外界解读为更为灵活
  • 潜在地允许公司在超出原定安全边界的情况下继续开发新模型
  • 引发外界对其安全承诺是否在商业压力下松动的讨论

美国国防部希望获得对 Claude 更宽松的访问权限:

  • Anthropic 以两条原则为由拒绝:
    • 不支持自主武器系统
    • 不支持对美国公民的大规模监控
  • 若坚守立场,Anthropic 将面临损失一份 2 亿美元政府合同的风险

两件事放在一起: 折射出前沿 AI 公司在商业扩张与安全承诺之间越来越难以调和的张力。

产品更新

Claude 新增功能

Claude Cowork 中的 Schedule Tasks:

  • 企业用户可以为 Cowork 创建插件并在组织内共享

Claude Code 远程控制能力:

  • 在终端启动的 Claude Code 会话
  • 可以通过 Claude 移动端或网页端远程访问
  • 同时保持在原始机器上运行

其他工具

Notion 自定义 Agent:

  • 可自主分类、回答问题、生成报告
  • 支持按计划或 24/7 运行

Quiver AI:

  • 专注于矢量图形(SVG)的生成、编辑和动画
  • 在曲线图像处理上远优于 Gemini

Paper:

  • 一个供 Cursor、Claude Code、Codex 使用的设计画布
  • Agent 可以直接读写 HTML 到其中

可应用要点

立即行动

1. 启用 Claude Code 远程控制

  • 如果你在服务器或本地机器上运行 Claude Code
  • 现在可以通过手机或网页端远程监控和介入
  • 这对于长时间运行的 Agent 任务管理非常实用

2. 测试 Perplexity Computer

  • 研究+代码+设计一体化的工作流值得亲身体验
  • 可用于评估其替代现有工作流中某些手动环节的可行性

3. 关注 Notion Agent 的企业应用场景

  • 支持 24/7 运行和按计划触发
  • 对于有内部知识库管理需求的团队,这是一个低门槛的 Agent 落地入口

4. 用 Paper 优化 Agent 设计工作流

  • 如果你在用 Cursor 或 Claude Code 生成前端代码
  • Paper 提供了可供 Agent 直接读写的设计画布
  • 可以大幅减少"代码生成→人工调整设计"的来回摩擦

核心洞察

"Agent 从 CLI 到 GUI 的跃迁"

任何依赖图形界面操作的工作流(填表、截图、点击按钮),在未来 12 个月内都可能被 Agent 替代。

对于产品团队而言:

  • 现在应该开始盘点自己的工作流中有哪些"鼠标点击"环节
  • 提前规划自动化方案

关联

Sources

Linked from