浏览器与电脑操作代理 — 让 AI 替你点网页
Claude Computer Use、OpenAI Operator、Browser Use、Skyvern、MultiOn、Manus、Reworkd、Comet:托管 vs 开源 vs 浏览器内一张图看完。
本合集收录的工具
- Claude Computer Use
Anthropic 推出的让 Claude 看屏并操作电脑的能力(API 形态),可在沙盒桌面内点击、输入与执行多步任务。生产环境建议配合 VM 隔离与人工确认。
浏览器 / 桌面代理 - OpenAI Operator
OpenAI 推出的云端浏览器代理产品(随版本演进而整合到 ChatGPT Agent),可在远程浏览器中替用户操作网站。具体产品命名与地区可用性以官网为准。
浏览器 / 桌面代理 - Browser Use
开源的浏览器代理框架,让 LLM 通过结构化 DOM 操作网页,完成表单、抓取与多步骤任务,常被用作 Operator / Computer Use 的自部署替代。对工程能力有要求。
浏览器 / 桌面代理 - Skyvern
开源浏览器代理平台,结合计算机视觉与 LLM 做表单填写、多步流程与工作流编排,适合后台运营自动化。需评估反爬对抗与网站服务条款。
浏览器 / 桌面代理 - MultiOn
面向消费者与开发者的浏览器代理,可通过自然语言执行购物、预订等任务,提供 API 与浏览器扩展。商业任务请关注错误动作的回滚机制。
浏览器 / 桌面代理 - Manus
Manus(manus.im)定位为通用型 AI 代理产品,常见宣传点多在浏览器自动化、研究总结与多步骤任务交付(如报告、表格、代码仓库草稿等)。本站仅提供中立摘录与外链入口;任务边界、数据留存、是否训练模型、可用国家/地区与计费规则请务必以 Manus 官网及当期用户协议为准,涉及敏感数据前宜做独立合规评估。
浏览器 / 桌面代理 - Reworkd
面向数据抓取场景的代理平台,结合代码生成与托管运行把「把这个网站变成 API」做成一条流水线,适合业务数据聚合团队。合规请核对目标站点 ToS。
浏览器 / 桌面代理 - Comet
Perplexity 推出的浏览器产品方向之一(名称与功能随版本迭代),强调在浏览过程中集成 AI 摘要与追问,适合重度网页阅读用户。具体能力以官方最新发布为准。
搜索 / 研究
本合集相关 MCP 服务器
可在 Claude / Cursor / Zed 等 MCP 客户端配置后直接调用,用来给代理接上外部工具、数据源或执行环境。
- Playwright官方
Microsoft 出品的 Playwright MCP 服务器,功能覆盖比 Puppeteer 更广,适合跨浏览器自动化与复杂表单流程代理。
浏览器 / 桌面代理stdioMicrosoft - Puppeteer官方
官方参考 MCP 服务器:让代理以无头 Chrome 浏览页面、点击元素、截屏。适合 scraping 与 UI 测试类代理;爬取请遵守目标站点条款。
浏览器 / 桌面代理stdioModel Context Protocol - Firecrawl官方
Firecrawl MCP 服务器:把网页抓取与结构化提取做成可调用工具,适合内容抓取与 KB 构建代理。遵守目标站 robots 与服务条款。
搜索 / 研究stdioMendable / Firecrawl