分类
浏览器与桌面代理丨让 AI 替你操作网页与应用
Browser Use、Skyvern、Claude Computer Use、OpenAI Operator、Manus 等:让模型点网页、填表单、跑流程。
这是 2025 年开始跑起来的「**让模型操作 GUI 而不是仅调 API**」路线。常见形态有三种:**浏览器内扩展**(Comet 等)、**云端虚拟桌面**(Operator、Claude Computer Use)、**开源自部署**(Browser Use、Skyvern、Reworkd)。选型先问三件事:要不要**持续在用户环境跑**、错误动作的**回滚与审计**怎么做、**凭据管理**(Cookie、2FA、SSO)是否隔离到最小权限。
检索与补充说明
浏览器代理和 RPA 有什么区别?
RPA 多为脚本化、基于坐标/控件规则;浏览器代理由 LLM 规划动作,具备一定的适应性但更不确定。面对 100% 确定流程请继续用 RPA;面对「页面会变」或半结构化数据,浏览器代理更合适。
Operator、Claude Computer Use 可以托付敏感账号吗?
生产场景建议先用一次性凭据、最小权限会话与沙盒 VM;启用前读完数据留存与训练条款,关键操作加人类确认。
开源自部署(Browser Use、Skyvern)适合谁?
适合需要定制策略、把凭据留在内网、或做批量爬虫/工单处理的团队。稳定性与反爬对抗通常仍需工程投入。
本类工具
简介与官网以各工具详情页为准;可在同类条目间交叉浏览。
Manus(manus.im)定位为通用型 AI 代理产品,常见宣传点多在浏览器自动化、研究总结与多步骤任务交付(如报告、表格、代码仓库草稿等)。本站仅提供中立摘录与外链入口;任务边界、数据留存、是否训练模型、可用国家/地区与计费规则请务必以 Manus 官网及当期用户协议为准,涉及敏感数据前宜做独立合规评估。
开源的浏览器代理框架,让 LLM 通过结构化 DOM 操作网页,完成表单、抓取与多步骤任务,常被用作 Operator / Computer Use 的自部署替代。对工程能力有要求。
开源浏览器代理平台,结合计算机视觉与 LLM 做表单填写、多步流程与工作流编排,适合后台运营自动化。需评估反爬对抗与网站服务条款。
面向消费者与开发者的浏览器代理,可通过自然语言执行购物、预订等任务,提供 API 与浏览器扩展。商业任务请关注错误动作的回滚机制。
Anthropic 推出的让 Claude 看屏并操作电脑的能力(API 形态),可在沙盒桌面内点击、输入与执行多步任务。生产环境建议配合 VM 隔离与人工确认。
OpenAI 推出的云端浏览器代理产品(随版本演进而整合到 ChatGPT Agent),可在远程浏览器中替用户操作网站。具体产品命名与地区可用性以官网为准。
面向数据抓取场景的代理平台,结合代码生成与托管运行把「把这个网站变成 API」做成一条流水线,适合业务数据聚合团队。合规请核对目标站点 ToS。