Categoría
Browser & computer-use agents — let AI drive web and desktop apps
Browser Use, Skyvern, Claude Computer Use, OpenAI Operator, Manus and more—models that click pages, fill forms, and run workflows.
This lane, “**drive the GUI instead of only calling APIs**”, broke out in 2025. Three shapes are common: **in-browser extensions** (Comet, etc.), **hosted virtual desktops** (Operator, Claude Computer Use), and **open-source self-hosted** (Browser Use, Skyvern, Reworkd). Ask three questions up front: does it run in the user’s live environment, how do wrong actions **roll back and audit**, and how are **credentials** (cookies, 2FA, SSO) scoped down?
Editorial / GSC
Browser agents vs RPA
RPA is scripted against fixed widgets/coords. Browser agents plan with an LLM and adapt better but are less deterministic. Use RPA for 100%-fixed flows and browser agents when pages shift or data is semi-structured.
Can I trust Operator/Claude Computer Use with sensitive accounts?
Use ephemeral credentials, least-privilege sessions, and sandboxed VMs. Read retention and training clauses; gate critical actions behind a human confirm.
Who should self-host (Browser Use, Skyvern)?
Teams that need custom policies, keep credentials on-prem, or run high-volume scraping/ticket work. Stability and anti-bot resilience still take engineering.
Herramientas en esta categoría
Los resúmenes y enlaces oficiales están en cada ficha; navega otras entradas de la misma categoría.
Asistente autónomo de propósito general de Manus AI: delega tareas de navegación e investigación en varios pasos tras un chat—límites, regiones y datos en el sitio.
Framework open source de agente de navegador que controla páginas vía DOM estructurado—alternativa self‑host a Operator/Computer Use.
Skyvern: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.
MultiOn: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.
Capacidad de Claude (Anthropic) para ver la pantalla y operar un ordenador vía API—en producción usa VMs aisladas, credenciales acotadas y confirmación humana.
Agente de navegador en la nube de OpenAI (en integración con ChatGPT Agent)—nombre y regiones actuales en el sitio oficial.
Reworkd: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.