
openbrowser-ai
billy-enrizkyMIT
233 звёзд19 форков
OpenBrowser — это MCP-сервер для автоматизации браузера через AI-агента. Вы формулируете задачу на естественном языке, а сервер пишет асинхронный Python-код, запускает его и управляет браузером через Chrome DevTools Protocol. Вместо жёстких скриптов и селекторов — гибкое агентное поведение.
Сервер решает задачи парсинга, тестирования и рутинных операций в браузере. Он подойдёт разработчикам и DevOps-инженерам, которые хотят автоматизировать сложные сценарии на сайтах без написания кода вручную. OpenBrowser поддерживает несколько LLM-провайдеров и может работать с облачными и локальными моделями. В хостированной версии доступна облачная панель для управления сессиями и планирования задач. Список ожидания открыт.
Установка
uvx openbrowser-aiХарактеристики
Общее
- СтатусСообщество
- Разработчикbilly-enrizky
- ЛицензияMIT
Технологии
- ЯзыкиPython
- Транспортstdio
Описание
Возможности
- Генерирует и выполняет асинхронный Python-код для управления браузером на основе текстового запроса
- Переходит по ссылкам, кликает по элементам и заполняет формы на веб-страницах
- Извлекает структурированные данные со страниц и возвращает их в ответ
- Управляет браузером напрямую через Chrome DevTools Protocol (CDP)
- Сохраняет cookies и состояние сессии между запусками (в облачной версии — через веб-панель)
- Поддерживает провайдеров: OpenAI, Anthropic, Google Gemini, OpenRouter
- Включает модули OpenClaw для автоматического сбора данных и OpenCode для выполнения кода
- Работает через MCP-протокол (stdio) и как CLI-инструмент
- Планирует фоновые задачи по расписанию в хостированной версии
- Сохраняет переменные и контекст между шагами в persistent namespace
Как подключить
Установите сервер с помощью пакетного менеджера uv:
uvx openbrowser-ai
Добавьте сервер в конфигурацию MCP-клиента (например, Claude Desktop). Укажите команду и API-ключ для используемой языковой модели:
{"mcpServers": {"openbrowser-ai": {"command": "uvx", "args": ["openbrowser-ai"], "env": {"ANTHROPIC_API_KEY": "ваш-ключ-anthropic"}}}}
Если используете OpenAI или Gemini, замените переменную ANTHROPIC_API_KEY на OPENAI_API_KEY или GEMINI_API_KEY. После настройки перезапустите MCP-клиент.
Примеры запросов
- «Открой сайт Википедии, найди статью про MCP и верни краткое содержание первых двух абзацев»
- «Зайди на страницу интернет-магазина, найди iPhone 16 и верни цену, описание и рейтинг»
- «Заполни форму входа на странице /login: введи admin в поле Username, password123 в поле Password и нажми кнопку Submit»
- «Собери все ссылки с главной страницы новостного сайта и выведи их списком с заголовками»
Технические детали
- Язык: Python (3.12+)
- Транспорт: stdio
- Лицензия: MIT
- Управление браузером: Chrome / Chromium через CDP
- Совместимые клиенты: Claude Desktop, VS Code (Roo Code, Cline), Cursor, JetBrains, любой MCP-клиент