openbrowser-ai

openbrowser-ai

billy-enrizkyMIT
233 звёзд19 форков
OpenBrowser — это MCP-сервер для автоматизации браузера через AI-агента. Вы формулируете задачу на естественном языке, а сервер пишет асинхронный Python-код, запускает его и управляет браузером через Chrome DevTools Protocol. Вместо жёстких скриптов и селекторов — гибкое агентное поведение. Сервер решает задачи парсинга, тестирования и рутинных операций в браузере. Он подойдёт разработчикам и DevOps-инженерам, которые хотят автоматизировать сложные сценарии на сайтах без написания кода вручную. OpenBrowser поддерживает несколько LLM-провайдеров и может работать с облачными и локальными моделями. В хостированной версии доступна облачная панель для управления сессиями и планирования задач. Список ожидания открыт.

Установка

uvx openbrowser-ai

Характеристики

Общее

  • СтатусСообщество
  • Разработчикbilly-enrizky
  • ЛицензияMIT

Технологии

  • Языки
    Python
  • Транспорт
    stdio

Описание

Возможности

  • Генерирует и выполняет асинхронный Python-код для управления браузером на основе текстового запроса
  • Переходит по ссылкам, кликает по элементам и заполняет формы на веб-страницах
  • Извлекает структурированные данные со страниц и возвращает их в ответ
  • Управляет браузером напрямую через Chrome DevTools Protocol (CDP)
  • Сохраняет cookies и состояние сессии между запусками (в облачной версии — через веб-панель)
  • Поддерживает провайдеров: OpenAI, Anthropic, Google Gemini, OpenRouter
  • Включает модули OpenClaw для автоматического сбора данных и OpenCode для выполнения кода
  • Работает через MCP-протокол (stdio) и как CLI-инструмент
  • Планирует фоновые задачи по расписанию в хостированной версии
  • Сохраняет переменные и контекст между шагами в persistent namespace

Как подключить

Установите сервер с помощью пакетного менеджера uv:

uvx openbrowser-ai

Добавьте сервер в конфигурацию MCP-клиента (например, Claude Desktop). Укажите команду и API-ключ для используемой языковой модели:

{"mcpServers": {"openbrowser-ai": {"command": "uvx", "args": ["openbrowser-ai"], "env": {"ANTHROPIC_API_KEY": "ваш-ключ-anthropic"}}}}

Если используете OpenAI или Gemini, замените переменную ANTHROPIC_API_KEY на OPENAI_API_KEY или GEMINI_API_KEY. После настройки перезапустите MCP-клиент.

Примеры запросов

  • «Открой сайт Википедии, найди статью про MCP и верни краткое содержание первых двух абзацев»
  • «Зайди на страницу интернет-магазина, найди iPhone 16 и верни цену, описание и рейтинг»
  • «Заполни форму входа на странице /login: введи admin в поле Username, password123 в поле Password и нажми кнопку Submit»
  • «Собери все ссылки с главной страницы новостного сайта и выведи их списком с заголовками»

Технические детали

  • Язык: Python (3.12+)
  • Транспорт: stdio
  • Лицензия: MIT
  • Управление браузером: Chrome / Chromium через CDP
  • Совместимые клиенты: Claude Desktop, VS Code (Roo Code, Cline), Cursor, JetBrains, любой MCP-клиент

Поделиться