OpenAI запускает автономного data-агента для обработки данных
OpenAI представила внутреннего data-агента, предназначенного для автономной обработки больших объемов данных без необходимости загрузки их в контекст модели. Этот агент, запущенный в компании в 2025 году, использует ReACT-паттерн для самостоятельного планирования и выполнения задач: от анализа файлов и запуска команд в изолированном контейнере до поиска информации в интернете и создания пайплайнов. Ключевые инструменты включают run_cmd для выполнения shell-команд, save_text_file и load_text_file для работы с файлами в монтированной директории /mnt, а также load_skill для динамической подгрузки навыков — markdown-инструкций с скриптами и примерами. Агент стартует в чистом контейнере с предустановленными утилитами вроде curl, trafilatura и lynx, что позволяет ему устанавливать дополнительный софт по мере необходимости. Из коробки доступны навыки вроде web-search через DuckDuckGo или Tavily, skill-creator для генерации новых расширений, skillsmp-search для маркетплейса skillsmp.com и planning-with-files для трекинга задач.
Разработка агента решает проблему перегрузки промпта в универсальных AI-помощниках, делая их более автономными для повседневных задач: работы с файлами, ресерча, анализа логов и OPS-операций. В отличие от чат-ботов с фиксированными сценариями, агент действует как «всезнающий junior-разработчик с Linux», комбинируя команды, скрипты и файлы подобно человеку в терминале. Примеры использования демонстрируют эффективность: агент загружает skill для анализа логов из sosreport, извлекает паттерны ошибок, kernel panics, OOM-события и краши, сохраняя отчет в пользовательскую папку. Другие навыки, такие как file-organizer для сортировки файлов или logs-analysis, расширяют функционал без привязки к конкретным инструментам. OpenAI подчеркивает стандартизацию формата skills, поддерживаемого Anthropic и Google, что стимулирует экосистему с маркетплейсами.
Внедрение агента повлекло оптимизацию внутренних процессов OpenAI, сократив время на data-задачи на 40–60% по внутренним метрикам 2025 года, и открыло путь к мультиагентным системам. Для рынка это усиливает конкуренцию в нише автономных AI: разработчики могут адаптировать архитектуру для бизнеса, автоматизируя рутину вроде генерации кода, анализа бюджетов или складского планирования, как в примерах Wildberries. Пользователи получают надежного помощника для сложных задач без риска утечек данных благодаря контейнеризации, но требуют осторожности с конфиденциальной информацией — инцидент с главой CISA Мадху Готтумуккалой летом 2025 года, загрузившим служебные документы в ChatGPT, привел к расследованию в DHS и подчеркивает риски. Итог: агент стал стандартом для in-house data-инструментов, повысив производительность на 50% в тестовых сценариях и стимулируя спрос на skills-экосистемы.
Автономный data-агент OpenAI использует передовые технологии, сокращая время на выполнение задач. Он способен самостоятельно адаптироваться и работать с различными инструментами.
Источник: https://openai.com/index/inside-our-in-house-data-agent