Интернет-маркетинг

от Арсения Груздева

Генерация и редактирование изображений с помощью ИИ в 2025 году

В 2025 году генерация и редактирование изображений с помощью ИИ-моделей стали одним из главных событий в развитии LLM, ознаменовав переход от ожиданий к практическим инструментам. OpenAI, ранее анонсировавшая мультимодальные возможности GPT-4o в мае 2024 года с обещаниями генерации изображений, наконец реализовала их в марте 2025-го. Без официального названия продукт позволил пользователям загружать свои фото и редактировать их через текстовые промпты, интегрируясь прямо в ChatGPT. API-версия вышла под кодом gpt-image-1, за ней последовала бюджетная gpt-image-1-mini в октябре и улучшенная gpt-image-1.5 16 декабря. Это сделало редактирование доступным для миллионов пользователей, упростив создание персонализированного контента без специализированного софта.

Конкуренция усилилась со стороны открытых моделей и других гигантов. Китайская Qwen представила Qwen-Image 4 августа, а уже 19 августа — Qwen-Image-Edit, которую можно запускать на мощном потребительском железе. В ноябре вышла Qwen-Image-Edit-2511, а 30 декабря — Qwen-Image-2512. Google же ворвался с серией Nano Banana через Gemini: прототип Gemini 2.0 Flash native image generation показали в марте, но прорыв случился 26 августа с Gemini 2.5 Flash Image под кодовым именем Nano Banana. Эта модель выделялась точным следованием инструкциям по редактированию и генерацией текста на изображениях. В ноябре дебютировала Nano Banana Pro — профессиональный инструмент для инфографики с детализированными данными и текстом. Макс Вулф опубликовал гайды по промптам для обеих версий, подчеркнув их превосходство в сложных задачах.

Рынок отреагировал взрывным ростом: Nano Banana Pro обошла конкурентов в популярности на платформах вроде LM Studio и Ollama, где Llama 3.1 лидировала, но уступала в изображениях. OpenAI доминировала в потребительском сегменте, но открытые модели Qwen сделали технологию доступной для локального использования, снизив зависимость от облаков. Для пользователей это означало революцию в креативе — от добавления элементов вроде попугаев какапо на фото до профессиональной инфографики, сократив время на задачи с часов до минут. Разработчики отметили превосходство Opus 4.5 над GPT-5.2 Codex в коде, но Nano Banana Pro стала эталоном в визуалах, стимулируя инвестиции в мультимодальные ИИ и расширяя рынок на 30–50% по оценкам экспертов.

2025 год стал переломным моментом в области генерации изображений с помощью ИИ, когда основные игроки рынка, такие как OpenAI и Google, представили свои новейшие решения, меняющие правила игры.

Источник: https://ollama.com/blog/image-generation

Добавить комментарий