Google впечатляет скоростью редактирования и трансфером стилей в Gemini 2.0 Flash
Google представила свою новую модель AI Gemini 2.0 Flash. Эта модель предлагает пользователям возможность мультимодальной генерации изображений. Это первая крупная американская технологическая компания, предоставившая такую возможность потребителям напрямую. В отличие от других инструментов генерации изображений, которые требуют интерпретации между двумя моделями, Gemini 2.0 Flash может генерировать изображения непосредственно в рамках одной модели. Благодаря этому она является более точной и функциональной.
Как улучшает изображения Gemini 2.0 Flash
Сегодня Google в своем разработческом блоге выделила несколько ключевых возможностей модели:
- Текстовое и визуальное повествование: генерация иллюстрированных историй с поддержкой обратной связи.
- Разговорное редактирование изображений: многократное редактирование изображений через естественные языковые команды.
- Генерация изображений на основе мировых знаний: иллюстрация рецептов с детальными изображениями.
- Улучшенная рендеринг текста: модель превосходит конкурентов в точности отображения текста на изображениях.
Первичные примеры демонстрируют огромный потенциал
Пользователи и исследователи делятся впечатляющими примерами новой функциональности Gemini 2.0 Flash. Эта модель позволяет редактировать существующие изображения с помощью текста. Также она позволяет добавлять реквизит и менять направление взгляда на фотографии.
Новый инструмент для разработчиков и компаний
Для маркетинговых и контент-команд Gemini 2.0 Flash может стать экономичной альтернативой традиционным графическим дизайнам. Она автоматизирует создание брендированного контента. Модель может также упрощать интеграцию AI в приложения и службы. Она поддерживает текстовый рендеринг внутри изображений и облегчает разработку AI-интерфейсов.
Как развернуть и экспериментировать с этой функциональностью
Разработчики могут начать тестирование возможности генерации изображений Gemini 2.0 Flash. Для этого они могут использовать Gemini API. Google предоставляет пример запросов, демонстрирующий процесс генерации иллюстрированных историй. Он позволяет использовать текст и изображения в одном ответе.
Подписывайтесь на наш telegram-канал








