В основе YandexART 2.0 лежит гибридная архитектура, поэтому нейросеть сочетает в себе возможности сверточной и трансформерной моделей. Благодаря сверточной модели искусственный интеллект воспринимает картинку по аналогии с человеческим глазом, то есть выделяет форму объекта, его текстуру, края. Трансформенная модель помогает увеличить объем текста, чтобы нейросеть смогла обработать длинные запросы и учесть детали. Гибридная архитектура позволяет ИИ смешивать на одной иллюстрации разные стили. Например, YandexART 2.0 может нарисовать кошку в стиле аниме на реалистичной, словно сфотографированной, лужайке.
Для обучения YandexART 2.0 потребовалось несколько миллионов пар иллюстраций и текстовых описаний к ним. Также анализировались и картинки с уже нанесенным на них текстом. Благодаря этому новая ИИ-модель может сразу генерировать изображения с надписями на латинице.
Чтобы оценить производительность и эффективность работы YandexART 2.0, в Яндексе разработали собственную систему качества. Согласно ее результатам, новая нейросеть по эстетичности и комплексности уверенно превосходит зарубежные аналоги Midjourney v6.1 и Stable Diffusion 3.
Для бизнеса YandexART 2.0 доступна в сервисе Yandex Cloud: при помощи нейросети удобно создавать логотипы, презентации, статьи, а также интегрировать генератор иллюстраций в различные приложения. Частные пользователи могут познакомиться с новой ИИ-моделью Яндекса в приложении «Алиса» для гаджетов и в его веб-версии для ПК. В рамках бесплатного доступа есть возможность сгенерировать до пяти картинок в сутки. Чтобы пользоваться генератором изображений без ограничений, понадобится подписка «Алиса Про».
