Сбер выпустил новую версии нейросети для создания изображений

Нейросеть Kandinsky «научили» создавать более детальные изображения и лучше следовать инструкциям

Сбер представил новую версию модели для создания изображений по тексту Kandinsky 4.1 Image, которая генерирует более детализированные и качественные картинки и лучше понимает запросы пользователей. Вместе с ней появился AI-редактор MALVINA, позволяющий редактировать фотографии с помощью простых текстовых команд. MALVINA может удалять лишние объекты, менять фон, цвет волос, возраст на фото или реставрировать старые снимки, сохраняя при этом важные детали и геометрию исходного изображения.

Основу Kandinsky 4.1 Image составила обновлённая архитектура диффузионного трансформера, что улучшило скорость и качество работы. Модель обучалась на огромном наборе данных, в том числе на тщательно отобранных изображениях, которые оценивали профессиональные фотографы и художники. Благодаря этому картинки стали выглядеть более эстетично и естественно, а генерация сложных объектов, например, техники, вышла на новый уровень. Модель также умеет точно следовать сложным указаниям, учитывая детали и даже стили известных художников.

Интеграция редактора MALVINA с чат-ботом GigaChat открывает доступ к удобному инструменту для работы с изображениями. Пользователи могут быстро менять фон, добавлять или убирать объекты, корректировать дефекты и менять цвета, не теряя качества исходных фото. По словам руководителя технологического развития Сбера Андрея Белевцева, новая система помогает воплощать креативные идеи с точностью до пикселя и делает работу с изображениями проще и доступнее для всех — достаточно знать пару простых команд.