Специалисты «Сбера» разработали нейросеть для создания изображений на основе текстового описания
pixabay.com  /  geralt

Нейросеть, получившая название ruDALL-E, способна генерировать изображения на основе их текстового описания. Примечательно, что технология «Сбера» работает в том числе со словами на русском языке.

Обучение нейросети происходит на основе сразу двух видов данных: изображений и текстов. Она позволяет создавать нелимитированное число новых изображений по заданному описанию. Как отметили в «Сбере», ruDALL-E может найти применение в таких сферах, как дизайн и реклама.

«Использовать ее можно для создания вариантов дизайна интерьера, стоковых изображений или векторной иллюстрации, материалов для рекламы, копирайтинга, архитектурного и промышленного дизайна», — указывается в материале, распространенном пресс-службой «Сбера».

К настоящему времени созданы две версии нейросети, различные по набору параметров: базовая ruDALL-E XL и расширенная ruDALL-T 12B. Обе они будут представлены на платформе ML Space компании SberCloud.