Сегодня нейросети на слуху у каждого человека, даже
если он никак не связан с IT, не ведет свой блог, не
публикует посты в соц.сетях и не является авторам текстов для интернет изданий.
Нейросети могут все! Написать программный код, статью
или даже ВУЗовский диплом. Ну а сгенерировать иллюстрацию – вообще без проблем.
Главное сделать запрос, который наиболее точно, четко и конкретно отражает
желаемую иллюстрацию. Но это будет, так сказать, «прямой запрос». А если
запрос с аллегорией, «вторым смыслом», юмором или закавыкой? Насколько
«качественно» и адекватно нейронная сеть справится с такой задачей? Решил
проверить это на примере создания нейросетью иллюстраций на тему известных
русских пословиц и поговорок.
Заморачиваться с «англоязычными» нейросетями не стал,
так как запрос сначала надо будет перевести на английский. Ага, попробуйте получить «адекватный»
перевод пословицы с русского на английский. Слова будут те же, а вот скрытый
смысл, подтекст и изюминка пропадут. Поэтому решил провести эксперимент с
«русскоязычной» нейросетью от Сбера для генерации картинок из текста. ruDALL-E,
хоть и является мульти язычной, но «заточена» под русский язык. Что
нам и надо. Еще пара плюсов – не требует регистрации, бесплатная (по крайней
мере пока). Да и сам процесс составления запроса и выбор настроек для генерации
изображения прост до безобразия. Есть как десктопная, так мобильная версии
нейросети (называется «Салют»).
Заходим на сайт https://rudalle.ru. Вводим текстовый
запрос для генерации картинки (для примера я сделал запрос «Кошка на окне ест
сметану»).
Выбираем из предлагаемого списка предпочтительное
разрешение для будущей картинки (можно запросить как вертикальное или
горизонтальное расположение изображения, так и квадратное).
Выбираем опять же из предлагаемого списка стиль, в
котором будет выполнена картинка. Всего стилей двадцать. Я посчитал, что
для генерации иллюстраций пословиц и поговорок наиболее уместен будет стиль «Мультфильм».
После этого кликаем на «Отправить» и для того, чтобы
нейросеть убедилась, что вы человек, а не робот, с помощью ползунка выравниваем
предлагаемую картинку.
Всё. Начинается генерация. Процесс занимает
приблизительно от тридцати секунд до одной минуты.
Получаем результат! Не шедевр, конечно, но довольно прилично, на
мой взгляд. Картинкой сразу со страницы результата можно поделиться в соц.сетях
или скачать её.
Ну а теперь перейдем непосредственно к эксперименту. Было
сгенерировано десять картинок, текстовыми запросами для которых являлись
известные русские пословицы и поговорки. Чтобы при просмотре читателями результатов
эксперимента создать небольшую интригу, сами пословицы и поговорки, на которые
были нейросетью созданы картинки, я спрятал под спойлером после каждой
картинки. А теперь попробуйте угадать по какой пословице или
поговорке ИИ сгенерировал иллюстрацию.
Пословица или поговорка, на основе которой создана иллюстрация (результат — удовлетворительно)
Не место человека красит, а человек место.
Пословица или поговорка, на основе которой создана иллюстрация (результат — хорошо)
Заставь дурака Богу молиться, он и лоб
расшибёт.
Пословица или поговорка, на основе которой создана иллюстрация (результат — неудовлетворительно)
Всяк кулик своё болото хвалит.
Пословица или поговорка, на основе которой создана иллюстрация (результат — удовлетворительно)
Без труда не вытянешь (вытащишь) и рыбку из пруда.
Пословица или поговорка, на основе которой создана иллюстрация (результат — отлично)
Не буди
лихо, пока оно тихо.
Пословица или поговорка, на основе которой создана иллюстрация (результат — хорошо)
В тихом омуте черти водятся.
Пословица или поговорка, на основе которой создана иллюстрация (результат — удовлетворительно)
Лучше синица в руках, чем
журавль в небе.
Пословица или поговорка, на основе которой создана иллюстрация (результат — хорошо)
Работа
не волк, в лес не убежит.
Пословица или поговорка, на основе которой создана иллюстрация (результат — удовлетворительно)
Бог не
выдаст — свинья не съест.
Пословица или поговорка, на основе которой создана иллюстрация (результат — удовлетворительно)
Дареному коню в зубы не
смотрят.
Как кажется лично мне, нейросеть справилась с задачей
суммарно на твердую троечку с плюсом. Пара картинок, на мой взгляд, вообще «очень
далека» не только от смысла «второго дна», присущего данному словесному
жанру, но и даже от ключевых слов запроса. Правда необходимо учесть, что
текстами запросов были не четкие и однозначные описания требуемого изображения,
а народная фольклорная мудрость. А работу же выполнял хоть и интеллект, но все
же искусственный.