Как играть на Playground

Apr 02, 2023 12:03


Еще одна площадка, где можно познакомиться с продвинутыми функциями и оценить потенциальные возможности нейросети:



Интерфейс похож на Леонардо, и на Lexica, число попыток не ограничено* Как и везде - можно имитировать художественные стили,  использовать собственную картинку как «подсказку», а так же  делать исправления в сгенерированном изображении,  и   
попробовать очень интересную опцию - монтаж холста по частям.



У нейросетей засада с многофигурными композициями.
И один-то предмет в нужном ракурсе поди получи, а уж расставить персонажей на полотне - километровый «промт» не поможет.
Сервис позволяет пристраивать к центральной сцене одну за другой дополнительные части: главный герой на белом коне, справа горы, слева поля и небо над головой.

Что тут есть:

✔️Слева «промт» - словесное описание изображения, которое желательно получить, справа немногочисленные настройки - размер, степень детализации.
Версии нейросети: DALL-E только по подписке. Две версии СтейблДифьюжн «из коробки» и в сборке от Плейграунд.

✔️Имеется подборка фильтров для стилизации картинки (фильтры на разных сайтах отличаются - каждый свое прикручивает к СтабильнойДиффузии):



Пользовательское сообщество практически единодушно относительно значительного отставания «Диффузии» от Миджорни. Но энтузиасты ПО с открытым кодом изощряются, подбирают тонкие настройки, доказывая, что если очень-очень постараться, на StableD можно достичь похожих результатов и даже превзойти конкурента.

🤔Напоминает холивар Виндоза - Линукс. Если разбираешься в предмете, можешь подогнать сборку под себя, то в чем-то даже выиграешь.

Знатоки настроек и мастера программных кодов в некоторой степени решили задачу качества отрисовки и управляемости СтейблДифьюжн - с помощью бесчисленных костылей фильтров:



- Рисование «овощами» - модель генерирующая натюрморты, пейзажи и портреты, составленные из еды.
Неплоха модель «масляная живопись» (гладиолус получился лучше, чем у конкурентов - те вообще не справились  с этими цветами):



Можно отключить фильтры и писать развесистый «промт» самостоятельно. Результат может показаться... скромным.
С другой стороны и на Миджорни не всякий запрос отработает удачно, приноровиться надо. Советы от «бывалых» тоже не надежны. А заранее настроенных фильтров (типа «реалистичный портрет крупным планом», «мультик из пластилина» не предусмотрено, каждый шлифует свой велосипед самостоятельно).
За счет этого (плюс завлекалочки «неограниченных фри-генераций») сервисы с SD находят аудиторию и продолжают развиваться

Коррекция изображения:



всплывающая кнопка «редактировать» -> опция «добавить маску»:
закрашиваешь фрагмент изображения, в промте пишешь, что там должно быть, запускаешь генерацию - исправленная картинка отображается рядом:



клик

Портрет получился по запросу «текстура черепицы» =)
В принципе существует языковый модуль под нейросеть, она могла бы понимать и по-русски, но на СД-сервисах им почему-то пренебрегают.

И, самое интересное -

Генерация проекта по частям

✔️Переходим в раздел «Канвас»:



▣ Пишем промт, генерируем картинку в рамочке.
▣ Отодвигаем рамку вправо, производим новую генерацию. На этом этапе так же можно выбрать любой из фильтров:



▣Повторяем слева:



Получаем триптих «Про зайцев».

Но и это еще не все  -

✔️ Канвас умеет генерировать бесшовные изображения, образующие единое полотно



Запрос не хитрый -  «Сторож на бахче».
Выберем модель, напр, Микспанк, посмотрим, что получится.
- Ну, такое себе...

▣ Выпадающее меню редактирования предлагает отдельную опцию «исправить лицо» (функция обнаружения лиц присутствует)

- Не сказать, чтоб сильно лучше:



▣ Применим маску, закрасим



▣ используя промт вклеим на место маски сгенерированный фрагмент «Портрет Эйнштейна», он подстроится по масштабу и цвету:



но.. не без огрехов:



Чудные грядки, или действительно где-то арбузные рядки пенопластовым бортиком защищают?

Попробуем тот ж сюжет на другой модели:



Портрет боле похож на правду, хотя вместо арбузов выросли помидоры;
сдвинем рамку и сгенерируем продолжение с тем же описанием, но без «сторожа»:



Продолжим слева:



И еще сверху пририсуем облака =)





Качество местами требует доработки, но принцип понятен - картина срослась  без заметных швов

Тем же порядком заполним холст «корабликами в бушующем море»:



С разгону и в левом квадрате сгенерировался парусник, хотя в описании оставалось только море; три корабля в ряд - это перебор, исправим лишнее с помощью маски. И заменим на «люди на плоту»

ИИ не совсем так представил «плот», как подошло бы по контексту.
Сотрем  плавсредство «резинкой»:



и уточним запрос: «старинный, деревянный»



Не совсем плот получился, но тоже годится:



Произведем дополнительную манипуляцию с композицией:

▣ Скопируем  имеющееся полотно (копи-пастом обыкновенным) - появится дубликат.
▣ Перетащим его и расположим оба дубля один за другим:



▣ сотрем  место стыка и вернемся к генерации,



▣  впишем в промт «бурное море», чтобы плавно объединить изображения



Дамы под прикрытием ненастья не то с корабля бегут, не то на корабль. Удачи им!

О моделях :



На PG реалистичных немного, больше всяких стилизованных-декоративных.
«Сторож на бахче» с космическим уклоном: настройки не только колорит придают картинке, но и влияют на то, в каком ключе будет решено содержание.



«Кинематографический» фильтр выдал не менее причудливую картину:



«Без фильтра» - белее реалистично, но как-то серенько..
А арбузов уродилось, как камней на пляже



В  свежей версии Диффузии 2.1 всего два фильтра:



Ч/б и портрет крупным планом. Неплохой, четкий.
А если березки заказать?

Как-то так получится:



Как это вообще устроено?
- «Модели» - тот же промт. Только предустановленный, опробованный, «прирученный» =)

Допустим, мы написали: «Царица Савская, нарядная, с украшениями». Но итоговый запрос к нейросети включает куда более развесистое описание: «Студийный свет, текстура кожи, боке, шарп», и - «стиль фотографий Анне Лейбович»:



И у всех, сгенерированных в этой модели, портретов будет  то же самое стилистическое авторство, Анни Лейбович...



Артемида.. не очень на себя похожа:



Получается, что все кто воспользуется предустановками площадки будут производить  изо-контент в одном ключе.

Оно, конечно, любая нейросеть, включая Миджорни, синтезирует арт по готовым исходникам, на которых она натренирована, но более гибко, заимствуя по штришку у тысячи разных.
(Хотя и это спорно и до коллективного иска от художников уже доходило)

Пейзажные «модели» устроены по тому же принципу - в основе стилистика известных фотографов:



Симонетти, Рудковский -



(У «Леонардо», «Лексики» и прочих - принцип построения моделей тот же)

А если без предустановок, сами напишем, про свет, атмосферу и все остальное?



Так себе «березовая роща»..

Пробуешь и так и сяк, перефразируешь, меняешь описания, сочетание  настроек, отсылок и, однажды, клик - срослось!, что-то сложилось внутри ИИ и выпал удачный результат, как счастливый билет лотереи. Можешь с ним нагенерить еще несколько десятков приглядных картинок на ту же тему с вариациями. А если умеешь в коды - то и разместить на Гитхабе очередную специализированную «модель».

* Генерации в режиме «Board» - без ограничений, но для игры в продвинутом Канвасе - выделяют около пятидесяти попыток. Как раз слегка разобраться, как все утроено. Повышение качества картинки в базовой версии тоже не доступно.
Понятно, что сложный и энергоемкий сервис запускают, чтобы заработать, но маркетинговый подход несколько сомневает - «на фри-аккаунте результат не ахти, купи продвинутый, будет зашибись!»
Но откуда мне знать будет ли, и такое же, на один раз забава?

Играть с нейросетями забавно. Работать - как повезет.



веб-штучки, #всемвесна, нейрографика

Previous post Next post
Up