Кот небесный

Dec 01, 2023 13:39





«Снежок»:



Первый пятничный котик декабря.

Решила попробовать, как нейросети справятся с нехитрым сюжетом - «котик, сбрасывающий снежки на землю». Сделала себе выкраску на картонке, пример - чего хотелось бы добиться от ИИ.



Леонардо,
самый продвинутый из «Диффузий», обвешанный дополнительными (платными) «алхимиями», дает качество картинки не хуже Миджорни (полугодовой давности, позже не пробовала):



Картинки открыточного качества.
Вот только с пониманием задания - раз на раз не приходится.
И, если не пришлось, то хоть как изощряйся с формулировками, скобками (для выделения ключевых объектов), меняй слова местами, задавай короткий четкий промт или развернутое описание пейзажного полотна - самое близкое, что удается получить: летящего на облаке натурального мехового кота, а не облако в форме котика (варианты: кот-облако; облако-кот; кот из кучевых облаков; облако похожее на кота; и тд - с тем же результатом)





Зато иллюстрации - загляденье.

Самые крутые из нейросеток на основе «SD» мало продвинулись за последние месяцы в понимании промтов, зато наловчились мухлевать - «мы так и не поняли, что нужно сделать, но отрисуем классный постер, авось пользователю понравится».

еПлюс постепенно расширяются области охвата, на которые их натаскали -  к фигуристым манкенщицам, пейзажам и кибер-героике добавили множество других  моделей, заранее настроенных на определенный стиль - «пряничные домики», «пираты», «пластилин», «картина из овощей/оригами/хрусталя»,  «кельты/позолота/анимэ»...
Но чего нет, того с нуля не получишь



Коты прикольные, используя их для коллажа, доработать картинку под заданную идею несложно. Однако это все-таки наполовину ручная работа -



- к такому только снежок дорисовать





Разные «модели» дают разный рисунок, настолько же далекий от заданного.
Чем больше уточняешь требования к сюжету, тем отстойней графика, появляются лишние лапы и хвосты, как на ранних стадиях развития ИИ



Wepik,
неплохо продвинулся в качестве рисунка (когда-то забраковала его, как полный отстой), «милота» и атмосферность местами даже превосходят леонардовские. Но с сюжетом те же грабли:



Котик есть, снежки есть, облака есть, когда-то нейрогенерация лихо смешивала всех со всеми, выдавая результат с презабавнейшими монстрами и химерами.  Тогда бы наверное  «Кота с облаком? - Легко!»
Увы, теперь уже так не поиграешь - обратная сторона прокачки фотореализма



Ненастроенная «Диффузия-автоматик1111» - на компьютре:



Как ни странно, смысл задания поняла на раз.

Но при попытке добиться более фотографичной картинки, идея потерялась:



Типа - или получай картинку поприличнее, на основе скормленных в период обучения изображений, или без предустановок очень схематичное изображение:



Надстройка на системной Диффузии - Fooocus (от разработчика ControlNet)



Версия «анимэ-арт» - в красивости не откажешь!
С пониманием все то же.



Версия «реал» - фото-реализм неплохой, но грустноват и в красках жухловат, возможно отражение авторских предпочтений



Dezgo - слабенький сервис, почти на уровне моей домашней непрокачанной Диффузии. (Но случаются и на нем прозрения, потому оставила под рукой)



Playground -

на нем предустановленных моделей больше, чем где бы то ни было (некоторые занятные). Картинка не хуже, чем у других.
С пониманием - все аналогично:





Еще один былой «аналог Миджорни» BlueWilloy.  
Либо красиво -  либо близко к требуемому, но  графика грубеет и появляются  дефекты, казавшиеся изжитыми:



Limewire
поглотивший BlueWilloy, настойчиво продвигает про-апгрейд, пять картинок в день дает на пробу



однако результат показывает не убедительный.
Один раз угадал, кото-облако в точку, но стрёмное:



Кст. у Лайма среди опций есть подключенный:

Google imagen,

сам по себе доступный ограниченно (в  лист ожидания можно записаться)

Что-то Гугл припозднился, Диффузия так рисовала год назад (нестабильно - то терпимый результат, то жуткий треш)





Хотя считывание промта удовлетворительное (через раз) - действительно белый котик на облаке.



Диффузия от NightCafe старается и даже кое-где почти попадает, пытается именно кидать снежки. Или скрестить кота с облаком и город внизу показать. Но не то и другое сразу:





Креатив-Студио, сервис с очень разнопестрым функционалом и нестабильным результатом. Умеет в текст-ту-гиф:



Кандинский,
кажется уже 3, вроде бы отпочковавшийся от Дали-Е. Понимает по-русски, смысл отчасти воспроизвел, но в целом качество  так себе, отстает от навороченной СД



Фотошоп - генеративная заливка:



Вообще трудно судить, результат бывает очень разный, то  чуть ли не Mj,  то на уровне недоведенного до ума «автоматика».
В нижнем ряду снежок дорисовала - на то ж он и фотошоп =)



Примеры промтов,  на всех сервисах пробовала одинаковые,
все чисто смысловые, краткие и развернутые, в разных формулировках;
освещение, объективы меня устраивают по дефолту; «нарисуй как художник такой-то» - не  использую, как и свою картинку в качестве основы,
чистоты эксперимента ради:

[Развернуть]Кот из облаков, пушистый, светло-серебристый с белыми полосками, сидит на слое облаков и кидает на землю снежки, внизу деревня, над облаками темное небо.
A cat from the clouds, fluffy, light silver with white stripes, sits on a layer of clouds and throws snowballs on the ground, there is a village below, a dark sky above the clouds

Облачный кот кидает с неба снежки
Cloud cat throws snowballs from the sky

Из облака в форме кота падают снежки, зимний пейзаж с уровня облаков
Snowballs are falling from a cat-shaped cloud, winter landscape from cloud level

Облако в форме кота сбрасывает вниз снежки, зимний пейзаж с уровня облаков.
Сloud in the shape of a cat, a winter landscape from the cloud level.

A cloud cat, there is a village below, a dark blu sky above the clouds

Жемчужно-белый в полосочку кот из кучевых облаков плывет по синему небу и кидает снежки на заснеженный город
A pearly white striped cat made from cumulus clouds floats across the blue sky and throws snowballs at the snowy city


Попытки извернуться с «котик в небе над городом из - клубов дыма, пара, тумана...», оказались безуспешными, не удалось втолковать нейросети, что мне не нужен «дымящийся котик»



И, к слову, с прочими «из» тоже все оказалось не просто - еще недавно нейросеть это умела! Лихо составляла предметы и картины из чего угодно с чем угодно, а теперь туго и нехотя: котик из стекла и льда? - пожалуйста, хоть так, хоть в специальных «моделях»



а «из шариков надувных» - так себе результат:



хотя казалось бы обычное дело, полно фоточек по запросу «искусство моделирования из шариков»

«Из дыма и пара» справился только Бинг,





но и с облаками прекрасно справился

Bing -

вот этот круто рванул в последние недели. И качество картинки очень даже и, главное, - понимать промты научился, уже не первый сюжет - схватывает с полу-слова:



при повторных генерациях меняет композицию и стиль







Правка иллюстрации если и требуется, то минимальная, по сравнению с остальными











Немного начинает косячить и Бинг, если слишком уж настаивать на задуманной динамике. Описать котика как «мягкую игрушку», чтоб не отрисовывался реальный живой кот, тоже не прокатило





нейропрактика, #пятничныекотики

Previous post Next post
Up