Решила попробовать, как нейросети справятся с нехитрым сюжетом - «котик, сбрасывающий снежки на землю». Сделала себе выкраску на картонке, пример - чего хотелось бы добиться от ИИ.
Леонардо, самый продвинутый из «Диффузий», обвешанный дополнительными (платными) «алхимиями», дает качество картинки не хуже Миджорни (полугодовой давности, позже не пробовала):
Картинки открыточного качества. Вот только с пониманием задания - раз на раз не приходится. И, если не пришлось, то хоть как изощряйся с формулировками, скобками (для выделения ключевых объектов), меняй слова местами, задавай короткий четкий промт или развернутое описание пейзажного полотна - самое близкое, что удается получить: летящего на облаке натурального мехового кота, а не облако в форме котика (варианты: кот-облако; облако-кот; кот из кучевых облаков; облако похожее на кота; и тд - с тем же результатом)
Зато иллюстрации - загляденье.
Самые крутые из нейросеток на основе «SD» мало продвинулись за последние месяцы в понимании промтов, зато наловчились мухлевать - «мы так и не поняли, что нужно сделать, но отрисуем классный постер, авось пользователю понравится».
еПлюс постепенно расширяются области охвата, на которые их натаскали - к фигуристым манкенщицам, пейзажам и кибер-героике добавили множество других моделей, заранее настроенных на определенный стиль - «пряничные домики», «пираты», «пластилин», «картина из овощей/оригами/хрусталя», «кельты/позолота/анимэ»... Но чего нет, того с нуля не получишь
Коты прикольные, используя их для коллажа, доработать картинку под заданную идею несложно. Однако это все-таки наполовину ручная работа -
- к такому только снежок дорисовать
Разные «модели» дают разный рисунок, настолько же далекий от заданного. Чем больше уточняешь требования к сюжету, тем отстойней графика, появляются лишние лапы и хвосты, как на ранних стадиях развития ИИ
Wepik, неплохо продвинулся в качестве рисунка (когда-то забраковала его, как полный отстой), «милота» и атмосферность местами даже превосходят леонардовские. Но с сюжетом те же грабли:
Котик есть, снежки есть, облака есть, когда-то нейрогенерация лихо смешивала всех со всеми, выдавая результат с презабавнейшими монстрами и химерами. Тогда бы наверное «Кота с облаком? - Легко!» Увы, теперь уже так не поиграешь - обратная сторона прокачки фотореализма
Ненастроенная «Диффузия-автоматик1111» - на компьютре:
Как ни странно, смысл задания поняла на раз.
Но при попытке добиться более фотографичной картинки, идея потерялась:
Типа - или получай картинку поприличнее, на основе скормленных в период обучения изображений, или без предустановок очень схематичное изображение:
Надстройка на системной Диффузии - Fooocus (от разработчика ControlNet)
Версия «анимэ-арт» - в красивости не откажешь! С пониманием все то же.
Версия «реал» - фото-реализм неплохой, но грустноват и в красках жухловат, возможно отражение авторских предпочтений
Dezgo - слабенький сервис, почти на уровне моей домашней непрокачанной Диффузии. (Но случаются и на нем прозрения, потому оставила под рукой)
Playground -
на нем предустановленных моделей больше, чем где бы то ни было (некоторые занятные). Картинка не хуже, чем у других. С пониманием - все аналогично:
Еще один былой «аналог Миджорни» BlueWilloy. Либо красиво - либо близко к требуемому, но графика грубеет и появляются дефекты, казавшиеся изжитыми:
Limewire поглотивший BlueWilloy, настойчиво продвигает про-апгрейд, пять картинок в день дает на пробу
однако результат показывает не убедительный. Один раз угадал, кото-облако в точку, но стрёмное:
Кст. у Лайма среди опций есть подключенный:
Google imagen,
сам по себе доступный ограниченно (в лист ожидания можно записаться)
Что-то Гугл припозднился, Диффузия так рисовала год назад (нестабильно - то терпимый результат, то жуткий треш)
Хотя считывание промта удовлетворительное (через раз) - действительно белый котик на облаке.
Диффузия от NightCafe старается и даже кое-где почти попадает, пытается именно кидать снежки. Или скрестить кота с облаком и город внизу показать. Но не то и другое сразу:
Креатив-Студио, сервис с очень разнопестрым функционалом и нестабильным результатом. Умеет в текст-ту-гиф:
Кандинский, кажется уже 3, вроде бы отпочковавшийся от Дали-Е. Понимает по-русски, смысл отчасти воспроизвел, но в целом качество так себе, отстает от навороченной СД
Фотошоп - генеративная заливка:
Вообще трудно судить, результат бывает очень разный, то чуть ли не Mj, то на уровне недоведенного до ума «автоматика». В нижнем ряду снежок дорисовала - на то ж он и фотошоп =)
Примеры промтов, на всех сервисах пробовала одинаковые, все чисто смысловые, краткие и развернутые, в разных формулировках; освещение, объективы меня устраивают по дефолту; «нарисуй как художник такой-то» - не использую, как и свою картинку в качестве основы, чистоты эксперимента ради:
[Развернуть]Кот из облаков, пушистый, светло-серебристый с белыми полосками, сидит на слое облаков и кидает на землю снежки, внизу деревня, над облаками темное небо. A cat from the clouds, fluffy, light silver with white stripes, sits on a layer of clouds and throws snowballs on the ground, there is a village below, a dark sky above the clouds
Облачный кот кидает с неба снежки Cloud cat throws snowballs from the sky
Из облака в форме кота падают снежки, зимний пейзаж с уровня облаков Snowballs are falling from a cat-shaped cloud, winter landscape from cloud level
Облако в форме кота сбрасывает вниз снежки, зимний пейзаж с уровня облаков. Сloud in the shape of a cat, a winter landscape from the cloud level.
A cloud cat, there is a village below, a dark blu sky above the clouds
Жемчужно-белый в полосочку кот из кучевых облаков плывет по синему небу и кидает снежки на заснеженный город A pearly white striped cat made from cumulus clouds floats across the blue sky and throws snowballs at the snowy city
Попытки извернуться с «котик в небе над городом из - клубов дыма, пара, тумана...», оказались безуспешными, не удалось втолковать нейросети, что мне не нужен «дымящийся котик»
И, к слову, с прочими «из» тоже все оказалось не просто - еще недавно нейросеть это умела! Лихо составляла предметы и картины из чего угодно с чем угодно, а теперь туго и нехотя: котик из стекла и льда? - пожалуйста, хоть так, хоть в специальных «моделях»
а «из шариков надувных» - так себе результат:
хотя казалось бы обычное дело, полно фоточек по запросу «искусство моделирования из шариков»
«Из дыма и пара» справился только Бинг,
но и с облаками прекрасно справился
Bing -
вот этот круто рванул в последние недели. И качество картинки очень даже и, главное, - понимать промты научился, уже не первый сюжет - схватывает с полу-слова:
при повторных генерациях меняет композицию и стиль
Правка иллюстрации если и требуется, то минимальная, по сравнению с остальными
Немного начинает косячить и Бинг, если слишком уж настаивать на задуманной динамике. Описать котика как «мягкую игрушку», чтоб не отрисовывался реальный живой кот, тоже не прокатило