I'm in love with Anything: anairos

anairos

I'm in love with Anything

Dec 27, 2022 20:02

Нет, серьёзно. Я раньше экспериментировал в основном со стандартным алгоритмом Stable Diffusion, но теперь всерьёз взялся за Anything - и я в восторге.

Мне больше не приходится мучиться, подбирая стили. Робот сразу выдаёт мне именно то, что я хочу видеть - качественные фэнтези-иллюстрации. Причём стили там тоже могут быть разными: хочешь - чиби, хочешь - детальные проработанные рисунки, хочешь - более реалистичная манера, особенно в прорисовке тел и декораций.

Вот несколько примеров (все картинки кликабельны):

Прекрасная амазонка в атаке

Уютная романтичная девушка на осеннем пляже

Милая девочка-мышка поступила в Хогвартс

Вход в мрачный замок, наверняка принадлежащий Тёмному Властелину

Суровый директор волшебной школы. Это не Дамблдор, этот может и накостылять

Просто мальчик на пороге своего дома

Снова деревянное изваяние богини тёмных эльфов. Посмотрите, как красиво обыграны корни у основания статуи

НИИЧАВО. Нет, серьёзно, так робот представляет советский университет магии снаружи

А так изнутри

Попутно я выяснил, что у нейросети есть ещё такая штука, как сэмплер. Что это такое и какую конкретно роль он играет, я так и не понял, но на конечный результат это влияет весьма заметно.

Я человек дотошный. Попадись мне в руки Тетрадь Смерти, я бы, наверное, как и Лайт Ягами, угробил не один десяток человек, просто выясняя пределы её возможностей. А тут я ещё и ничем не рисковал, так что смело взялся за дело.

Вот два набора. Каждый набор - один запрос, одно зерно, но четыре разных сэмплера: DPM, Euler, Euler Ancestral и DDIM.

Для первого я решил выбрать милую, но строгую учительницу волшебной школы, этакую юную МакГонагалл. Для второго - собственно, замок на берегу озера, где находится школа.

Получилось, как видите, довольно занятно. Сэмплеры DPM и Euler рисуют примерно одно и то же, но первый даёт более чёткую и резкую картинку, а второй более гладкие переходы цветов. Euler Ancestral - что-то совершенно своё. DDIM работает заметно дольше остальных, а его результаты отличаются и от тех, и от других, но в то же время странным образом их напоминают.

Кстати, обратили внимание на ученицу, сидящую перед учительницей на четвёртой картинке? Заметили, что она - маленькая копия учительницы?

Это результат той же особенности нейросетей, о которой я писал в прошлый раз. Каждое слово запроса влияет на всю картинку в целом, а не на её отдельную область. В результате роботу практически невозможно объяснить, что ты хочешь видеть на картинке двух разных людей. Любое слово, приложенное к одному, прилагается и к другому.

Я, например, пытался нарисовать простой сюжет: рыцарь в доспехах держит на руках оборванную, но счастливую девочку. Что бы вы думали - на девочке стабильно тоже оказывались доспехи. Робот не умеет отличать, какие описания относятся к какому персонажу. Даже скобки не помогают.

Попутно я обнаружил ещё одну особенность, но, чтобы рассказать о ней, пришлось бы ставить на весь пост ограничение "Материалы для взрослых". Скажу лишь, что такой оригинальной цензуры я ещё никогда не видел. Есть вещи, которые роботу известны, он знает, как они выглядят, но ему запрещено их изображать, и в попытках это сделать он изгаляется как может.

нейросеть