Вновь потратил несколько часов на развлечения с рисовальными нервносетками. Конечно же, для рисования сочных барышень, для чего же еще! 😎 Давно уже имел желание попытаться создать некую иллюстрацию в порядке эксперимента. Короче, задача была такая: в тексте есть описание некой персонажки, где максимально подробно описана ее одежда, и чуть менее подробно внешность. С внешностью достаточно самого общего описания: beautiful young woman, long brown hair (можно побаловаться с запросами на лица знаменитых личностей, типа актрис голливудских, а по умолчанию сетка вроде берет усредненные лица каких-то стоковых моделей). Фон - сойдет любой условный коридор. Вот со шмотками сложнее - т.к. необходимо подогнать под очень конкретно и детально прописанные в исходных данных параметры (цвет, фасон, иногда и материал). Часто получались вполне симпатичные картинки, которые я тоже сохранял, но одна или две детали не соответствовали. Прям совсем идеального соответствия на выходе так и не получилось, короче (надоело перебирать) - но процесс мне понравился.
Сначала мучал стабильную диффузию. Но потом вспомнил, что товарищ
kvisaz подсказал тут
инструмент, который мне весьма понравился. Рисует лучше, чем базовая онлайн-версия Стабильной Диффузии - во-первых, шустрее. Во-вторых, меньше негативных промтов требует (хотя тоже не без танцев с бубнами). В-третьих, вотермарку по умолчанию не ставит. На хабре есть пошаговый
гайд по запуску. Но это актуально пока доступны гугловские сервер-мощности, а их могут прикрыть в любой момент, а локальную версию пока не хочу ставить, тем более что у меня видеокарточка от АМУДЭ, и лишь с минимальной потребной памятью в 8 Гб...
С шрифтами настройками почти не игрался, стиль брал сугубо стандартный, фотореализм. Сколько нагенерил всего - не помню, ну под сотню или две, наверное, чтоб было из чего отбирать. Нервносетка лица рисует сейчас нормальные, с руками тоже проблем особых нет (но в другом промте до сих пор косячит, где я пытался эту даму изобразить сидящей - видимо, маловато сидячих фоток сетке скормили), однако все равно глаза и рты уходят в зловещую долину, даже при негативном промте типа "distorted face, wrong face, wrong hands, poorly drawn face". Это если без использования имен всяких селебритис как образцов внешности. Никаких эффектов, сложных фонов и т.д. даже не пытался делать, да и не нужно это сейчас. Моей целью не было создать что-то красивое, а лишь воспроизвести некий внешний облик с достаточной точностью по деталям из текста.
Впечатления: с ростовыми и поясными статичными портретами условных персонажей нервносетки справляются на бытовом уровне уже вполне удовлетворительно даже в таких кривых руках, как мои (в менее кривых - и гораздо лучше!). А вот мало-мальски сложные картины, где присутствуют несколько фигур (со строгими параметрами оных), особенно в динамике, т.е. более естественные положения тела, без "позирования" - такое еще почти не могут нормально нарисовать. Ну я особо и не пробовал, впрочем.
Тут уже с другими стилями, но получается почти то же самое.
По приколу запустил с fantasy art на стабильной диффузии, ну... лучше, чем ожидал. Но мне это было не очень нужно в данном случае.
Промт был в основном такой:
Beautiful young woman, teacher, walking down school hallway, long brown hair, forest-green tight velour mini-dress, high-heeled boots, black over-the-knee stockings, full body, full height, tight sleeveless dress, smiling, black platform boots, gorgeous, high detail, beautiful face, detailed face
(я их менял периодически, что-то добавлял, удалял и т.п.)
Интересно, что в каких-то стилях нейронка адекватно воспринимает слово forest-green (это оттенок такой, типа изумрудного по-русски), а в других начинает лепить лес в качестве фона. Улыбнуло.