С качеством изображений, особенно в самом начале пути, особенно когда речь шла о мелких объектах (пальцы, отдельные суставы, другие небольшие по размерам части тела), у алгоритмов нейронных сетей дела были неважными.
Прелесть локальной установки в том, что можно было за полчаса просчитать сотни три картинок, сесть отбирать из них те, на которые можно смотреть без содрогания - и хорошо если оставалось 2-3 процента от общего числа.
Сейчас дела стали лучше: у стандартной модели отсеиваются до 25% от всего числа, у специализированных моделей, тренированных на качественных фото подлинных людей, доля брака может падать ниже одного процента. Дело, конечно, в сложности композиции и в том, что при высокой концентрации сложны и мелких деталей (пальцы, глаза, черты лица) алгоритмы дают сбой просто потому, что размеры элемента становятся сопоставимыми с "квантом" изображения, которые порождаются при вычислениях - 16 на 16 пикселов.
Для примера: ровно одна картинка ниже просчитана на старой модели, образца конца 22 года, остальные просчитаны на одной из лучших по детализации моделей. Сможете угадать, которая "старая"?
Сбои с отрисовкой анатомии и реалистичных поз свойственны всем до единой таким двигателям, вопрос исключительно в степени "уродства" и в доле брака. К слову, одна из причин, почему я перестал пользоваться бесплатными сторонними сервисами или программами: там везде ограничено число попыток, и несколько часов, проведённых за экраном, вполне могут кончиться ничем.
"Так и живём". Есть хитрости (которые я в случае этих шести картинок не использовал), о них стоит упомянуть отдельно и подробнее (тем, кто в курсе - речь про ADetailer, ControlNet и т.п.)
#92дняпроекта #stablediffusion #арт #иллюстрация