По второй дорожке у нас бежит SD. Будучи локальной и потому ограниченной в ресурсах, она не может соревноваться в качестве «первой генерации». Зато даёт в руки пользователю все и любые инструменты для насилия над картинкой. Да, тут редко будет сразу красиво, придётся попотеть. Зато ты получишь именно то, что попросил и в нужной позе, даже если это странная раскоряка. Не умеешь правильно просить? Вообще не знаешь, что хочешь получить в итоге? Идёшь лесом в MJ!
Пример, крайность:
На спор рисовалась поза персонажа «шпагат стоя, руки скрещены у груди, одна защищает лицо»
Это потребовало использования ControlNet (чтобы наглядно показать нейронке точную позу, словами такое не опишешь), трёх последовательных генераций и десятка дополнительных проходов для исправления мелких косяков. Но в любой другой рисовалке такое сделать невозможно вообще!
Раскоряка, на спор.
В SD есть море инструментов, от задание позы и композиции до региональных промптов (когда рисунок сегментируется на несколько областей и каждая со своим промптом.
Одна из последних новинок это управление шумом. Диффузия на каждом шаге добавляет случайный шум, из которого потом сэмплер тащит промпт. А если не случайный? Так получается
управлять яркостью, контрастом и палитрой генерации, вплоть до конкретного RGB цвета рубашки персонажа.
Ещё одна
интересная контролька позволяет выставлять яркость точек по всему полю рисунка. Как ограничение генерации. Звучит скучно? Это означает что можно взять чёрно-белую маску, например QR код, и сгенерировать вот такое
Должно сканироваться
Или вот такое
Если не видите, сощуртесь
Ну и, наконец (если взять не чёрно белую маску, а градации серого), такое
Всё ещё не искусство?