В догонку. Очень простая штука, «арбузный тест». Попросить нейронку нарисовать разбитый арбуз в луже кусочков. Хорошая оценка особенностей работы с изменёнными предметами и их частями. Сразу показывает и баланс «креативность-затренированность», и склонность к «утечке» концепций, и особенности внимания.
Промпт: «photo of smashed watermelon on a ground, pool of watermelon juice and bits»
Midjourney
MJ Version 3
MJ Version 4
MJ Version 5.0
MJ Version 5.2
Stable Diffusion
SD 1.5 original
SD 1.5 Juggernaut
SD 2.1
SD XL
Kandinsky
Kandinsky 2.2
На что обращать внимание: ровные края, форма и взаимное расположение целого и кусочков, цвет фона (появление зелёного и красного) и превращение кусочков в маленькие арбузики (утечка концепции), появление бассейна и стакана с соком (перетренированность)
Тут сразу видно и заметное падение «креативности» MJ 5.2 по сравнению с 5.0, и «цену» роста качества поздних моделей 1.5 типа Juggernaut, и особенности Kandinsky (недурная креативность, но очень слабое внимание)
А теперь мастер-класс от DALL-E, хорошо показывающий качественную разницу:
DALL-E 3