Увидел в ютубе ролик - девочка рассказывала как делает картинки с помощью recraft. Решил попробовать - что оно могёт. Но простые картинки ведь неинтересно, верно? Очень мне понравился образец "Дарт Вейдер покупает продукты". И я задал для начала "Люк Скайуокер курит гашиш". Результат мне понравился. (Не привожу, т.к. любой может этот эксперимент повторить без особых усилий) Тогда я начал экспериментировать с историческими персонажами.
Вот, например, что сгенерировалось на фразу "Ленин и Николай II пьют на брудершафт":
Ннуууу ... надо честно признать, что персонажи не слишком узнаваемы. Но в целом, результат интересный :)
Как я заметил, сетка справляется гораздо хуже, если в запросе смешаны элементы, тскзть, "далеко отстоящие друг от друга". Как в данном случае - "Ленин и Николай II" - это из одной эпохи, и образцы, на которых сетка обучалась, присутствовали "близко" в одних и тех же коллекциях фотографий, а "пьют на брудершафт" - это из другой эпохи и из других коллекций. Если вместо этого задать "играют в шахматы" - результат выглядит намного реалистичней.
Ну а к чему это? К тому, что нейросетки позволяют генерировать бесконечное число псевдоисторических документов и фотографий, и когда мы в них утонем - лишь вопрос времени :(