«На дворе трава, на траве братва, вся братва в дрова»
Canva, встроенная в ЖЖ-редактор теперь тоже умеет в модные нейросети; вот так она представляет братву на дровах:
Идея в том чтобы задав текстовое описание, использовать полученный результат - одну из предложенных картинок и последовательными итерациями, уточнениями, добавлениями добиться реализации задуманного
Загруженный эскиз, сделанный левой ногой мышкой сеть не прожевала, реагирует только на описание,
есть бревнышки и трава, пытаюсь заставить ее изобразить «братву» в нужной кондиции и во дворе
В наличии либо «тост», либо «дрова», да и «братва» на себя не похожа
Что еще хужее - и персонажи на людей похожи весьма условно
количество рук, ног и их расположение непредсказуемы
это предел, чего удалось добиться от Канвы
разве что деревья более-менее
дальнейшие уточнения приводят к закольцовыванию, возвращая к уже отвергнутым решениям
Натурально - «в дрова» =)
Прямолинейный перевод с «русского на русский» про «бухих бандитов на дворе» не проходит, приходится изощряться; «дрова», не расписанные в целую фразу, система игнорирует, «двор в городе, городской квартал» игнорирует в любых вариациях, упорно отрисовывая то ли футбольное поле, то ли стриженную лужайку.
Попробую онлайновый Дрим:
Превьюшка игнорируется точно так же, но в «дрова» система врубается лучше Канваса. С количеством ног тоже путаница, похоже это общая засада.
Stable Diffusion - самый популярный, чаще всего его приводят как пример возможностей ИИ в области цифровой изобразительной техники:
Пробую в разных жанрах
Отдает не все, намекает на продвинутый кейс. Но сквозь блюр тоже ничего примечательного не проглядывает.
Если не присматриваться к конечностям, где-то даже интересно
чьи-то руки, чьи-то ноги, но бревнышки местами удались
- казалось бы, уж по бутылкам-то какая проблема сгенерить что-то вменяемое? но тоже как повезет.
А как же множество крутейших примеров в сети, с поразительными деталями реалистичных отрисовок?
Пишут что:
- декстопные программы уровня PRO показывают лучший результат
- описания порой достигают сотни слов
- картинки дорабатываются, на основе доработок генерируются заново, деталь за деталью и так стопятьсот раз
- нужен навык по общению с ИИ, чтобы выхлоп стал более предсказуемым
- а еще должно повезти
- есть круг тем, на которые рисовалки заточены - мультяшно-киношные супергерои(ни), космос, технический артхаус. Ландшафты. Копирование стиля художников-классиков.
И - нейросеть не рисует. Она автоматизирует процесс выполнения заказов по диги-арту популярным методом: «укради так, чтоб не попадаться» - не передирай внаглую, а заимствуй перерабатывая, компилируя, перемешивая и перекрашивая.
Еще один из популярных ресурсов
Площадка - многофункциональная, для пользования рисовалкой нужно подключаться к чатам, по выражению завсегдатаев - «пробиться», на момент захода свободных не было.
Образцы выглядят круто, но - не оставляет ощущение, что я все это уже видела не по одному разу. В фильмах, игровых скринах и сборниках фотообоев..
Есть еще несколько сервисов, то с ограниченным доступом, то работа в программных кодах, не стала заморачиваться.
Ресурс попроще, этот хотя бы предложенный эскиз не проигнорировал.
Хотя просто выровнять исходную картинку фотошоп может лучше.
О математической сущности нейросетей -
тут По общему впечатлению - доступные онлайновые нейрорисовалки не особо продвинулись по сравнению со стародавней игрушкой «нарисуй котика»
такое же все кривое. Хотя женский юношеский портрет уже тогда у нейросети получался неплохо - видимо самый распространенный сюжет в цифровой графике, самая обширная база данных для компиляции. Даже с котиками до сих пор не так все здорово. А уж запас «дров», «дворов нараЁне» и «группы товарищей» в базе референсов и вовсе ограничен, да и сами базы собирались в других реалиях.
Однако, удачные примеры показывают, что система работает, пополнить ее библиотеки, допилить огрехи с руками-ногами - дело времени.
Когда-то смеялись всем жж над первыми шагами Гугл-транслейта, помните «котенка афро-американца» ? =)
Шаг за шагом алгоритм набрался опыта и в расхожих случаях очень даже неплохо справляется (хотя контролировать, что он перевел, не помешает). Однако, до замены профессиональных переводчиков роботами еще далеко.
Заменит ли нейросеть художников?
Возможно какие-то функции вскоре будут автоматизированы - баннеры, иллюстрации к новостным текстам и прочий прикладной веб-арт. Это и сейчас делается практически «на автомате», только что реальными девочками-дизайнерами операторами. Рутину и заменит ИИ.
Появление фотографии не отменило живописи (возможно стало меньше портретистов-ремесленников, зато понадобилось множество оформителей для наглядной агитации, было куда переквалифицироваться).
Трикотажная промышленность развивается более сотни лет, производительность не сопоставима с домашним рукоделием, но люди по прежнему вяжут, плетут кружевные салфетки для собственного удовольствия.
Не факт, что технологический прорыв в области взаимопонимания между автоматикой и пользователем последует сразу же за прорывом в технике синтеза картинки на основе сотни скормленных нейросети образцов.
Тут люди-то не всегда друг друга понимают...
Пока что составлять и пересоставлять «промт»-описание, подбирать референсы для исходной генерации, доводить результаты вручную, снова и снова перезапуская рендеринг - отдельное искусство, которое возможно сделается новой профессией.
С другой стороны - не факт, что глянцевый «нейронный» арт не приестся, как надоели роскошные экранные заставки - кто ими сейчас увлекается?
На нынешний момент скачать десяток фри-pngшек и собрать из них иллюстрацию для поста, именно такую, как хочется - займет пару минут, если руку набить.
Научится ли нейросеть понимать чего хочется заказчику?
Будем посмотреть :)
Реплика с Хабра: