Oct 31, 2024 08:03
Кроме прочего, теперь нейросети пишут точные субтитры к видеороликам (распознавание речи!) и создают текстовые описания фотоснимков. А Скайп еще предложил синхронный перевод с языка на язык во время видеозвонков! Мне нравится такое будущее! А вам? Что бы вы еще у разработчиков попросили?
техника,
технология
Leave a comment
Все же чтобы закрыть тему.
1. Ботинки разные. Это первый из пяти рисунков, где эта разность не касается декоративных элементов ботинка, она на вмятинах - и потому, конечно, уместна. Но это не два идентичных ботинка. Все пять пар ботинок подозрительно похожи, возможно детали отличаются так незначительно поэтому - эта сетка просто в принципе рисует более-менее одинаковую обувь.
2. Несмотря на все усилия и прямые руки (без иронии), получить лого "как эппл, но груша" вы не смогли.
3. Отражение есть, и оно уместно получилось за счет блюра. Я, если помните, говорил про пропорции и зеркальное отражение. Что касается пропорций - сами можете оценить, скажем так, крайне произвольные размеры планшета относительно остальной фигуры.
4. С надписями - да, это единственная сетка которая (как я понимаю) может разместить заданную надпись в указанном месте. Удивлен уже этим, подозреваю тут какую-то хитрость, скажем последовательную обработку картинки двумя нейросетями. Однако надписи и лого, которые она помещает сама (на рукав) все еще "произвольный рисунок на тему логотипа".
Чтобы понять о чем я, попробуйте сделать вот что - для себя, вы ж наверняка хотите лучше понять среду - опишите детально предмет, скажем, чайную чашку - размер, форма, узор. И попробуйте нарисовать сервиз из восьми чашек, соответствующих описанию, вокруг графина. Ну или группу вот таких одинаковых инопланетян, раз уж они вам так полюбились. Каждый предмет в группе будет сгенерирован отдельно, и потому получится немного другим. Насколько другим - зависит от вариативности сетки, вот мне кажется однотипные ботинки на всех ваших примерах как раз признак слишком узкого датасета конкретной нейросети.
Reply
Спасибо вам за эту дискуссию с misha_panda
Много узнала!
Reply
Сейчас вот только понял, как запускается самая полная её версия, до сих пор запускал немного урезанную.
Это единственная ОПЕНСОРСНАЯ сетка которая может сама разместить надпись заданного содержания в конкретном стиле нужном месте.
Есть ещё и Dall-e3, но она закрытая и работает на сервере правообладателя.
Нейронка по запросу рисует достаточно разнообразную обувь от кроссовок, и ботинок, до вышитых сапог волшебника и бронированных башмаков рыцаря.
Reply
Я лаборантом занимался нейросетями в конце 80х, мы с их помощью проектировали микроконтроллеры. Ну, точнее это была некая попытка - кончившаяся тем же самым, мы очень быстро получили почти идеальный результат, но дальше двинуться не смогли. Можно было быстро получить схему распайки типовой платы, но стоит шагнуть в нетипичное - и трудозатраты на проверку результата начали зашкаливать.
Повторюсь, мой скепсис не о том, что оно не работает - наоборот. Он о том, что она слишком хорошо работает и отвлекает людей от, скажем так, олдскульной алгоритмизации. Которая как минимум помогает разобраться в задаче. Ну, если мы говорим о проектировании настоящего искусственного интеллекта или хотя бы мелких прикладных критичных задач, вроде того же автопилота.
Reply
Leave a comment