Oct 31, 2024 08:03
Кроме прочего, теперь нейросети пишут точные субтитры к видеороликам (распознавание речи!) и создают текстовые описания фотоснимков. А Скайп еще предложил синхронный перевод с языка на язык во время видеозвонков! Мне нравится такое будущее! А вам? Что бы вы еще у разработчиков попросили?
техника,
технология
Leave a comment
Reply
Доводка практически невозможна, можно только выбросить старую нейросеть и обучить новую на улучшенном датасете! Этому я внимаю как глубокой мудрости! Ведь и с людьми то же самое происходит, и вот почему плохи старики во многих профессиях, а надо нанимать молодежь - потому что уж чему научились, тому научились, давно это было, с тех пор вводные данные отфильтровались и дополнились.
Мне про пальцы раньше не попадалось, и я почитала. В датасетах редко встречается пятерня, и часто рука что-то держит и видна только частично, и нейросеточка думает, что так и должна выглядеть кисть, и если ее просят нарисовать, то так и рисует, как запомнила. Может половину пальцев обрубить или наоборот, нарисовать лишние пальцы. Это я не вам рассказываю, вы знаете. Это тем, кто любит читать комменты, когда им тема интересна.
Reply
Есть и другие вещи - она не может рисовать эмблемы, логотипы. Просто рисует какую-то каляку той же формы. Ну и уж конечно буквы и надписи получаются разве что случайно, если они и так были частью картинки на которой ее обучали. Всегда проблемы с перспективой, взаимным масштабом объектов, отражениями (обычно отражение в зеркале при компьютерной графике - чуть ли не самое простое, но нейросеть не "отражает", а просто рисует то, что в зеркале, с нуля), тенями. Да что там, невозможно заставить нарисовать ее два одинаковых ботинка - они всегда будут в лучшем случае немного похожи один на другой.
Reply
Это вы мне очень важные вещи рассказываете!! На чем ее глючит. Да, неожиданно!!
Reply
Иногда интересно получается - я не говорю что нейросети отстой. Но это в некотором роде тупик в плане создания реального машинного интеллекта.
Reply
😀 😀 😀 Вот это да!! Мнение специалиста! Почти отстой и тупик в развитии. А какая линия развития тогда многообещающая? О чем мне почитать?
Reply
( ... )
Reply
Ботинки кстати разные, приглядитесь - швы вокруг клапанов вблизи носка по-разному скроены. Хотя конечно видали и похуже генерацию, эти почти идентичны. Логотип без "укуса" (я не знаю что хотел автор скрипта, но очевидно что просто нарисовать грушу и стилизовать грушу под лого эппл - разные задачи). К надписи вопросов нет, кроме того - была ли она частью модифицируемой картинки или ее задали скриптом.
Reply
К ботинкам вы придираетесь, я отличий не вижу.
Надпись указана в промте, но в этой нейронке есть встроенная языковая модель так, что если она даже генерит иероглифы, то гуглперевод показывает их значение и обычно они имеют отношение к теме рисунка.
Кириллицу по умолчанию не понимает ни в каком виде нужно дообучать.
( ... )
Reply
Reply
Вот вам кепка CCCP и ковбойские сапоги.
Даже отражение сапог немножко ...
Грушу и логотип эппла нарисовал просто рядом.
( ... )
Reply
Reply
Спасибо вам за эту дискуссию с misha_panda
Много узнала!
Reply
Сейчас вот только понял, как запускается самая полная её версия, до сих пор запускал немного урезанную.
Это единственная ОПЕНСОРСНАЯ сетка которая может сама разместить надпись заданного содержания в конкретном стиле нужном месте.
Есть ещё и Dall-e3, но она закрытая и работает на сервере правообладателя.
Нейронка по запросу рисует достаточно разнообразную обувь от кроссовок, и ботинок, до вышитых сапог волшебника и бронированных башмаков рыцаря.
Reply
Reply
спасибо вам за эту дискуссию с ab_dachshund
Много узнала!
Reply
Leave a comment