Что нового могут делать нейросети?

Oct 31, 2024 08:03


Кроме прочего, теперь нейросети пишут точные субтитры к видеороликам (распознавание речи!) и создают текстовые описания фотоснимков. А Скайп еще предложил синхронный перевод с языка на язык во время видеозвонков! Мне нравится такое будущее! А вам? Что бы вы еще у разработчиков попросили?

техника, технология

Leave a comment

Comments 76

matholimp October 31 2024, 05:22:34 UTC

Распознавание речи используется нейросетями, но не имеет к ним прямого отношения. Это совсем другая задача. На кафедре математической лингвистики филфака ЛГУ её решением начали заниматься ещё в конце 1960-х. Компьютерные ресурсы, позволяющие распознавать с голоса, появились только в начале 2000-х, но теоретический аппарат был создан раньше.

Reply

scholarpunk October 31 2024, 12:32:39 UTC

Дадад, прям как Ботвинник с шахматным компьютером при совке... Начали-начали, и прозанималися бесплодно на стабильном оклае, пока у буржуев БЯМы не шарахнули...

Reply

matholimp October 31 2024, 12:42:21 UTC

Какие претензии к Ботвиннику? Разве шахматные программы в итоге не разнесли в пух и прах Карпова и Каспарова?

Reply

scholarpunk October 31 2024, 12:57:55 UTC

Только не Ботвинниковские, отнюдь!

А ваащпэ ети шахматы - лоховская замутка! Нормальные - индийские - шахматы, когда возникли, в себя кости включали - кубики бросали, какой фигурой кому когда ходить... Вот это игра была! А это так, тю выхолощенное.

Reply


ab_dachshund October 31 2024, 05:36:49 UTC
Для начала соглашусь - в нейросетях нет ничего принципиально нового. Каждый момент, каждая область применения за которые их нахваливают - уже были раньше, просто может быть чуть хуже качеством. Буквально все - от генерации текстов до дипфейковых видео. Просто с нейросетями это технически проще. Хотя и это вопрос спорный, у нейросетей есть свои очевидные и непреодалимые ограничения, типа пресловутых "пальцев на картинках". Пальцы - это просто самое нелепое и наглядное ( ... )

Reply

abyssal_being November 1 2024, 05:42:59 UTC

Доводка практически невозможна, можно только выбросить старую нейросеть и обучить новую на улучшенном датасете! Этому я внимаю как глубокой мудрости! Ведь и с людьми то же самое происходит, и вот почему плохи старики во многих профессиях, а надо нанимать молодежь - потому что уж чему научились, тому научились, давно это было, с тех пор вводные данные отфильтровались и дополнились.

Мне про пальцы раньше не попадалось, и я почитала. В датасетах редко встречается пятерня, и часто рука что-то держит и видна только частично, и нейросеточка думает, что так и должна выглядеть кисть, и если ее просят нарисовать, то так и рисует, как запомнила. Может половину пальцев обрубить или наоборот, нарисовать лишние пальцы. Это я не вам рассказываю, вы знаете. Это тем, кто любит читать комменты, когда им тема интересна.

Reply

ab_dachshund November 1 2024, 05:53:08 UTC
Она не рисует "кисть", она просто рисует что-то, условно, чем на других картинках заканчивается ладонь. Обычно это сколько-то пальцев. Как только рисовалки появились, проблема с пальцами уже была - и это как раз хороший пример. В обычном алгоритме если уж смог нарисовать человека целиком, то поправить пальцы - несложная доводка. Нашел где-то в коде константу, поправил на "5" - и все дела. Тут же это непреодолимое препятствие, при всей нелепости.

Есть и другие вещи - она не может рисовать эмблемы, логотипы. Просто рисует какую-то каляку той же формы. Ну и уж конечно буквы и надписи получаются разве что случайно, если они и так были частью картинки на которой ее обучали. Всегда проблемы с перспективой, взаимным масштабом объектов, отражениями (обычно отражение в зеркале при компьютерной графике - чуть ли не самое простое, но нейросеть не "отражает", а просто рисует то, что в зеркале, с нуля), тенями. Да что там, невозможно заставить нарисовать ее два одинаковых ботинка - они всегда будут в лучшем случае немного похожи один на другой.

Reply

abyssal_being November 4 2024, 09:31:06 UTC

Это вы мне очень важные вещи рассказываете!! На чем ее глючит. Да, неожиданно!!

Reply


livejournal October 31 2024, 06:34:45 UTC
Здравствуйте! Ваша запись попала в топ-25 популярных записей Московского региона в LiveJournal. Подробнее о рейтинге читайте в Справке.

Reply


meadow22 October 31 2024, 07:17:25 UTC

Это в кино (Чёрное зеркало, вроде) уже было - виртуальная версия личности, например, умершего человека.

Reply

misha_panda October 31 2024, 10:32:43 UTC
В книгах было раньше.

Reply

abyssal_being November 1 2024, 05:45:32 UTC

😀 Мне такой сюжет никогда не попадался. Интересно! Так что? Вот это заказали бы у разработчиков? Кого-то из близких воссоздали бы? Например, отца советчика или маму-утешительницу? Понимаю!

Reply


papa4iter October 31 2024, 07:18:39 UTC
Недавно обратил внимание, что когда Яндекс выдает результаты поискового запроса, вверху появилась категория «нейро». Пока не разбирался подробно, но некоторые варианты ответов мне понравились... Вот недавно по твоей наводке уточнял породы собак с короткими лапками, и получил очень хорошую подборку именно в категории нейро...

Reply

abyssal_being November 1 2024, 05:47:44 UTC

Хм!! 😀 Интересно! Мне вроде не попадалось еще. Но буду теперь обращать внимание и разбираться, что это и зачем. А приятнее, конечно, было бы, если б тут кто-то из программистов откликнулся и объяснил в двух словах. да? 😀

Reply


Leave a comment

Up