Пример очередного технологического прорыва: распознавание речи

Dec 22, 2014 15:40

Прорыв в распознавании речи -- это хороший пример опровержения аргумента "вы уже двадцать лет говорите, что XXX будет реализовано, и ничего этого не происходит. Значит, и не произойдёт". Вот статья 2010 года, в которой говорится, что в распознавании речи давно ничего не происходит, поэтому "зелен виноград" -- делается вывод о том, что распознавание ( Read more... )

Leave a comment

Comments 26

bbb December 22 2014, 12:54:11 UTC
Ага, причем бывает и так, что жизнь УЖЕ поменялась, а люди все продолжают говорить, что она поменяться не может - http://trurle.livejournal.com/1192320.html?thread=12701056#t12701056

Reply

ailev December 22 2014, 13:09:47 UTC
Вау, и это в июле 2014! Я специально удержался от того, чтобы привести пример автомобиля без водителя: считал, что это уже общее место, и его давным-давно проехали (pun intended).

Но ты терпелив в диалогах, я б сорвался намного раньше )))

Reply

bbb December 22 2014, 13:27:52 UTC
Я терпелив в общении с теми, кого считаю своими собеседниками, и вообще не общаюсь с теми, кого собеседниками больше не считаю :)

Reply

toshick December 22 2014, 18:16:28 UTC
Справедливости ради - тебе там правильно говорят.
Самоедущий автомобиль существует пока что как демонстрационный образец, и не вполне ясно, действительно ли он решает задачу распознавания того, что вокруг. Если действительно они только сравнивают статическую картинку с текущей, то это - НЕ решание задачи, а обман, и даже ни разу не продвижение к решению.
Получается, что да - повозка вроде бы есть, но гештальт не закрыт.

Reply


olegstepanov December 22 2014, 14:27:54 UTC

juncus December 22 2014, 20:11:22 UTC
Это все замечательно, и я приветствую изменения к лучшему, но "наш мир нелинеен".

Во-первых, в задачах распознавания не имеет значения "улучшилось на х%". Имеет значение "преодолелся ли порог целесобразности внедрения". С ошибкой 6,5% для речи - однозначно нет. Например, по моей памяти для OCR порог был где-то в районе 3% (файнридер третьей версии).

Во-вторых, преодоление и улучшение порога - это тоже нелинейная задача. Каждый новый процент прироста дается значительно сложнее предыдущего. То есть относительно легко сделать распознавалку, которая прыгнет с нуля до ошибки в 30%, прыгнуть с 30% до 20% будет в разы сложнее, с 20% до 10% в разы сложнее, чем второй прыжок, и так далее по убывающей экспоненте. Именно из-за этого были есть и будут чересчур оптимистичные прогнозы.

Так что рано радоваться. Хотя может выстрелить джокер - распознавание прыгнет сразу на много. То есть прогресс тоже идет нелинейно - скачками. Вопрос лишь в том, что скачки непредсказуемы и стохастичны...

Reply


(The comment has been removed)

ailev December 22 2014, 21:05:04 UTC
Я, вроде, регулярно об этом пишу: появились эффективные алгоритмы deep learning.

Reply


1master December 22 2014, 21:38:58 UTC
Вот, кстати, вполне реальное изменение из последних: http://www.skype.com/translator

Reply

ailev December 22 2014, 21:55:36 UTC
Да, это из этой же серии -- собрано в кучку огромное число относительно новых технологий.

Reply


Leave a comment

Up