- Открыть папку Films. - Вы хотите прикрыть лавку Филса?

Jun 07, 2011 00:53

Недавно я решила поинтересоваться программами распознавания речи.  
Транскрайберы, пожалуй, я освещу в одной из будущих записей (пригодится тем, кому мало возможностей Express Scribe).

А вот ситуация с распознаванием речи оказалась любопытной. Нормальных программ для этой цели немного, и большинство из них очень платные. Логично. Но русскоязычные среди них почти не представлены, особенно если требовать хоть сколько-нибудь удовлетворительного качества результатов.

Если Вы планируете заняться распознаванием, допустим, английского и готовы отдать на это 70-600 фунтов стерлингов - выбирайте Dragon NaturallySpeaking или что-то сходное из драконовой линейки Nuance. Также можно воспользоваться, например, Speech Analysis Models (встраиваются в Adobe Creative Suite).

Но что же делать сотням миллионов русскоговорящих людей? Картина распознавания русской речи выглядит довольно уныло. В большинстве программ такая функция просто не поддерживается:( . Программы, способные адекватно опознать наш великий и могучий, делают это со значительными сложностями и оказываются не стоящими вкладываемых затрат и, главное, времени. Но ведь прогресс не стоит на месте! Цель качественного (?) распознавания русского вроде как достигнута такими разработчиками, как питерский Центр Речевых Технологий (ЦРТ) и минский Sakrament, однако выход на уровень повседневной практики пока затруднён: в русском языке необычайно много словоформ (ещё и похожих друг на друга…) и сложная грамматика. Поэтому разработки вышеупомянутых компаний существуют пока в относительно закрытом для рядовых пользователей коммерческом пространстве (ЦРТ сотрудничает с корпоративными заказчиками, органами власти и здравоохранения РФ) и требуют немалых финансовых вложений для приобретения. Из бесплатных же аналогов можно (скорее ради любопытства, чем из соображений удобства) попробовать Горыныч ПРОФ, если, конечно, не передумаете после прочтения материала по ссылке. Компания VoiceLock, заявленная как разработчик «Горыныча», даже не представлена в интернете. Что ж, это их дело.

А у нас есть повод для надежды на лучшее.

Уже не раз упоминавшийся в этом посте ЦРТ обещает выпустить к концу текущего (2011, то бишь) года «приложение для трансляции русской разговорной речи в текст» - видимо, нечто наподобие Dragon Dictation для айфонов и иже с ними. Будем надеяться, это событие хоть сколько-нибудь спасёт положение для простых смертных обладателей подобной техники: разработчики обещают приложению большую интеллектуальность, способность правильно обрабатывать множество похожих форм слов и учитывать правила русского языка.

Что ж, следим за анонсами!)

программы распознавания речи

Previous post Next post
Up