Оттенки голосового ввода

Feb 17, 2017 11:00

Поисковые системы много лет приучали людей к тому, что запрос нужно задавать без вопросительного знака, что не совпадает с тем, как люди общаются друг с другом. Алгоритмы будущего будут отличать вопросы ("где тут ближайшая больница?") от повествовательных предложений ("больница малая бронная").

Вопрос про чуткость и ум алгоритма.

Следующий уровень - это не просто распознавать знак вопроса как "?", а понимать, что предложение вопросительное.

Условная Сири должна уметь отличать "завтра в 10:30" от "завтра в 10:30?" и давать разные ответы - "есть" или "так точно".

Сейчас этого на рынке никто не демонстрирует.

Еще любопытно, насколько по-разному умеют понимать голос сегодняшние поисковые системы.

Попробуйте сказать в разных поисковых системах "здорово запятая чепушило". Одна система распознает "здовово, чепушило", а другая - "здорово запятая чепушило". То же самое касается слов "тире", "новая строка" и других знаков препинания. Одни ребята об этом подумали (Эппл), а другие - нет (Гугл).

Причем, хорошие ребята понимают разницу между скоростью произношения. Если не делать паузы до и после слов "новая строка", то ввод будет текстом ("привет новая строка как дела"). А если сделать небольшие паузы, то курсор переедет на новую строку, как будто живая секретарша следит за диктантом (привет
как дела).

голос, интерфейс, ввод, поиск, распознование

Previous post Next post
Up