Робот Lexy, которого создатели называют «интеллектуальным домашним помощником» и «собеседником», был представлен на прошедшей в Сколково конференции «Искусственный интеллект и естественный язык». В проекте задействованы сразу три российские компании. Разработкой «железа» и системы управления «помощником» занимается участник Кластера информационных технологий Фонда «Сколково» Lexy. Команда разработчиков Lexy уже получила некоторую известность на российском рынке благодаря роботу телеприсутствия Webot, созданному в рамках компании Wicron. Партнером проекта Lexy является компания «Наносемантика», тоже являющаяся участником «Сколково» - она отвечает за «мозг» и «эмоции» робота. Решение для оффлайнового распознавания речи сделала компания «Стэл».
В таком дизайне робот-собеседник поступит на рынок. Фото предоставлено разработчиками Lexy.
Руководитель проекта Lexy Дмитрий Суворов в интервью Sk.ru рассказал об особенностях робота, а также назвал предположительные сроки выхода Lexy на рынок и его ориентировочную стоимость.
- На каком этапе находится разработка Lexy?
- Сейчас мы работаем над тем, чтобы Lexy как можно лучше понимал естественную человеческую речь. Вообще, к устройствам типа «голосовой собеседник» есть два вопроса: насколько хорошо устройство понимает человеческую речь и насколько хорошо оно понимает смысл сказанного.
- Как это работает?
- Понимание речи - это, буквально перевод сказанной человеком фразы в текст. Здесь есть два компонента: движок распознавания речи и железо. Мы разработали специальную звуковую карту, которая позволяет роботу лучше распознавать речь. Кроме того, она позволяет Lexy понимать фразы в том момент, когда говорит он сам. Ни у кого из конкурентов на данный момент такого нет. Обычно, когда вы говорите с роботом, вы не можете его перебить. Отдали команду - и он ее выполняет. Попросили рассказать стишок - и он зарядил поэму на 15 минут. Пока он не договорит, вы его не остановите. С Lexy будет не так. Его можно попросить остановиться и поговорить о чем-то другом - и он поймет.
Обычно для того, чтобы человек мог поговорит с роботом, необходимо наличие интернет-соединения. Наши партнеры сделали оффлайновое решение - с собеседником можно общаться без интернета.
- Когда вы планируете закончить работу над Lexy и выпустить его на рынок?
- Через три месяца мы должны закончить разработку электроники в финальном дизайне робота и начать изготовления первой партии в 100 штук. Они будут протестированы группой пользователей. После окончания тестов, сбора отзывов и, возможно, каких-то доработок, мы сделаем партию в тысячу штук и начнем поставки небольших партий Lexy дилерам. Если это окажется интересным, будем заключать контракты на поставки больших партий.
- Можно ли перенести «мозг» и способность к разговорам Lexy в других роботов - например, использовать их в Webot?
- Сейчас Webot и Lexy - два разных проекта. Для первого мы делаем систему автоматического движения - чтобы робот мог свободно ездить сам, понимал, где он находится, объезжал людей и препятствия. В Lexy основное внимание сейчас уделяется его разговорным «навыкам». Через год работа над Webot будет полностью завершена, а Lexy выйдет на высокий уровень развития. И тогда, скорее всего, проекты будут интегрированы - можно будет научить Webot понимать человеческую речь, и тем самым расширить сферы его применения. Например, его можно будет использовать в качестве консультанта в магазине - робот сможет отвести человека к нужному прилавку, рассказать о товаре, проводить на кассу.
- Почему вы выбрали для Lexy такой строгий внешний вид, а не сделали, к примеру, милую игрушку, с которой можно общаться?
- Сейчас мы ориентируемся на взрослых людей - лет от 20. В будущем мы хотели бы сделать отдельный проект - робота для детей. Для этого потребуется как переработка внешнего вида, так и переработка характера. Сейчас характер Lexy сложноват для маленьких детей.
- Lexy говорит только по-русски?
- Пока да - мы изначально ориентируемся на российский рынок, из чисто-коммерческих соображений. Да и разработчики говорят на русском языке, нам просто удобнее отлаживать все механизмы на родном языке. В будущем мы рассматриваем возможность выхода на азиатские и англоговорящие рынки. Для этого нужно будет применять систему распознавания речи, работающую с английским и другими языками. Но сначала мы хотим добиться результатов в России.
- Для чего вообще нужен Lexy?
- Lexy разгружает визуальный канал общения. Лет 15 назад у людей не было такой перегруженности «экранами». Человек приходил домой, садился за компьютер, что-то делал. Для этого надо было сидеть в определенном месте. Теперь есть смартфоны и планшеты - люди с ними не расстаются. Lexy - это следующий шаг человеко-машинного интерфейса. Представьте, вы приходите домой и произносите: «Lexy, что нового в почте?». И робот вам отвечает. Требуется меньше времени, меньше действий, это проще и удобнее. Люди привыкли к смартфонам и планшетам, а следующий этап - голосовые интерфейсы.
Второй момент - мы делаем не просто помощника, а еще и собеседника. Помощнику что-то сказал, попросил что-то сделать и все, тема закрыта. Собеседник - это робот, с которым можно просто поболтать. Он может вас развлекать, веселить. Ну а если вы просите десять раз за пять минут проверить почту - он вам просто откажет, потому что вы ему надоели. Да, Lexy - робот с характером, у него есть эмоции, настроение, он может уставать, у него есть самооценка. Он может даже немного лгать. В меру, конечно - это сделано для того, чтобы сделать его более похожим в общении на настоящего человека.
- Сколько будет стоить Lexy?
- Пока мы рассчитываем на цену 20-25 тысяч рублей в рознице. Но все, естественно, зависит от объемов партий. Есть потенциал к снижению цены.