Корпоративные новости на
YouTube-канале "Сбербанк TV" сегодня начала зачитывать "Елена" - фотореалистичная трёхмерная модель, при помощи нейросетевых алгоритмов имитирующая человеческую мимику и интонации. Программировать её заранее для каждой новости не нужно - достаточно ввести в систему текст.
Click to view
Мимика "Елены" пока небогата, движения губ не всегда соответствуют тексту, а чуть вздернутая с одной стороны верхняя губа придаёт лицу надменное выражение, заставляя вспомнить
легендарный мем "где карту открывали, туда и идите". Говорит "Елена" довольно монотонно, что мешает удерживать внимание на информации. Многие современные TTS-движки (например, используемые "Алисой" от "Яндекса" или Ассистентом Google) звучат реалистичнее.
Аналогичный эксперимент в ноябре прошлого года
представило китайское государственное новостное агентство "Синьхуа". Правда, попав в заголовки новостей по всему миру, англоязычный "ИИ-телеведущий" в эфир больше не выходил. Возможно, дело в том, что современные технологии пока не позволяют имитировать мимику и интонации настолько хорошо, чтобы ведущий сошёл за живого - а без этого пытающийся притвориться человеком робот или 3D-модель не вызывают у большинства зрителей положительных эмоций.
Как сообщили в "Сбербанке" изданию
vc.ru, "Елену" совместно разработали "Сбербанк", компания
"Центр речевых технологий" (контрольный пакет которой "Сбербанк" приобрёл у "Газпромбанка" 12 апреля) и ранее уже сотрудничавшая со "Сбербанком" студия компьютерной графики CGF.
В
портфолио инновационных разработок на сайте студии CGF "нейросетевой" телеведущей пока нет, зато есть система захвата и переноса мимики человека на 3D-персонажа Nimble - когда 3D-моделью "играет" живой актёр, лицо которого сканируется в реальном времени. Основана ли "Елена" каким-то образом на этой разработке, неизвестно.
https://hitech.vesti.ru/article/1203318/