Mar 31, 2016 14:11
В фб в комментариях возникла небольшая дискуссия на тему: почему в шахматы компьютер уже научился играть, а адекватно переводить с одного языка на другой - нет? Там в комментариях я немного высказался на эту тему, но мне захотелось немного развить мысль.
Так вот ответ простой: логика и объём контекста.
Шахматы - это строгая логика и относительно небольшой объём контекста. Грубо говоря, есть десяток фигур, которые могут ходить так-то и так-то, и количество вариантов расположения фигур на доске большое, но конечное и относительно обозримое. Т.е. шахматную логику довольно просто формализовать.
Если провести аналогию языка с шахматами и представить слова в виде фигур, то фигур получится, мягко выражаясь, чуть больше, чем дохера. Доска будет не плоская-квадратная, а со сложной геометрией и вдобавок - многомерная. Потому что у слова может быть дофига значений (ось x), слово может быть разными частями речи (ось y), слово может играть в предложении разные роли (ось z) и т.д. К тому же слово может изменяться на лету: и в смысле формы, и в смысле содержания. Это как если бы посередине партии в шахматы я бы сказал: "А теперь мой конь превращается в конька-горбунка и может ходить не только буквой Г, но и буквами фи, хи, пси и ещё омегой, коли совсем уж припрёт!". И для разных языков все эти наборы будут разные. Т.е. перевести с одного языка на другой - это как перевести ходы шахматных фигур в ходы камней го, а то и в ходы в подкидном дураке. Оцените, как говорится, масштаб трагедии!
Возвращаясь к нашим компьютерам, что они такое? Они - голая математика. Компьютер действует в пределах чёткой логики: единичка - нолик, истина - ложь, да - нет. Как шахматы. Но в математике есть так же раздел - нечёткая логика. Это когда между единичкой и ноликом существуют ещё бесконечное количество вариантов, т.е. не просто "да - нет", а "да, нет, не знаю, может быть, иногда, ну если, я ещё не решил, и знать не хочу..." и ещё мильён вариантов. Т.е. язык действует по законам нечёткой логики, постоянно при этом изменяясь.
Для решения задач с нечёткой логикой используются нейронные сети и искусственный интеллект. Их возможности пока ещё очень далеки от возможностей человеческого мозга, а "число Шеннона" для языка превосходит число Шеннона для шахмат в эх, раз, ещё раз, ещё много, много, много-много-много раз.
И как человек не чуждый языка и слова всем этим я могу только восхищаться! :)
размышлизмы