Написал мне мой одноклассник, живущий в США:
"Как большинство computer scientist, работающих в области data mining и natural language processing, я обычно придерживаюсь мнения что лингвистика (как подход к пониманию языка) скорее мешает, чем помогает разрабатывать эффективные системы для работы с языком."
Если брать современное состояние теоретической и компьютерной лингвистики, то с ним нужно согласиться. Data mining -- это автоматическое извлечение данных. Когда компьютер, например, просмотрит публикации последних месяцев и в краткой форме выдаст сводку о том, как вы выглядели в прессе. Бывает еще всякий
автоматический перевод и
распознавание речи. Так вот, для этих задач статистика работает весьма хорошо, а правила будут только мешать. Я говорю не о тех правилах, которые прописываются в словарной статье своих слов ("порося" -- это животное или деепричастие?), а о тех правилах, которые Хомский относил к вычислительной системе нашего мозга.
Но сейчас это просто разные задачи. Изучение того, как птицы летают, и изготовление современных печек по кулинарной обработке этих самых птиц.