Математики по-новому взглянули на изменение языков

Feb 18, 2019 23:52



РИА НОВОСТИ
18 апреля 2016, 10:13




© Fotolia / felix
Исследователи с помощью модифицированной математической функции изучили английские произведения 1850-1950-х годов. Эта методика помогла ученым впервые определить главные отличия текстов разных временных отрезков.

МОСКВА, 18 апр - РИА Новости. Ученые разработали новый метод сравнения больших объемов данных для изучения языка, ДНК и других объектов, представляющих собой последовательность символов, пишет Physics. Полная версия статьи опубликована в издании Physical Review X.



Ученые для исследования того, как меняются языки, прибегли к данным сервиса Google Ngram, который анализирует книги из базы Google Books. Как отмечают математики, исследовать книги можно было двумя способами: посчитать слова, которые есть в одном произведении, но отсутствуют в другом, или подсчитать частоту использования тех или иных слов.

Ученые использовали второй метод и проанализировали произведения на английском языке, опубликованные в 1850, 1900 и 1950-х годах. Они применили модифицированную математическую функцию - расстояние Йенсена - Шеннона, которая используется для анализа сходства и различий наборов символов, в качестве которых в том числе могут выступать и слова.

Как выяснили ученые, больше всего тексты различаются редко используемыми словами, а не часто используемыми - методы исследования, применяемые ранее, выяснить это не могли. Математики полагают, что результаты могут быть верны не только для английского, но и для русского и испанского языков.

Лучшие комментарии

Wasilyev Vladimir
18 апреля 2016, 11:48
Ребята, аспиранты и преподаватели с " Прикладной ( структурной) лингвистики " филфака МГУ, шутя делали нечто подобное в 70-е годы прошлого века. Да и в позапрошлом веке лингвисты вскользь ( а больше и не надо) решали эти задачки. Снобизм и пренебрежение английских учёных к остальному научному миру феноменально!

Андрей Федотов
18 апреля 2016, 12:13
На мой взгляд это, конечно, интересно, но пока что это не более чем игры с математикой и статистикой. Это любой толковый школьник может сделать, да и само по себе очевидно любому, сколько нибудь соображающему человеку. ;-)

Ведь ясно же что простые слова - он, она - не менялись уже тысячелетия, стол и стул - тоже, хотя и меньше, а вот ложке и вилке - пару столетий, компьютеру - меньше 60 лет. Так что сама закономерность очевидна и банальна. ;-)

Интересное начинается там - где мы видим суть и смысл этих изменений, где начинаем отслеживать динамику социальных процессов по этим изменениям. А её можно отследить - слово компьютер тому пример - а кластер связанных с ним слов очень чётко отразит динамику развития этой технологии.

Но вот об этом ничего не сказано - хотя именно это и было бы по-настоящему интересным и полезным. ;-)

английский язык, язык, математика

Previous post Next post
Up