О русском языке

May 14, 2019 17:00

О. Чагин

Известный просветитель Александр Пиперски совсем недавно написал для интернет-издания «Нож» очень смешную статью, ссылку на которую мы даже публиковали. Там сказано, что самый простой способ учить язык - это взять частотный словарь, в котором слова отсортированы по употребительности, и заучивать его сверху вниз. Статья полна оптимистических предсказаний; вдохновленный читатель с облегчением узнает из нее, например, что, овладев русскими словами «в», «и», «на» и «не», он сможет понять 10 % любого текста на этом языке!

Оставим сейчас в стороне тревожащие вопросы типа: «что это вообще такое - понять 10 % текста?» и «если в некоем тексте, к примеру, нет этих слов, значит ли это, что 100 % его смысла непостижимы?» - так вот, отринув эти мучительные мысли, поговорим кое о чем посерьезнее.

Давно известно, что слова в любом языке, в том числе и в русском, употребляются с разной частотой, причем эти различия очень существенны: если верить «закону Ципфа», частотность каждого слова обратно пропорциональна его номеру в частотном списке. Иначе говоря, в списке из 1000 слов последнее будет употребяться в тысячу раз реже, чем первое.


Известно также, что чем более частотно слово, тем оно короче. Этому (как и предыдущему) феномену, строго говоря, нет научного объяснения. В современной литературе предлагается, как правило, диахронически-экономическая мотивировка: слова, которые употребляются чаще, имеют тенденцию к упрощению морфемной структуры и сокращению фонемного состава. По-простому, со временем изнашиваются - как ботинки. Жаль, что Пиперски об этом не пишет, такие сведения могли бы еще сильнее взбодрить его алчущих знаний читателей: и самих-то частотных слов немного, так еще и запоминать их, оказывается, легче легкого!

Эх, как тут не вспомнить слова Кати из фильма «Москва слезам не верит»: «Это верно. Только ты пока ребятам не рассказывай, что как раз когда всего добьешься в жизни - больше всего волком завыть хочется».

Дело в том, что есть еще один закон - назовем его хоть «закон Глазария», - который гласит: чем частотнее и короче слово, тем больше у него значений. Мы не будем сейчас решать философскую проблему курицы и яйца: какой из факторов обусловливает другие, - здесь возможно изобилие вариантов. Просто продемонстрируем, что это действительно так.

Мы взяли «Частотный словарь современного русского языка (на материалах Национального корпуса русского языка)» О. Н. Ляшевской и С. А. Шарова и выбрали из представленных в нем 1002 существительных 10 самых частотных, 10 из середины списка и 10 наименее употребительных. Для каждого из 30 существительных было сосчитано количество слогов и количество значений (по материалам Большого толкового словаря русского языка под ред. С. А. Кузнецова и Интегрированной лексикографической базы данных gramma.spbu.ru; омонимы для простоты учитывались наряду с отдельными значениями слова); для каждой из трех групп - среднее обоих показателей.

Результаты представлены на снимке. Да, более простые, с формальной точки зрения, слова употребляются чаще, чем более сложные. Проблема в том, что они употребляются в гораздо большем числе значений, - а это, согласитесь, серьезно меняет картину.



русский язык

Previous post Next post
Up