ПОЧЕМУ РУССКИЙ СТАЛ ВТОРЫМ ЯЗЫКОМ ИНТЕРНЕТА?

May 02, 2013 11:30


Фонд "Русский мир"
ПОЧЕМУ РУССКИЙ СТАЛ ВТОРЫМ ЯЗЫКОМ ИНТЕРНЕТА?
04.04.2013




В конце марта «Русский мир» сообщал, что по частоте употребления русский язык вышел на второе место во Всемирной паутине. К такому выводу пришла австрийская компания W3Techs, объявившая, что число сайтов на русском теперь немного больше, чем на немецком, ранее занимавшем второе место после английского.

Российский лингвист Борис Орехов прокомментировал по просьбеЛенты.ру полученные австрийскими статистиками данные. Во-первых, он пояснил, как происходили подсчёты. Грубо говоря, для того, чтобы понять, на каком языке создан сайт, нужно его загрузить и проанализировать содержимое. Однако сделать это на 100% при гигантском объёме нынешнего Интернета (на сегодня это около 750 млрд гигабайтов) практически невозможно. Стало быть, роботы, которые осуществляют эту задачу, скорее всего, загружают только главную страницу сайта, не углубляясь, что называется, в дебри. Такой подход влияет, разумеется, и на точность подсчётов, что признаёт и сама W3Techs.

Существуют и другие технические нюансы, связанные, прежде всего, с точностью оценки языковой составляющей в социальных сетях. Ведь там записи могут вестись сразу на нескольких языках, а разноязычные комментарии - обычное дело.

Стоит помнить и о таком обстоятельстве, как трудность автоматического определения языка.  Гарантию, что машина определит язык безупречно, не может дать никто. «Сложностей с различением японского и французского языков, скорее всего, не возникнет - у них разная письменность. Но сумеет ли машина верно увидеть, русский язык перед ней или болгарский, уже большой вопрос. Системы распознавания вообще чрезвычайно сложны и трудоёмки в разработке, с ними не всегда справляются даже крупные компании», - пишет Орехов.



Он также напоминает о сложности программного определения транслитерированного текста, то есть написанного на русском, но латинскими буквами. В 90-е годы некоторое количество (сейчас цифра небольшая, но тогда это был существенный процент) страниц на русском было создано именно таким образом. Теоретически их аналитическая программа может принять за иноязычные тексты.

Словом, выводы австрийской компании в целом и не вызывают недоверия. Всё же нужно воспринимать с известной долей научно обоснованного скепсиса, особенно учитывая, что, по версии W3Techs, русский обошёл немецкий совсем немного.

Русскоязычная сфера в Интернете развивается семимильными шагами, и запас ещё велик, ведь даже Россия по уровне интернетизации населения далеко не в числе первых, что уж говорить о преимущественно русскоязычной интернет-среде большинства постсовестских республик.

По мнению Орехова, мы в чистом виде наблюдаем так называемый «эффект низкого старта». Несмотря на бурную и давнюю (как нам кажется) жизнь Рунета русскоязычные пользователи по сути только начинают поставлять в Интернет свои тексты. Поэтому и динамика роста у русского языка гораздо выше, чем у того же немецкого или, скажем, французского - языков в интернет-измерении более зрелых.

Впрочем, и тут у русского очень сильные конкуренты. Ведь по распространённости в мире русский - лишь на шестом месте (по другим данным, ещё ниже). Это значит, что десятки, а точнее сотни миллионов, индусов, китайцев, жителей Латинской Америки и арабоязычных стран ещё только ждут своей очереди на доступ в Интернет. Очевидно, что второе место русского - временное явление. Какое-то время оно будет укрепляться, но лишь до тех пор, пока китайское или индийское правительства не возьмутся за дело всерьёз. Таковы объективные цифры. Впрочем, вряд ли стоит сильно переживать по этому поводу. В конце концов, главное - качество текстов, а не количество. И тут уже всё зависит от нас.

Елена Вешкина

русский язык, статистика, язык Рунета, язык Интернета

Previous post Next post
Up