К ВОПРОСУ О ЯЗЫКОЗНАНИИ

Jul 29, 2003 12:48


К ВОПРОСУ О ЯЗЫКОЗНАНИИ

Тема сравнения лингвистических особенностей различных языков заинтересовала многих читателей «Дуэли». Но, судя по ряду откликов, у некоторых из них создалось такое впечатление, что я воздаю излишнюю хвалу английскому языку либо ратую за его полное и скорейшее «внедрение» на российских просторах. Но ни в одном месте своей статьи я не утверждаю ничего подобного. Напротив!

Так например, я подчеркивал, что «для России, вероятно, наиболее показательным и интересным может быть пример Франции: вместо англоязычного термина «хакер» там официально рекомендовано к употреблению французское «pirate informatique» - «пират информатИк». Вот так бережно относятся французы к своей культуре, к своему языку». (см. «Дуэль», № 22 (319), за 2003 г.)

Согласитесь, есть большая разница между тем, что нужно, необходимо для сохранения единства нации и государства, и тем, что мы имеем, так сказать, по факту. Лично я всегда употребляю выражения «моя страна», «наша страна», хочу жить в России и хочу, чтобы мои дети разговаривали по-русски. Так что наш спор не об этом. Он лежит совсем в другой плоскости.

И еще. Мои оппоненты справедливо замечают, что зачастую заимствования происходят по идеологическим (политическим) причинам, а также по причине того, что существует большое число людей, которые любят пустить пыль в глаза, блеснуть эрудицией, приправляя свою речь наукообразными заимствованиями. Все это верно и настолько очевидно, что не требует дополнительных пояснений. Но опубликованная статья, еще раз повторяю, НЕ ОБ ЭТОМ.

* * *

Теперь по существу возражений моих оппонентов, опубликованных в № 27 (324).

Специально для г.Рогожина сообщаю, что при кодировании символов обычно различают прописные и строчные (т.е. «большие» и «маленькие») буквы. Прописная буква «А» в кодировке 866 - это байт 1000000 (128), как я и написал в своей статье. А код, который приводите Вы - 1010000 (160), - соответствует букве «а», т.е. строчной букве.

Теперь по поводу Вашего, г.Рогожин, замечания: «При передаче информации далеко не всегда стремятся упаковать ее как можно плотнее. Нередко ее снабжают контрольными суммами /…/». И далее Вы рекомендуете проверить - в случае ошибок передачи, на каком языке БЫСТРЕЕ потеряется первоначальный смысл.

Но в случае ошибки подсчета контрольной суммы информация просто теряется!

Здесь необходимо небольшое пояснение. Контрольная сумма (она же - контрольная последовательность кадра), по-английски - FCS (Frame Check Sequence) - это избыточная служебная информация, представляющая собой часть передаваемого кадра (блока данных) и позволяющая обнаруживать ошибки, вносимые на физическом уровне. Вычисляется как функция от основной информации по алгоритму, заранее известному принимающей стороне (обычно по стандартному методу CRC).

CRC (Cyclic[al] Redundancy Check[ing]) - это контроль с использованием циклического избыточного кода. Иногда также говорят: «циклический избыточный контроль», «циклический избыточный код». Алгоритм CRC применяется к каждому блоку хранимых или передаваемых данных и заключается в следующем.

Последовательность битов (в виде которой представлен какой-либо блок данных) делится на некоторое контрольное число (делитель), называемое также полиномом. Остатки от деления называются «контрольными разрядами» и помещаются в конце блока отправляемых данных. Принимающая сторона (устройство-приемник) производит аналогичные вычисления над принятым блоком данных и сравнивает результат. Если принятое и вычисленное значения контрольной суммы не совпадают, то блок не считается принятым и посылается запрос на его повторную передачу.

Другой оппонент, г.Маланчев, готов поставить мне «два» как переводчику. И только потому, что в качестве примера я привел фразу из учебников для начинающих («Please, do it tomorrow» - «Пожалуйста, сделайте это завтра»). Сам же г.Маланчев постоянно цитирует западные музыкальные группы Битлз и Supertramp, забывая, наверное, что не все читатели в деталях знакомы с творчеством американских и английских музыкантов. Кроме того, поскольку «Дуэль» не является узкоспециализированным изданием, то, как я полагаю, изложение материала должно быть наглядным и в достаточной мере простым.

Обращаю внимание читателей и на то, что название группы Supertramp (по-русски «Супертрэмп», - оба варианта по 10 знаков) г. Маланчев дал в английском написании, а Битлз в русском (5 знаков - против 7 в английском: Beetles). Похоже, что это наглядная иллюстрация того, как люди машинально, автоматически выбирают более короткий вариант.

Далее г.Маланчев пишет (цитирую): «Климов считает, что калька - это и есть точный перевод». Но подобного утверждения в моей статье нет и близко! Откуда Вы это взяли, г.Маланчев? У меня все как раз наоборот! Если Вы внимательно читали мою статью, то не могли пропустить такой абзац (позволю себе привести его полностью):

«Вообще говоря, выбор именно технического (специального) текста в качестве объекта исследования является более уместным, чем текста художественного. Во-первых, в современном информационном обществе наиболее актуальным является обмен данными именно узкоспециальной тематики - технической, экономической. Во-вторых, технический перевод предполагает более высокую точность с формальной точки зрения, в то время как художественный - требует не столько точности перевода отдельных слов и выражений, сколько передачи художественных особенностей, эмоциональных оттенков, специфического колорита того или иного художественного произведения, а значит, в известной степени отражает субъективный подход переводчика и допускает более свободное (вольное) толкование текста». (см. «Дуэль», № 22 (319), за 2003 г.)

Ведь это же как будто специально для г.Маланчева было написано!

Кроме того, хочу подчеркнуть: деловая документация, представленная в электронной форме (а это, в основном, списочная информация, прейскуранты цен (т.н. «прайс-листы»), всякого рода отчеты, доклады и резюме, написанные казенным штампованным языком, а также спецификации аппаратурных средств, описания программных продуктов и т.д., и т.п.) циркулирует в Интернете и корпоративных сетях в несравнимо больших объемах, чем цитаты из текстов полюбившихся песен или сонеты Шекспира.

В качестве другого аргумента г.Маланчев приводит фразу: «Hi, what have you been doing» - и дает формально верный перевод «Привет, что делаешь».

А теперь попрошу читателей припомнить старую избитую шутку. Один звонит другому по телефону:

-          Привет, что делаешь?

-          С тобой разговариваю.

-          Ха-ха! Ну, я имел ввиду… - и дальше следует состоящее из нескольких слов уточнение, например: «Непосредственно перед тем, как я тебе позвонил?», или: «Нет, перед этим?» или: «А до этого?».

Ну и что, короче получается, чем в английском? А пример, что называется, из жизни, из живого языка. Английский позволяет выразить временнЫе отношения с помощью соответствующих грамматических форм. В данном примере это - настоящее совершенное продолженное (или длительно-итоговое) время - «have been …ing». А в русском языке для передачи того же смысла (т.е. для уточнения временного момента или интервала) пришлось использовать дополнительную фразу.

Жаль только, что рассмотренный пример не очень помогает в нашем споре. Так как, повторюсь, львиная доля электронной документации охватывает иную (профильную, узкоспециальную) тематику.

Между прочим, г.Маланчев, Вы не замечали, что современная молодежь все чаще использует в качестве приветствия английское заимствование «Хай!» - кальку с приведенного вами «Hi». Таковы (к сожалению для нас) реалии современного языка, хотим мы этого или нет. Кстати, при написании (опять-таки к сожалению для нас) «Хай» оказывается чуть-чуть длинней, чем «Hi», но короче, чем «привет».

Теперь о слове Hooligan, которое мой оппонент приводит в качестве следующего примера.

Русское «хулиган» (7 знаков) - это калька с приведенного слова, а подходящие по смыслу синонимы - нарушитель порядка, возмутитель спокойствия, имеют (соответственно) 17 и 23 знака. Хотите более простые эквиваленты? Пожалуйста! Для этого проследим этимологию слова «хулиган».

Английское «Hooligan» имеет и другую форму - «Hoolahan». Это старая английская фамилия. Согласно общеизвестной версии, семья неких Хулигэнов (Хулахэнов) в начале XIX века владела постоялым двором на Дуврской дороге. Они частенько заманивали постояльцев только для того, чтобы их ограбить и впоследствии убить. После осуждения и казни Хулигэнов (Хулахэнов) их имя стало нарицательным. Так что если подбирать соответствующий русский эквивалент с учетом описанных исторических событий, то это, скорее всего, будут «губитель», «грабитель», «разбойник» (соответственно 8, 9 и 9 символов). Есть еще вариант - убийца - (6 знаков), но он, как мне кажется, имеет более общее значение и не совсем точно характеризует суть дела.

Сама же фамилия Hoolahan имеет ирландские корни (см., например: «Словарь английских фамилий», М., Русский язык, 1986). Она происходит от ирландского «O’hUllachain» - в буквальном переводе - «потомок гордого» (кстати, 14 знаков).

Поскольку те немногие примеры, которые приводит мой оппонент, не являются примерами по существу либо сами себя опровергают, я выполню за г.Маланчева «его работу», т.е. постараюсь привести расчеты, которые дадут результат наименее для моих выводов благоприятный. Материал, который мне предстоит подобрать, должен соответствовать следующим критериям:

1)         это должны быть не отдельные слова, а связанные фразы;

2)         материал должен содержать как можно большее количество тех частей речи, по которым русский язык «выигрывает» у английского (т.е. предлоги, союзы, артикли);

3)         русские эквиваленты должны быть не просто максимально точными, но еще и (для чистоты эксперимента) максимально отличаться от подстрочника.

Итак.

Источник, использованный в качестве исходного материала: «Англо-русский фразеологический словарь» (Москва, Русский Язык, 1984). Это фундаментальное издание содержит около 20 тысяч широко употребительных фразеологизмов и идиоматических выражений, богатых по форме и семантике, представляющих трудности как для изучающих английский язык, так и для переводчиков. Например: «no soap» - «Этот номер не пройдет». Очевидно, что дословный перевод не позволит передать смысл указанного выражения. Именно за такие примеры и ратует мой оппонент.

Условия выборки: все фразеологические обороты, представленные, например, на стр. 100, 200, 300, 400, 500, 600 и 700 указанного выше издания. В том случае, если для соответствующего английского оборота приводится несколько русских эквивалентов, учитываем только первый из них.

Результат расчетов: для записи русских эквивалентов требуется на 4 % больше знаков, чем для английских фразеологизмов.

Считайте, проверяйте.

Я неоднократно подчеркивал, что главным предметом рассмотрения в нашей дискуссии являются фрагменты и тексты иной тематики и, соответственно, содержащие несколько иной набор лексических единиц. Но даже при самом благоприятном раскладе (большое количество служебных слов, «художественные воссоздания», многочисленные параллели с русскими разговорными оборотами и пословицами) результат все равно оказывается не в пользу нашего родного языка.

По утверждению г.Маланчева, он готов выставить приз тому, кто даст верный (как я понял из его слов - единственно правильный) перевод английского словосочетания «to add value». Но это лукавство!

Дело в том, что «to add value» (в отличие, например, от «Red Book») относится к таким сочетаниям, которые просто НЕЛЬЗЯ переводить в отрыве от контекста. Этого сочетания действительно нет в словарях, оно действительно не всегда переводится легко, но трудность как раз в том, чтобы из множества вариантов выбрать лучший именно в ЗАВИСИМОСТИ от конкретного содержания переводимого фрагмента (текста). Г.Маланчев, по его утверждению, столкнулся с этим сочетанием один раз «в одной книге по менеджменту» (почему бы, кстати, не сказать по-русски: «книга по вопросам управления»?).

На самом деле сочетание «to add value» является  достаточно распространенным и неизменно вызывает трудности у переводчиков. Оно даже фигурирует периодически в специализированных дискуссиях переводчиков на интернетовских форумах. Например, http://forum.lingvo.ru. Вот маленький отрывок из сообщения одного из участников этого форума: «Периодически дискуссии о value возникают на нашем форуме. К этому слову и к контексту его употребления надо бы относиться очень внимательно. Особенно часто путаница происходит, когда рядом стоят слова to add или added».

Мне это сочетание встречалось десятки раз. Причем, в большинстве случаев переводилось оно по-разному (в зависимости от контекста), а иногда лучшим вариантом было вообще оставить это сочетание без перевода. Вот ряд примеров (для краткости даю перевод не предложений целиком, а только интересующего нас сочетания):

…to add value to the existing product … (усовершенствовать, улучшить, сделать более привлекательным);

…to add value to customers (clients) … (сделать более привлекательным или полезным для);

…to add value to the effectiveness … (повысить);

…to add value to the practical experience … (расширить, пополнить, привнести что-то новое в);

…to add value to the public debate … (сделать дебаты более конструктивными, повысить их значение);

…to add value at the European level  (повысить значимость в общеевропейском масштабе, обеспечить дополнительные возможности на европейском уровне);

…manufacturers add value to their models… (снабдить новыми функциями, обеспечить новыми функциональными возможностями, чтобы повысить привлекательность).

И только в узкоспециальном тексте по экономике или политэкономии допустим перевод, близкий к дословному (но опять-таки, в зависимости от контекста!) - «производить прибавочную стоимость», или, например: «налог на добавленную стоимость» (value-added tax).

* * *

Самым серьезным из всех мне показался отзыв самого молодого из моих оппонентов. Это ученик 10 класса Иван Киреев, которого можно, не боясь, поставить в пример прочим. Спасибо Вам, Иван. Приятно, что Вы смотрите в корень проблемы, пытаетесь предложить конструктивное решение. Как оппонент в научном споре вы также выгодно отличаетесь от других участников диспута - не передергиваете факты, не переходите на личности, говорите кратко и по существу.

Поэтому предлагаю всерьез обсудить поставленный Вами вопрос о «размерности» кодировок.

Работы по созданию Юникода ведутся уже более 10 лет под эгидой Международной организации по стандартизации - ISO (International Standard Organization) при участии ведущих производителей вычислительной техники и программного обеспечения (для любознательных рекомендую http://www.unicode.org).

Это очень кропотливая работа. И она до сих пор еще не закончена. Ведь создать новую кодировку - это не значит просто записать на листе бумаги столбики символов и соответствующие им двоичные коды. Тем более, что универсальный код на то и универсальный, что представленный с помощью него текст должен правильно распознаваться /отображаться/ в разных странах и на разных компьютерных системах. А это предполагает единообразие целого ряда параметров, используемых ЭВМ, либо использование алгоритмов, которые могут компенсировать существующие отличия. Приведу ряд примеров.

Процессоры, используемые в компьютерах различных платформ, обрабатывают байты в различной последовательности. Например, процессоры «Intel» (и совместимые с ними) хранят в первом байте машинного слова его старший байт, а процессоры «Sparc» - младший.

Многие байт-ориентированные системы и протоколы передачи информации допускают использование в качестве данных только байты из определенного диапазона. Прочие байты рассматриваются как служебные. Например, нулевой байт принято использовать как символ конца строки. Юникод, о котором у нас идет речь, кодирует символы «подряд», поэтому прямая передача его кодов как байтовой цепочки может не соответствовать тому или иному стандарту передачи данных.

Пользовательское программное обеспечение (включая текстовые редакторы и СУБД) должно поддерживать отображение всех символов Юникода. Системное программное обеспечение (операционные системы) должны обеспечивать возможность трансформации форматов Юникода на уровне ввода, хранения и отображения, а также поддерживать алгоритмы преобразования текстов из старых кодировок в Юникод и обратно.

Существуют объективные трудности и с отображением графем, и с созданием шрифтов.

Причем это пока только двухбайтовая кодировка! А если представить себе переход на кодировки большей размерности, да еще и основанные не на кодировании символов, а на кодировании иных единиц информации, например, слов человеческого языка, то проблем будет еще больше. Причем к описанным выше добавятся и чисто технические, связанные с традиционной схемотехникой персональных компьютеров.

Проиллюстрируем это утверждение.

Устройство ввода символов в современных ЭВМ - клавиатура. Внешне очень простое, но на самом деле довольно сложное устройство, имеющее собственный микропроцессор, который работает по прошитой в ПЗУ программе. Если говорить очень-очень кратко, то работает все это так.

Драйвер клавиатуры, загружаемый в оперативную память и работающий резидентно, анализирует текущее состояние клавиатуры и статус специальных клавиш (SHIFT, CTRL и т.п.) и их комбинаций. Это состояние представляется в памяти двумя атрибутивными байтами - 4017h и 4018h, которые также называют  «словом состояния клавиатуры». Т.е. происходит своего рода «сканирование» клавиатуры. При нажатии клавиши передается ее порядковый номер (т.н. «скан-код»), а при отпускании - тот же скан-код, но увеличенный на 80h. Скан-код, поступивший от клавиатуры, транслируется в специальный двухбайтовый код, старший байт которого содержит скан-код клавиши, а младший байт - соответствующий код ASCII, который определяет закрепленный за клавишей символ, например букву «А». Поскольку за каждой (буквенно-цифровой) клавишей закреплено не менее двух символов, то каждому скан-коду соответствует не менее двух кодов ASCII (о таблице ASCII см. «Дуэль», №22(319), 2003). После того как двухбайтовый код сформирован, он помещается в т.н. «кольцевой буфер ввода» и только оттуда может быть считан центральным процессором и обработан пользовательской программой (например, редактором «Word»).

Для отображения символов на устройстве вывода (экран, дисплей) ЭВМ должна быть оснащена специализированным устройством - знакогенератором, который на свои старшие адресные входы принимает коды текущих символов из видеопамяти, а на младшие - адресные входы: номер строки. На выходе формируется побитовая развертка текущей строки разложения символа. Важное значение имеет и формат знакоместа, т.е. размер матрицы пикселей, используемых для отображения одного знака (символа). Пиксел (анг. «pixel») - минимально адресуемый элемент (единица, точка) двухмерного растрового изображения, которому могут быть независимо заданы цвет, яркость и другие характеристики.

Теперь, когда мы немного разобрались в некоторых технических аспектах проблемы, становится понятно, что отказаться от принципа, в основе которого лежит представление именно символов, а не иных единиц (например слов человеческого языка), не так просто. Для этого пришлось бы пересмотреть многие существующие стандарты, во многом изменить устройство персональных ЭВМ. Потребовалась бы маленькая революция в информатике! Но, возможно, именно Вам, Иван, в будущем этим и предстоит заняться, кто знает? От души желаю успехов в учебе.

А всем остальным читателям хочу еще раз сказать: пока трудно гарантировать абсолютную, стопроцентную точность приведенных расчетов. Возможно, что при большем охвате лексического материала и при более точных статистических выборках количественные результаты могут быть несколько иными. Но несомненно одно (и это пока подтверждается как повседневной практикой, так и приведенным статистическим материалом): для передачи аналогичных понятий средствами разных языков требуется различное (в среднем) количество минимальных единиц - буквенных символов, причем, если сравнивать русский и английский, то в русском - большее. В первую очередь это касается специальных (не художественных) текстов и деловой документации.

* * *

Помимо известных идеологических причин расширения сферы английского языка, связанных с политической, военной, экономической и культурной экспансией США в современном мире, существует и ОБЪЕКТИВНАЯ причина, способствующая такой экспансии в России. В основе этой причины лежат особенности, характеризующие различия в наших языках. Я очень хотел бы, чтобы эта причина была несущественной. Но факты, увы, пока убеждают в обратном. Поэтому, полагаю, нужно не выяснять, кто больше любит родной язык и кто лучше владеет иностранным, а:

1)         уточнять/расширять приведенные расчеты, и если они полностью подтвердятся, то

2)         предложить разумные контрмеры для сохранения и развития русской культуры и русского языка.

Д.А.Климов

В содержание номера
К списку номеров
Источник: http://www.duel.ru/200330/?30_4_1

Д.А.КЛИМОВ, ОТДЕЛ РАЗНЫХ ДЕЛ, 200330

Previous post Next post
Up