Как определить язык по письменности, или: Что делать, когдa «не по-нашему» написано?

Sep 13, 2015 09:58





Представьте себе такую ситуацию: Вам под руки попадает важный для Вас документ, написанный на непонятном для Вас языке. Перед Вами возникает проблема: к какому переводчику этот документ понести. Но для этого сперва необходимо установить, на каком языке он написан. К тому же, во многих бюро переводов берут дополнительную плату и за определение языка, и за пересылку нужному переводчику.

Так вот, для того, чтобы не оказаться в ситуации, сходной с эпизодом из фильма «Свинарка и пастух», когда молодая девушка из-за неумения определить язык по письменности чуть не покалечила себе судьбу, нужно научиться определять хотя бы наиболее распространенные языки самому.

Представьте себе вполне конкретные ситуации.

Например, Вы на вещевом рынке купили какой-нибудь нужный Вам товар, привезенный «челноками» «оттуда», а инструкции на русском языке к нему нет. Если бы Вы этот товар купили в фирменном магазине, или, хотя бы, в супермаркете, инструкция на русском языке должна была бы быть обязательно (иначе его не допустили бы к продаже). На рынке, увы, такой гарантии нет. Так что, прежде чем понести эту инструкцию нужному переводчику, надо сперва установить, что это за язык и, следовательно, какому переводчику надо ее нести.
Другой пример ― ближе к нашей теме. Где-то в Испании внезапно объявляется ваш троюродный дядя, о существовании которого Вы даже и не подозревали. Этот дядя завещает Вам какую-то недвижимость в Испании. Он, как положено, составляет текст завещания, заверяет его у испанского нотариуса и пересылает Вам заказным письмом. Вы, даже не всмотревшись в текст завещания, рассуждаете примерно так: раз это завещание из Испании, то и язык должен быть, разумеется, испанским. Как та Глаша из вышеупомянутого фильма, Вы с надеждой несете завещание испанскому переводчику, а испанский переводчик, посмотрев на бумажку, только пожимает плечами: дескать, не испанский это язык, поэтому ничем Вам помочь не могу. И хорошо еще, если он сам определит язык и скажет Вам, что это ― баскский язык, не имеющий с испанским ничего общего (баскский имеет примерно такое же отношение к испанскому языку, как, скажем, чеченский к русскому). А если не скажет, то сколько времени, нервов, а, главное, денег Вам придется потратить для того, чтобы установить истину, определить, что это за язык и найти нужного переводчика (такая ситуация вполне возможна, ибо баскский язык имеет статус официального языка в баскской автономии и, потому, широко применяется в местном делопроизводстве).
Так что, в обоих случаях определитель языков всегда должен быть под рукой.
Определить язык по письменности ― это не так уж и сложно, как кажется на первый взгляд, и под силу даже человеку, не являющемуся ни филологом, ни полиглотом. Надо только усвоить, какие существенные признаки характеризуют на письме тот или иной язык.
Эти существенные признаки таковы:
1. Набор дополнительных букв, характерный именно для данного языка;
2. Наиболее характерные сочетания букв
3. Наиболее характерные служебные слова;
4. Наиболее характерные суффиксы и окончания.
Я рекомендую для этих целей справочник Р. С. Гиляревского и В. С. Гривнина «Определитель языков мира по письменностям». (4 издания - 1959, 1961, 1963 и 1965)
Поскольку данная книга была издана более 40 лет назад и больше после этого не переиздавалась, она стала библиографической редкостью. К тому же, некоторые данные из этой книги за 40 с лишним лет успели устареть. Скачать эту книгу в формате PDF можно вот здесь.
В Интернете есть и другие определители языков, например, Omniglot, Fuzzums, Xerox, Odur, Eidetica (на английском языке).
Есть и специальные компьютерные программы по определению языков (Polyglot 3000 и его русская версия, etc.).
Ниже я приведу примеры, как определить на письме некоторые наиболее распространенные европейские языки.
Английский язык.
Письменность на основе латинского алфавита. Дополнительных букв нет. Характерные сочетания букв: ch, sh, wh, th, ea, ee, ai, oo, oa и др. Характерные служебные слова: личные местоимения I (которое всегда пишется с большой буквы), it, they; предлоги at, to, by, on, under, with, along; союзы and, but, whereas, артикль the и т.д.
Немецкий язык.
Письменность на основе латинского алфавита. Дополнительные буквы: ä, ö, ü, ß. Характерные сочетания букв: sch, ch, ck, tz, ah, eh, oh и др. Буква C почти никогда не употребляется самостоятельно. Характерные служебные слова: личные местоимения ich, sie, Sie, ihr; предлоги mit, nach, bei, aus, außer, von, für, durch, ohne; союзы und, aber, wenn и т.д., артикли der, die, das, dem, den и т.д. Сразу в глаза бросается большое количество слов с большой буквы (по правилам немецкой орфографии, всякое существительное пишется с прописной буквы).
Нидерландский язык.
Письменность на основе латинского алфавита. Дополнительная буква: ë, стоящая обычно после гласных О и Е: ië, oë. Характерные сочетания букв: ij (в заглавном варианте оба элемента пишутся с большой буквы: IJselmeer), ie, oe, удвоенные гласные aa, ee, oo и др. Характерные служебные слова: ik, van, met, tot и т.д.
Французский язык.
Письменность на основе латинского алфавита. Дополнительные буквы: à, á, â, é, è, ê, ë, æ, œ, ì, í, î, ï, ò, ó, ô, ù, ú, û, ü, ÿ, ç. Характерные сочетания букв: au, eau, ou, gn, ll, ch, oi, ui и др. Характерные служебные слова: après, au, chez, sans, pour, les, mais и др. Характерны окончания -eau, -é, -ez и др..
Испанский язык.
Письменность на основе латинского алфавита. Дополнительные буквы: ñ, á, é, í, ó, ú, ü. Характерные сочетания букв: ch, ll (часто стоит в начале слова: llegar, llano), ue и др. Характерные служебные слова: y, el, lo, los, muy. Характерны суффиксы -ción (соответствует английскому и французскому -tion). -idad (соответствует английскому -ity и французскому -ité). Специфическими знаками препинания являются «рамочные» вопросительный и восклицательный знаки: ¿Que?, ¡Salut!
Португальский язык.
Письменность на основе латинского алфавита. Дополнительные буквы: à, á, â, é, è, ê, ë, ã, õ, ì, í, î, ï, ò, ó, ô, ù, ú, û, ü, ç. Характерные сочетания букв: ao, oe, oa, ão, õe, lh, nh, ch и др. Характерные служебные слова: ao, com, do, muite, em, não. Характерны суффиксы -ção (соответствует английскому и французскому -tion), -ções (тот же суффикс во множественном числе), -idade (соответствует английскому -ity и французскому -ité).
Итальянский язык.
Письменность на основе латинского алфавита. Дополнительные буквы: над гласными часто ставится знак (`): à, è, ì, ò, ù. Характерные сочетания букв: ch, gh, cia, cio, ciu, scio, scia, sciu, bb, gg, tt, vv, zz, gia, giu, gio, gl, gn и др. Характерные служебные слова: più, alla, della, gli, agli, coi, di, и др. Характерны суффиксы -zione (соответствует английскому и французскому -tion). -ità (соответствует английскому -ity и французскому -ité). Буквы j, k, w, y, š употребляются только в заимствованных словах.
Польский язык.
Письменность на основе латинского алфавита. Дополнительные буквы: ą, ę, ć, ś, ź, ń, ó, ł, ż. Характерные сочетания букв: sz, cz, rz, dz, dź, szcz, ia, ią, ie, ię, io, iu, ch и др. Характерные служебные слова: się, przed, w, oraz. Отсутствуют буквы v, q, x (употребляются только в заимствованных словах).
Венгерский язык.
Письменность на основе латинского алфавита. Дополнительные буквы: á, é, í, ó, ú, ö, ü, ő, ű. Характерные сочетания букв: sz, cs, zs, ly, gy, ty, ny, dzs и др. Буква Y самостоятельно не употребляется. Характерные служебные слова: az, ez, mi, ki, és, még и др. Характерны окончания -ok, -ek, -ak.
Румынский язык.
Письменность на основе латинского алфавита (с 1860 года; до этого румыны пользовались видоизмененным церковнославянским алфавитом). Дополнительные буквы: â, ă, î, ş, ţ. Характерные сочетания букв: ea, oa, che, chi, ghe, ghi и др. Характерные служебные слова: şi, lui, oare, sau, în, pe, cu, din, iar, dar, iată и др. Характерны окончания -ul, -ului, -ii, -ea, -ţie, -ilor, -(i)le, -uri и др. Часто встречаются слова, пишущиеся через дефис: m-am, s-a и др. Если же Вам попадется под руки румынский текст, написанный «по-молдавски», т.е. русскими буквами (например в изданиях, выпущенных в Молдавской ССР в 1944-1989 годах, или же, в сегодняшнем Приднестровье), то для него будет характерно частое употребление буквы Э (особенно в конце слова, но не в начале), а также служебные слова ши, луй, ла, лор, ку, пынэ, дупэ, пе, сау и др. Дополнительная буква Ӂ встречалась только в изданиях, выпущенных после 1965 года.
Украинский язык.
Письменность на основе кириллицы. Дополнительные буквы: і, ї, є, ґ (последняя в 1933-1991 годах в СССР не употреблялась, а только в западной диаспоре). Отсутствуют буквы ё, э, ы, ъ. Характерны служебные слова: й, та, але, проте, що, аби и др.
Болгарский язык.
Письменность на основе кириллицы. Дополнительных букв нет. Отсутствуют буквы ё, э, ы. Характерно употребление буквы Ъ (в болгарском это ― гласный!) между двумя согласными (съд, гълъб) и даже в начале слова (ъгъл). Характерны окончания -ът, -та, -ите, -то (солистът, водата, думите). Предлог НА употребляется в качестве эквивалента родительного падежа (падежей в болгарском языке нет).
А теперь я покажу, как можно различать некоторые близкородственные языки.
Чешский и словацкий
Общими для чешского и словацкого алфавитов являются буквы š, č, ž, ď(Ď), ť(Ť), ň, а также знак (´) над гласными ― á, é, í, ó, ú, ý. Однако в чешском языке есть буквы, отсутствующие в словацком: ě, ř, ů; в свою очередь, в словацком есть буквы, не свойственные чешскому: ä, ô, ľ, ĺ, ŕ.
Литовский и латышский
Общими для литовского и латышского алфавитов являются буквы š, č, ž, ū. Однaко горизонтальная черточка (ˉ) в литовском языке может стоять только над буквой U, в то время, как в латышском она может стоять над всеми гласными кроме О: ā, ē, ī, ū. Кроме того, в литовском языке встречаются польские буквы ą и ę, а также специфические литовские буквы į, ų, ė. В латышском, в свою очередь, встречаются буквы ķ, ģ, ņ, ļ, ŗ.
Сербский, хорватский и боснийский
Письменность у сербов ― на основе кириллицы и латиницы. Дополнительные буквы в кириллице (вуковицe): ј, њ, љ, ћ, ђ, џ. В сербской кириллице отсутствуют буквы ё, й, ю, я, э, ы, ь, ъ, щ. Дополнительные буквы в латинице (на самом деле это хорватская гаевица, которая в Сербии используется для транслитерации вуковицы, ибо каждая буква вуковицы имеет точное соответствие в гаевице и наоборот): č, š, ž, ć, đ (Đ); сочетания lj, nj, dž. Характерно окончание -ао: осао, пошао. У хорватов и боснийцев ― та же самая гаевица. Единственное отличие от сербского ― более часто встречающаяся буква J после согласных: сербск. vesnik - хорв./босн. vjesnik. Ещё одно отличие касается написания иностранных собственных имен: сербы всё пишут так, как слышат (Džordž Buš), а хорваты и боснийцы сохраняют оригинальное написание (George Bush). Отличить хорватский язык от боснийского могут только либо сами хорваты/боснийцы, либо специалисты по языкам бывшей Югославии (в боснийском, например, присутствует очень большое количество арабских и персидских заимствований, что объясняется принадлежностью большинства боснийцев к исламу). По крайней мере, переводчику с сербского языка понять тексты на хорватском или боснийском языке не составляет большого труда ― ведь во времена правления Тито официально считалось, что всё это ― один и тот же сербскохорватский язык в трех литературных вариантах (по крайней мере, отличий между сербским, хорватским и боснийским не больше, чем, к примеру, между британским английским и американским английским).
Хорватский и словенский
Общими для хорватского и словенского алфавитов являются буквы š, č, ž. Словенский отличается от хорватского тем, что вместо буквы ć там употребляется сочетание tj, а вместо буквы đ ― сочетание dj. Кроме того, в словенском языке употребляется союз in, не свойственный другим славянским языкам.
Сербский и македонский
Общими для сербского и македонского алфавитов являются буквы ј, њ, љ, џ; в обоих алфавитах отсутствуют буквы ё, й, ю, я, э, ы, ь, ъ, щ. В македонском алфавите отсутствуют сербские буквы ћ и ђ, зато употребляются три специфических буквы ― ќ, ѓ и ѕ. Кроме того, в македонском языке часто встречается удвоенная А (догаат). В Болгарии македонский язык может употребляться без дополнительных букв ј, њ, љ, џ, ќ, ѓ, ѕ; однако такой македонский текст отличается от болгарского отсутствием буквы Ъ и наличием буквы Р между двумя согласными (држат).
Шведский, норвежский, датский
Для всех трех языков характерна буква å (в датских книгах, изданных до 1948 года, она не употреблялась). В шведском языке не употребляются буквы æ и ø, в датском и норвежском ― ä. Таким образом, в шведском алфавите присутствуют дополнительные буквы å, ö, ä; в датском и норвежском ― å, ö, ø, æ. Отличить датский язык от норвежского может только человек, владеющий, по крайней мере, одним из этих языков. Однако датский и норвежский настолько близки друг другу, что датчане и норвежцы понимают друг друга без переводчиков. Так что, и переводчик с датского запросто переведет Вам текст с норвежского (а норвежский, соответственно ― с датского).
Финский и эстонский
Финский и эстонский языки относятся к финно-угорской языковой семье; для обоих языков характерны очень длинные слова, часто встречающиеся удвоенные гласные и согласные, в начале слов в обоих языках невозможно стечение двух и большего количества согласных (данное правило касается и ранних заимствований: kooli (школа), однако не распространяется на поздние заимствования и на иностранные собственные имена), буквы b, c, q, w, x, š встречаются только в поздних заимствованиях и в собственных именах. В алфавитах обоих языков присутствуют дополнительные буквы ä и ö. Отличия: в эстонском не употребляется часто употребляемая в финском буква Y (встречаeтся только в поздних заимствованиях и в собственных именах); вместо буквы Y в эстонском языке употребляется буква Ü ― это касается и греческих слов (hümn). Кроме того, в эстонском употребляется буква õ, которая встречается в Европе еще только в португальском языке; а в заимствованных словах ― и буква ž.
Турецкий и другие тюркские языки
Традиционная турецкая письменность на основе арабского алфавита в 1928 году была заменена новым алфавитом на латинской графической основе. Для турецкой латиницы характерно наличие двух вариантов буквы I ― с точкой (İ i) и без точки (I ı). Кроме того, в турецкой латинице употребляются дополнительные буквы ç, ş, ğ, ö, ü, а над гласными может стоять знак (^): â, ê, î и т.д. Турецкая латиница до середины 90-х годов прошлого века оставалось единственной в своем роде, пока на нее не стали переходить с кириллицы многочисленные тюркские народы бывшего СССР (азербайджанцы, туркмены, гагаузы, татары, крымские татары, узбеки, а теперь ― и казахи). Поэтому турецкий язык теперь можно легко спутать с другими тюркскими языками. Различия: в турецком алфавите отсутствуют буквы Q, W, X (встречаются только в иностранных собственных именах и в варваризмах), в то время, как в других тюркских языках они употребляются довольно широко (Q и Х ― в азербайджанском, татарском, крымскотатарском (Крым по-татарски будет Qırım), туркменском и т.д.; W ― в туркменском и казахском). В азербайджанском алфавите присутствует буква Ə («Шва»), которая иногда заменяется буквами ä или æ. В казанскотатарском употребляется дополнительная буква ņ, а вместо буквы ö может употребляться буква Θ. В гагаузском алфавите присутствуют румынские буквы ă и ţ. В туркменском ı без точки не употребляется; зато там присутствуют два варианта буквы Y: Y и Ý. Сильнее всего от турецкой латиницы отличается узбекская: в ней нет никаких диакритических знаков, никаких дополнительных букв; зато после буквы О часто ставится апостроф (даже сама страна называется O’zbekiston). Мотивация для перевода тюркских языков с кириллицы на латиницу была следующей: латиница точнее соответствует особенностям тюркской фонетики. На самом деле это далеко не так: и многие тюркские алфавиты на основе кириллицы (тот же азербайджанский) довольно точно передавали все особенности тюркской фонетики. Истинная причина перехода ― чисто политическая: быть как можно дальше от Москвы и как можно ближе к Анкаре. Впрочем, это ― внутреннее дело самих тюркских народов.
И так далее…
(Впервые опубликовано здесь: http://turizm-forum.ru/index.php?showtopic=1251 )

языкознание, трудности перевода

Previous post Next post
Up