Данный пост является моим расширенным ответом на
вопрос по поводу сингальской надписи на деревянном панно с изображением Девы Марии, заданный в сообществе
ru-translate юзером Ёжик (
yozhik_):
Помогите, пожалуйста, с переводом. Надпись сделана на деревянном панно, сделанном в Шри-Ланке и установленном во дворе церкви Благовещения в Назарете. Кажется, это сингальский
(
Read more... )
Спасибо большое за находку! Чуть позже внимательно проанализирую и поправлю текст.
- Кстати, судя по сингальскому чарту Unicode, варианта отобразить лигатуру rṇa там на сегодня вообще нет.
А там лигатуры рендерятся, а не отдельными codepoint закодированы. Всё, что у меня на скриншотах представлено, система так и отображает, т. е. эти лигатуры «собираются» без проблем. А собираются они с помощью символа U+200D (Zero Width Joiner). Получается, что лигатура rṇa кодируется как: ra+virama+zero width joiner+ṇa, а не лигатура как: ra+virama+ṇa. А у Вас не отображается эта лигатура собранной? Точно работает со шрифтами DinaminaUniWeb/Iskoola Pota, версия USP10.DLL (Uniscribe) 1.0626.7600.20602. Гугль при поиске, кстати, игнорирует этот Zero Width Joiner и выдаёт, в том числе, и результаты без него.
- Я глянул в Daniels'е (p.408), там сказано, что лигатурно записываются кластеры r+C, C+r и C+y, но в современных печатных изданиях обычно используют раздельное написание. За подробностями отсылают к
Gair, James W., and W. S. Karunatilaka. Literary Sinhala Inflected Forms, with a Transliteration Guide to the Sinhala Script. Ithaca, N.Y. : Cornell University, 1976.
О, спасибо, я и не подумал туда заглянуть! Вполне возможно, что этим всё и объясняется, т. е. какие-то современные тенденции. Кстати эта книга, на которую Gair ссылается (Gair & Karunatilaka, 1976), оказалась доступной онлайн, полистал её (особенно последний раздел о письменности), но не нашёл какой-либо новой информации. В любом случае хорошо, что доступна и можно сразу проверить.
Reply
Т.е. сингальские шрифты de facto используют ZWJ при дефолтном раздельном написании? Я об этом вообще не подумал, спасибо!
С ZWJ в сингальском в стандарте неясность, т.к. общее пояснение (§16.2) относительно индийских алфавитов ссылается исключительно на §9 (South Asian Scripts-I) и прямо говорит о том, что Ca+virama+ZWJ = half-form, а в §10 (South Asian Scripts-II) относительно ZWJ и дефолтного раздельного рендеринга в сингальском разделе полная тишина (но, например, для саураштра аналогичный момент прописан явно). С учётом того, что r+, +r и +y в сингальском себя ведут как модификаторы, было бы неплохо, если бы они либо кодировались отдельно, либо этот момент явно оговаривался стандартом. Или я что-то упустил?
> А у Вас не отображается эта лигатура собранной?
Нет, у меня сингальские шрифты не стоят, а в том наборе, что стоит (универсальные TITUS, DejaVu, Code2xxx, etc.) лигатура не отображается.
> Кстати эта книга, на которую Gair ссылается (Gair &
> Karunatilaka, 1976), оказалась доступной онлайн, полистал
> её (особенно последний раздел о письменности), но не нашёл
> какой-либо новой информации.
Видимо, он ссылается на с.77, где пишет:
«Another vay of writing consonant combinations and double consonants is to use the modification <тут вирама - satai> on the first ccnsonant symbol... This is very common nowadays, particularly in printing and typing».
Хотя, конечно, это больше похоже просто на лишнюю ссылку, т.к. к статье в Daniels ничего не добавляет.
Reply
Всё так. В стандарте действительно прямо не прописаны правила использования ZWJ и ZWNJ для сингальского, однако именно они (в сочетании с вирама) применяются для различного типа лигатур. Очень подробно всё расписано в локальном стандарте (завязанном на Юникоде):
Sri Lanka Standards Institute, Sri Lanka Standard SLS 1134:2004 - Sinhala Character Code for Information Interchange, Revision 2, SLSI, 2004.
Его текст доступен здесь.
> Нет, у меня сингальские шрифты не стоят, а в том наборе, что стоит (универсальные TITUS, DejaVu, Code2xxx, etc.) лигатура не отображается.
Хороший шрифт Iskoola Pota, который идет с Windows 7, могу прислать. Но и он не идеален (учитывая наши цели). Есть ещё шрифт Bhashitha (භාෂිත). Заявлена поддержка touching letters (т. е. это шрифт Level 3 согласно спецификации), но некоторые комбинации он отображает у меня с ошибкой (например, вместо тестовой ssa ස්ස вижу sma), а сложные не берет (stri).
Кстати отображение зависит не только от шрифта, а еще от библиотеки USP10.DLL (Uniscribe). Она должна быть надлежащей версии. Для тестов можно использовать BabelPad - если ему в корень положить USP10.DLL, то он будет использовать именно её, а не системную библиотеку. Например, новые версии USP10.DLL от Windows 7 в XP просто не работают и завешивают систему, хотя это может быть у меня кривые руки.
> Хотя, конечно, это больше похоже просто на лишнюю ссылку, т.к. к статье в Daniels ничего не добавляет.
С лигатурами я наконец разобрался, здесь текст поправил. Напишу отдельный пост по этому поводу.
А вот с молитвой (тексте из книги) проблемы. Во-первых, текст всё-таки отличается от известных нам из Интернета. Отличия не только в использовании лигатур (например, rēphaya для написания rṇa или touching letters повсеместно, как то න්ති вместо න්ති для nti), но и в написании некоторых слов (например, අපේ apē вместо අපගේ apagē). Я нашел такую же редакцию здесь. Видимо за основу надо брать именно эти два опубликованных текста. Во-вторых, я никак не могу понять, тексты действительно написаны без различения огласовок u и ū или я что-то упускаю? Для меня они все выглядят как ū. Хотелось бы найти ещё какой-нибудь напечатанный вариант.
Да, и что это за точка над ā в ස්වා svā? Я с таким не сталкивался, пока не понимаю, что значит. Наверняка что-то простое. Кстати это слово очень отличается. Написано ස්වාම svāmi, т. е. svā написано как лигатура вида touching letters без вирама и отсутствует න් n в конце (в текстах из Вики ස්වාමීන් / ස්වාමින් svāmīn / svāmin соответственно).
Reply
> (завязанном на Юникоде)
Понял, спасибо большое!
> Хороший шрифт Iskoola Pota, который идет с Windows 7
У меня как раз Win7 (SP1), но rṇa не рендерится. Видимо, чего-то не хватает, т.к. билд Uniscribe-а 17514.
> Во-вторых, я никак не могу понять, тексты действительно
> написаны без различения огласовок u и ū или я что-то упускаю?
Тут я, увы, абсолютно некомпетентен. Единственное что могу сказать потенциально полезного, так это то, что тексты католических молитв должны были издаваться (да и переводиться тоже) для миссионеров в Propaganda Fide (печатались в Typographia Sacrae Congregationis de Propaganda Fide, тж. известной как «Полиглота»), но для сингальского это должно быть не ранее XVIII в., т.к. ни сингальского шрифта нет на оттиске наборных шрифтов типографии Propaganda Fide XVII в., ни сингальского раздела в списке книг, изданных конгрегацией до 1700 г.
Reply
Leave a comment