Данный пост является моим расширенным ответом на
вопрос по поводу сингальской надписи на деревянном панно с изображением Девы Марии, заданный в сообществе
ru-translate юзером Ёжик (
yozhik_):
Помогите, пожалуйста, с переводом. Надпись сделана на деревянном панно, сделанном в Шри-Ланке и установленном во дворе церкви Благовещения в Назарете. Кажется, это сингальский
(
Read more... )
Кстати, судя по сингальскому чарту Unicode, варианта отобразить лигатуру rṇa там на сегодня вообще нет. Неплохо было бы пропозал для Unicode написать, если там ничего нет на рассмотрении.
Я глянул в Daniels'е (p.408), там сказано, что лигатурно записываются кластеры r+C, C+r и C+y, но в современных печатных изданиях обычно используют раздельное написание. За подробностями отсылают к
Gair, James W., and W. S. Karunatilaka. Literary Sinhala Inflected Forms, with a Transliteration Guide to the Sinhala Script. Ithaca, N.Y. : Cornell University, 1976.
Reply
Спасибо большое за находку! Чуть позже внимательно проанализирую и поправлю текст.
- Кстати, судя по сингальскому чарту Unicode, варианта отобразить лигатуру rṇa там на сегодня вообще нет.
А там лигатуры рендерятся, а не отдельными codepoint закодированы. Всё, что у меня на скриншотах представлено, система так и отображает, т. е. эти лигатуры «собираются» без проблем. А собираются они с помощью символа U+200D (Zero Width Joiner). Получается, что лигатура rṇa кодируется как: ra+virama+zero width joiner+ṇa, а не лигатура как: ra+virama+ṇa. А у Вас не отображается эта лигатура собранной? Точно работает со шрифтами DinaminaUniWeb/Iskoola Pota, версия USP10.DLL (Uniscribe) 1.0626.7600.20602. Гугль при поиске, кстати, игнорирует этот Zero Width Joiner и выдаёт, в том числе, и результаты без него ( ... )
Reply
Reply
Всё так. В стандарте действительно прямо не прописаны правила использования ZWJ и ZWNJ для сингальского, однако именно они (в сочетании с вирама) применяются для различного типа лигатур. Очень подробно всё расписано в локальном стандарте (завязанном на Юникоде):
Sri Lanka Standards Institute, Sri Lanka Standard SLS 1134:2004 - Sinhala Character Code for Information Interchange, Revision 2, SLSI, 2004.
Его текст доступен здесь.
> Нет, у меня сингальские шрифты не стоят, а в том наборе, что стоит (универсальные TITUS, DejaVu, Code2xxx, etc.) лигатура не отображается.
Хороший шрифт Iskoola Pota, который идет с Windows 7, могу прислать. Но и он не идеален (учитывая наши цели). Есть ещё шрифт Bhashitha (භාෂිත). Заявлена поддержка touching letters (т. е. это шрифт Level 3 согласно спецификации), но некоторые комбинации он отображает у меня с ошибкой (например, вместо тестовой ssa ස්ස вижу sma), а сложные не берет (striКстати отображение зависит не только от шрифта, а еще от библиотеки USP10.DLL (Uniscribe). Она ( ... )
Reply
> (завязанном на Юникоде)
Понял, спасибо большое!
> Хороший шрифт Iskoola Pota, который идет с Windows 7
У меня как раз Win7 (SP1), но rṇa не рендерится. Видимо, чего-то не хватает, т.к. билд Uniscribe-а 17514.
> Во-вторых, я никак не могу понять, тексты действительно
> написаны без различения огласовок u и ū или я что-то упускаю?
Тут я, увы, абсолютно некомпетентен. Единственное что могу сказать потенциально полезного, так это то, что тексты католических молитв должны были издаваться (да и переводиться тоже) для миссионеров в Propaganda Fide (печатались в Typographia Sacrae Congregationis de Propaganda Fide, тж. известной как «Полиглота»), но для сингальского это должно быть не ранее XVIII в., т.к. ни сингальского шрифта нет на оттиске наборных шрифтов типографии Propaganda Fide XVII в., ни сингальского раздела в списке книг, изданных конгрегацией до 1700 г.
Reply
Leave a comment