Данный пост является моим расширенным ответом на
вопрос по поводу сингальской надписи на деревянном панно с изображением Девы Марии, заданный в сообществе
ru-translate юзером Ёжик (
yozhik_):
Помогите, пожалуйста, с переводом. Надпись сделана на деревянном панно, сделанном в Шри-Ланке и установленном во дворе церкви Благовещения в Назарете. Кажется, это сингальский
(
Read more... )
Comments 7
(The comment has been removed)
Спасибо, Вы абсолютно правы, конечно это из пали! Я совершенно упустил этот момент. Поправил текст.
Reply
Кстати, судя по сингальскому чарту Unicode, варианта отобразить лигатуру rṇa там на сегодня вообще нет. Неплохо было бы пропозал для Unicode написать, если там ничего нет на рассмотрении.
Я глянул в Daniels'е (p.408), там сказано, что лигатурно записываются кластеры r+C, C+r и C+y, но в современных печатных изданиях обычно используют раздельное написание. За подробностями отсылают к
Gair, James W., and W. S. Karunatilaka. Literary Sinhala Inflected Forms, with a Transliteration Guide to the Sinhala Script. Ithaca, N.Y. : Cornell University, 1976.
Reply
Спасибо большое за находку! Чуть позже внимательно проанализирую и поправлю текст.
- Кстати, судя по сингальскому чарту Unicode, варианта отобразить лигатуру rṇa там на сегодня вообще нет.
А там лигатуры рендерятся, а не отдельными codepoint закодированы. Всё, что у меня на скриншотах представлено, система так и отображает, т. е. эти лигатуры «собираются» без проблем. А собираются они с помощью символа U+200D (Zero Width Joiner). Получается, что лигатура rṇa кодируется как: ra+virama+zero width joiner+ṇa, а не лигатура как: ra+virama+ṇa. А у Вас не отображается эта лигатура собранной? Точно работает со шрифтами DinaminaUniWeb/Iskoola Pota, версия USP10.DLL (Uniscribe) 1.0626.7600.20602. Гугль при поиске, кстати, игнорирует этот Zero Width Joiner и выдаёт, в том числе, и результаты без него ( ... )
Reply
Reply
Всё так. В стандарте действительно прямо не прописаны правила использования ZWJ и ZWNJ для сингальского, однако именно они (в сочетании с вирама) применяются для различного типа лигатур. Очень подробно всё расписано в локальном стандарте (завязанном на Юникоде):
Sri Lanka Standards Institute, Sri Lanka Standard SLS 1134:2004 - Sinhala Character Code for Information Interchange, Revision 2, SLSI, 2004.
Его текст доступен здесь.
> Нет, у меня сингальские шрифты не стоят, а в том наборе, что стоит (универсальные TITUS, DejaVu, Code2xxx, etc.) лигатура не отображается.
Хороший шрифт Iskoola Pota, который идет с Windows 7, могу прислать. Но и он не идеален (учитывая наши цели). Есть ещё шрифт Bhashitha (භාෂිත). Заявлена поддержка touching letters (т. е. это шрифт Level 3 согласно спецификации), но некоторые комбинации он отображает у меня с ошибкой (например, вместо тестовой ssa ස්ස вижу sma), а сложные не берет (striКстати отображение зависит не только от шрифта, а еще от библиотеки USP10.DLL (Uniscribe). Она ( ... )
Reply
Reply
Leave a comment