Пытался преобразовать текст на UTF-8: хотел привести отсутствующую в КОИ-8 пунктуацию к виду, пригодному для HTML:
use HTML::Entities;
...
my $fixed = encode_entities( $raw, "\x{460}-\x{2E2E}" );
Работало странно: тире преобразовывалось в —, а кавычки-ёлочки - нет. Причина оказалась простой - кавычки-ёлочки в юникоде находятся совсем не там,
(
Read more... )
Comments 3
Reply
юникод весьма напряжно. Поэтому на время создания новой, юникодной
версии, приходится изобретать костыли.
Reply
немецким „лапкам“ повезло меньше - они не попали даже в первое расширение ASCII (U+0080-U+07FF), оставшись с прочим редкоиспользуемым хламом - U+201E и U+201C.
Reply
Leave a comment