Спецификация HTML5 определяет также XHTML5 и заявляет, что они изоморфны за исключением неймспейсов (только в DOM и XHTML), (только HTML) и подстроки --> в комментариях (только DOM).
Когда хочется HTML запихать внутрь XML, следует трансформировать его в XHTML.
Случаи, когда заранее неопределённый пользовательский HTML-контент (типа описания некоего объекта на карте) может понадобиться запихать в application-specific XML-документ (типа KML) и при этом в исходном контенте допускается , представляются мне крайне редкими.
Включение XHTML внутрь XML позволяет требует его валидировать не позднее чем на этапе первой загрузки после сохранения, что благотворно сказывается на результате и имеет очень большое воспитательное значение. Кроме того, по XHTML-включениям можно делать любые XPath-запросы и XSLT-преобразования. В то время как HTML внутри CDATA - это просто текстовая строка без выраженной семантики. Для сколько-нибудь навороченной обработки такого XML-документа (например, проверки, что все ссылки на картинки из вложенных HTML ещё
( ... )
Я не очень ещё слежу за черновиком спецификации HTML5. Но, насколько я помню, одной из его selling points заявляли строгую формализацию того, как парсерам следует исправлять ошибки разметки. Ожидаю, что в ближайшем будущем появятся или уже появились библиотеки, реализующие парсинг HTML5 по текущему черновику спецификации.
Comments 6
Reply
Reply
А HTML5 не обязан являться валидным XML, следовательно, его придется таки пихать в CDATA.
Reply
Спецификация HTML5 определяет также XHTML5 и заявляет, что они изоморфны за исключением неймспейсов (только в DOM и XHTML), (только HTML) и подстроки --> в комментариях (только DOM).
Когда хочется HTML запихать внутрь XML, следует трансформировать его в XHTML.
Случаи, когда заранее неопределённый пользовательский HTML-контент (типа описания некоего объекта на карте) может понадобиться запихать в application-specific XML-документ (типа KML) и при этом в исходном контенте допускается , представляются мне крайне редкими.
Включение XHTML внутрь XML позволяет требует его валидировать не позднее чем на этапе первой загрузки после сохранения, что благотворно сказывается на результате и имеет очень большое воспитательное значение. Кроме того, по XHTML-включениям можно делать любые XPath-запросы и XSLT-преобразования. В то время как HTML внутри CDATA - это просто текстовая строка без выраженной семантики. Для сколько-нибудь навороченной обработки такого XML-документа (например, проверки, что все ссылки на картинки из вложенных HTML ещё ( ... )
Reply
Да, это хороший подход.
> изоморфны
Кстати, а у них не появился наконец reference mapping? В смысле, который бы с правильным приоритетом закрывал тэги
( ... )
Reply
Reply
Leave a comment