pdf2txt с координатами букв и слов

Mar 26, 2011 19:04

Как извлечь из текстовый слой с координатами букв и слов? pdf2html -xml выдает только кординаты строк, а документации к podofotxtextract я не смог
найти.

заодно хочу спросить, как от PDF файла отрезать слишком большие поля ? (Чтобы при распечатке поля шрифт увеличить и/или
переделать в буклет.) Bounding box должнен определяться по графике, так как в самом файле он в часто указывается неправильный.
Previous post Next post
Up