PDF ➔ DjVU & OCR

Sep 17, 2008 12:56

Есть ли какой-то относительно простой способ перегнать pdf-ки в djvu с распознанием (хотя бы черновым) и включением текстового слоя?

Может, быть, кто-то возьмётся это сделать для pdf-ок, выложенных на сайте http://vstrecha-mpda.ru? За денежку.

«Встреча», техническое

Leave a comment

Comments 8

stallion_zong September 17 2008, 09:06:06 UTC
у мя есть прога для перевода из пдф в док. не поможет?...

Reply

petru44o September 17 2008, 09:13:33 UTC
Не поможет. Важно, чтобы в итоге была djvu-шка, в которой можно выделить фрагмент страницы и скопировать в буфер тот текст, который там находится. То есть должна остаться связь текста с его расположением на странице.

Reply

stallion_zong September 17 2008, 09:39:03 UTC
ммм... тогда не знаю... (

Reply


(The comment has been removed)

petru44o September 17 2008, 10:15:54 UTC
Всё возможно верующему.

Про dvju: http://www.djvu-soft.narod.ru/

Это не только формат растра, там есть и текстовый слой.

Есть Document Express Enterprise with DjVu (with Asian OCR), есть связка FineReader + DjvuOCR (http://djvuocr.ucoz.ru/), есть pdftodjvu, но мне просто некогда и неохота со всем этим ковыряться.

Reply

bestann September 17 2008, 14:45:32 UTC
Так все-таки чем pdf не подходит. Тут же отписались, что и там вроде ок.
А другим думаешь есть когда? а ковыряются ;)

Reply

petru44o September 17 2008, 14:47:27 UTC
djvu может быть в 3 раза компактнее. А когда речь о 20-мегабайтных файлах, то это существенно.

Reply


Leave a comment

Up