Leave a comment

Comments 9

pecheny September 1 2012, 11:12:38 UTC
Сразу в pdf вроде бы пока нет средства;
можно экспортировать пдф в картинки чем-нибудь типа Sejda или pkPdf, потом обработать ScanTailor, потом снова сшить в пдф Images2Pdf.

(Вообще, я предпочитаю Djvu)

Более простого и быстрого способа я не знаю. К тому же на этапе обработки сканов тейлором за ним надо следить, чтобы он не обрезал чего нужного etc.
Да, геморрой, но ради качественного результата можно и на это пойти.

Reply

lestofante September 1 2012, 12:21:50 UTC
А в дежавю картинки можно обрабатывать?
Пдф как-то привычнее, потому что он у всех есть. А так дежавю вроде действительно лучше.

Reply

schwabc September 1 2012, 12:30:50 UTC
В дежавю нельзя искать по тексту. Это его основной минус.
Кстати, не знаю, как там с редакторскими вещами типа вставки комментариев.

Reply

pecheny September 1 2012, 13:24:24 UTC
Вообще-то можно, если добавить OCR слой. Это делают редко,
но всё зависит от добросовестности оцифровщика (мало ли
мы видели пдфок, по которым нельзя искать).

Комментарии и выделение в тексте там, afaik, таки да, отсутствует.

Отличия между форматами проистекают из их разного предназначения:
pdf-для того, чтобы перенести документ в первозданной форме
с одного компьютера на другой, djvu-чтобы сохранять книжки в ужатом,
но включающим самое нужное-начертание текста и важные иллюстрации-виде.

Reply


polakko1 September 5 2012, 12:22:42 UTC
Большое спасибо за все ссылки!

Reply


skvodo September 5 2012, 23:50:15 UTC
Советую для лингвистической литературы только формат PDF:
сканирование в градациях серого 600 dpi -> обработка ScanKromsator -> объединение и распознание сканов с помощью Finereader, с последующей доводкой в Adobe Acrobat.
Создание электронных книг из сканов

Reply


Leave a comment

Up