Сразу в pdf вроде бы пока нет средства; можно экспортировать пдф в картинки чем-нибудь типа Sejda или pkPdf, потом обработать ScanTailor, потом снова сшить в пдф Images2Pdf.
Более простого и быстрого способа я не знаю. К тому же на этапе обработки сканов тейлором за ним надо следить, чтобы он не обрезал чего нужного etc. Да, геморрой, но ради качественного результата можно и на это пойти.
Вообще-то можно, если добавить OCR слой. Это делают редко, но всё зависит от добросовестности оцифровщика (мало ли мы видели пдфок, по которым нельзя искать).
Комментарии и выделение в тексте там, afaik, таки да, отсутствует.
Отличия между форматами проистекают из их разного предназначения: pdf-для того, чтобы перенести документ в первозданной форме с одного компьютера на другой, djvu-чтобы сохранять книжки в ужатом, но включающим самое нужное-начертание текста и важные иллюстрации-виде.
Советую для лингвистической литературы только формат PDF: сканирование в градациях серого 600 dpi -> обработка ScanKromsator -> объединение и распознание сканов с помощью Finereader, с последующей доводкой в Adobe Acrobat. Создание электронных книг из сканов
Comments 9
можно экспортировать пдф в картинки чем-нибудь типа Sejda или pkPdf, потом обработать ScanTailor, потом снова сшить в пдф Images2Pdf.
(Вообще, я предпочитаю Djvu)
Более простого и быстрого способа я не знаю. К тому же на этапе обработки сканов тейлором за ним надо следить, чтобы он не обрезал чего нужного etc.
Да, геморрой, но ради качественного результата можно и на это пойти.
Reply
Пдф как-то привычнее, потому что он у всех есть. А так дежавю вроде действительно лучше.
Reply
Кстати, не знаю, как там с редакторскими вещами типа вставки комментариев.
Reply
но всё зависит от добросовестности оцифровщика (мало ли
мы видели пдфок, по которым нельзя искать).
Комментарии и выделение в тексте там, afaik, таки да, отсутствует.
Отличия между форматами проистекают из их разного предназначения:
pdf-для того, чтобы перенести документ в первозданной форме
с одного компьютера на другой, djvu-чтобы сохранять книжки в ужатом,
но включающим самое нужное-начертание текста и важные иллюстрации-виде.
Reply
Reply
сканирование в градациях серого 600 dpi -> обработка ScanKromsator -> объединение и распознание сканов с помощью Finereader, с последующей доводкой в Adobe Acrobat.
Создание электронных книг из сканов
Reply
Leave a comment