Leave a comment

Про перевод в электронный вид pogorily September 14 2010, 15:48:50 UTC
Читал я инструкцию, составленную "для себя и подобных" человеком, сканирующим книжки.
Из нее ясно следует, что каждая страница требует обработки с приложением интеллекта, чтобы стать удобочитаемой и приятной на вид (без светло-серых букв на чуть более светлом фоне, причем фон в пределах страницы меняется куда больше, чем отличаются буквы от фона, огромных пустых полей, порой срезанных краев с текстом и т.д.).
И это для материалов типографского качества (которое всегда гораздо выше машинописного).

Это если сканируешь для себя, чтобы минимизировать последующую обработку.

Результаты массового сканирования людьми равнодушными будут ужасны заведомо.

Reply

Re: Про перевод в электронный вид fat_yankey September 14 2010, 16:22:33 UTC
Ну, собственно, трофейные фонды в НАРА дают вполне хороший пример того, как это будет выглядеть.

Reply

Re: Про перевод в электронный вид pogorily September 14 2010, 17:11:30 UTC
То у них, в National Archives and Records Administration.

Более вероятно, что будут выглядеть как http://www.mediafire.com/file/dgdey1dkeid/Nechit.djvu

А вот как у нас типографикие документы сканируются http://publ.lib.ru/ARCHIVES/R/%27%27Radio%27%27/_%27%27Radio%27%27_1972_.html . Там, для примеру, номер 4 скачайте и любуйтесь.

Reply

Re: Про перевод в электронный вид cyclolife September 14 2010, 18:32:42 UTC
В ОБД Мемориал/Подвиг народа качество сканов очень хорошее. К сожалению, не знаю подробностей, как именно сканируются документы.

Reply

Re: Про перевод в электронный вид pogorily September 14 2010, 18:34:54 UTC
А вы видели там сканы напечатанных на пишущей машинке документов?
Мне только рукописные попадались, а они сканируются лучше, т.к. исходная контрастность выше.

Reply

Re: Про перевод в электронный вид cyclolife September 14 2010, 18:44:07 UTC
Донесения о безвозвратных потерях воздушных армий (а я целенаправленно выискивал именно их) - почти на 100% отпечатаны на машинке. Некоторые - в качестве ничуть не хуже полиграфического, некоторые - едва читаемые, но тем не менее - буквы и слова, при желании, можно разобрать во всех.

Reply


Leave a comment

Up