Ulli, у меня есть предложение самого общего характера, предполагающее необходимость самого свободного обсуждения и любых точек зрения. Как Вы считаете, не будет ли, с учётом современной ситуации в сетевых технологиях, их скоростей и качества, более уместно составлять эл. библиотеку ВДИ из простых сканов статей или журналов, выкладывать pdf\djvu документы, причём в хорошем качестве? Я не вижу серьёзных возражений к этому предложению. Вопрос о копирайте должен быть задан в первую очередь по поводу уже сделанного. С этим связан вопрос, не согласятся ли, вообще, авторы ВДИ и других журналов, что электронные копии статей должны быть свободно доступны интересующимся, а pdf и другие форматы - лучшая форма для доступа к ним. Вопрос о доступности для всех регионов тоже не существен, так как даже на самом слабом модеме в деревне можно за пару десятков минут скачать номер журнала (стандартный сканированный pdf).
1) выкладывание в интернет подразумевает возможность работы с ним средствами интернета, попросту говоря, чтобы поисковики ловили. Выкладывание картинок, пусть даже с наложенным на них распозаннных, но НЕ ВЫЧИТАННЫМ текстом эту задачу не решает. 2) Pdf хорош, когда его делают из набранного текста. Если текст распознавался с напечатанного, то особого смысла накладывать его на картинку я не вижу. 3) Один номер ВДИ, в пдф, потянет метров на двести-триста. На диалапе такое не очень-то скачаешь... 4) Единственный плюс, который я вижу у pdf - возможность донести до читателя все спецсимволы в разных хитрых транслитерациях. Но значительной части аудитории они не нужны, а качать придется всем. ----------- ?) Про сплошную pdfизацию ВДИ - вопрос к ВДИ. Некоторые издания таковой заморочились (Средние века или Византийский временник, например)...
Re: ПредложениеfarwideserenityFebruary 11 2010, 13:33:44 UTC
Вот я специально задержался, чтобы написать по этому поводу, а Вы уже ответили.
Наоборот!!! ПДФ + текст будет менее трудозатратно, чем то, что Вы сейчас делаете! Особенно вычитывать ПДФ не нужно, там и так всё хорошо распознаётся, и есть оригинал под рукой. Единственный вопрос - сканирование, но при некотором навыке это перестаёт быть проблемой. Все сканы загоняются в замечательную программу СканКромсатор - и вуаля. Думаю, что по времени получается примерно столько же, сколько при распознавании \ наборе вручную и правке текста.
Re: ПредложениеfarwideserenityFebruary 18 2010, 14:31:06 UTC
Предложение дельное. Заставило меня отказаться от спонтанно возникшего ответа на предыдущий пост :)
Требования к пдфу, насколько я понимаю, следующие: 1) вычитанный русский язык (нерусский отдается на откуп графическому слою); 2) соответствие страниц пдфа оригиналу; 3) соответствие строк и слов текстового слоя графическому слою.
Имеющиеся у меня сканы, в основном - 300 точек в сером, если настаиваете именно на 600 в черном - можно сделать.
Приветствую. Я тоже сюда давненько не заглядывал :) Надеюсь, Вам система сообщит о том, что пришел ответ.
Статью Бауэрсока нужно будет добывать отдельно. Пока что я прошелся по списку того, что у меня есть по этим темам уже отсканенного (понималось максимально расширительно :)) из ВДИ. Список получился достаточно большой (4.5 вордовской страницы), думаю, сюда выкладывать не стоит. Пишите на halgar#newmail.ru, вышлю.
у меня есть предложение самого общего характера, предполагающее необходимость самого свободного обсуждения и любых точек зрения. Как Вы считаете, не будет ли, с учётом современной ситуации в сетевых технологиях, их скоростей и качества, более уместно составлять эл. библиотеку ВДИ из простых сканов статей или журналов, выкладывать pdf\djvu документы, причём в хорошем качестве? Я не вижу серьёзных возражений к этому предложению. Вопрос о копирайте должен быть задан в первую очередь по поводу уже сделанного. С этим связан вопрос, не согласятся ли, вообще, авторы ВДИ и других журналов, что электронные копии статей должны быть свободно доступны интересующимся, а pdf и другие форматы - лучшая форма для доступа к ним. Вопрос о доступности для всех регионов тоже не существен, так как даже на самом слабом модеме в деревне можно за пару десятков минут скачать номер журнала (стандартный сканированный pdf).
Reply
1) выкладывание в интернет подразумевает возможность работы с ним средствами интернета, попросту говоря, чтобы поисковики ловили. Выкладывание картинок, пусть даже с наложенным на них распозаннных, но НЕ ВЫЧИТАННЫМ текстом эту задачу не решает.
2) Pdf хорош, когда его делают из набранного текста. Если текст распознавался с напечатанного, то особого смысла накладывать его на картинку я не вижу.
3) Один номер ВДИ, в пдф, потянет метров на двести-триста. На диалапе такое не очень-то скачаешь...
4) Единственный плюс, который я вижу у pdf - возможность донести до читателя все спецсимволы в разных хитрых транслитерациях. Но значительной части аудитории они не нужны, а качать придется всем.
-----------
?) Про сплошную pdfизацию ВДИ - вопрос к ВДИ. Некоторые издания таковой заморочились (Средние века или Византийский временник, например)...
Халгар.
Reply
Reply
Reply
Reply
Reply
Reply
Я согласен, что пдф+текст лучше, чем текст, но он намного затратнее, чем лучше.
ХФ.
Reply
Наоборот!!! ПДФ + текст будет менее трудозатратно, чем то, что Вы сейчас делаете! Особенно вычитывать ПДФ не нужно, там и так всё хорошо распознаётся, и есть оригинал под рукой. Единственный вопрос - сканирование, но при некотором навыке это перестаёт быть проблемой. Все сканы загоняются в замечательную программу СканКромсатор - и вуаля. Думаю, что по времени получается примерно столько же, сколько при распознавании \ наборе вручную и правке текста.
Reply
Reply
Требования к пдфу, насколько я понимаю, следующие: 1) вычитанный русский язык (нерусский отдается на откуп графическому слою); 2) соответствие страниц пдфа оригиналу; 3) соответствие строк и слов текстового слоя графическому слою.
Имеющиеся у меня сканы, в основном - 300 точек в сером, если настаиваете именно на 600 в черном - можно сделать.
Какую тематику текстов предпочитаете? ;)
Reply
Мне что-нибудь по гос.устройству, политике, философии, религии, культуре Рима (или Греции). Можно вот статью Бауэрсока, английский оригинал.
Reply
Я тоже сюда давненько не заглядывал :) Надеюсь, Вам система сообщит о том, что пришел ответ.
Статью Бауэрсока нужно будет добывать отдельно. Пока что я прошелся по списку того, что у меня есть по этим темам уже отсканенного (понималось максимально расширительно :)) из ВДИ. Список получился достаточно большой (4.5 вордовской страницы), думаю, сюда выкладывать не стоит. Пишите на halgar#newmail.ru, вышлю.
Reply
Leave a comment