сканы | rexy

Может ли что доброе изойти от питонщиков?

rexy_craxy Aug 04, 2023 00:26

ocrodjvu и hocr2djvused пропали из слаковских реп. Причина? Проекты заморожены (по кр. мере второй из). Будем писать своё на Тикле, чо.

ЗЫ На Тикле - тому що быстро (писать) и тому що разбор-декракозябризация hOCR (читай: HTML) с tcllib делаются в несколько строчек кода.Original post: Read more... )

программизьм, do it yourself, гниение и распад, know your enemy, сканы

Leave a comment

Быстрый OCR-инг DjVu-шек с cuneiform

rexy_craxy Aug 12, 2022 22:03

Как известно, у нас, пынгwынОw, всего две "народных" распознавалки текста, tesseract и cuneiform.

Первая хороша тем, что умеет распознавать "мультиязычные" тексты, также для нея существует python-приложение ocrodjvu, берущее на себя всю скучную работу по "сборке-разборке" DjVu-документа. Но очень уж она тормозная!

Вторая -- cuneiform -- ( Read more... )

книги, программизьм, do it yourself, сканы

Leave a comment

Серия книг по культуре стран Латинской Америки

rexy_craxy Jun 20, 2015 22:51

Серия книг Института Латинской Америки АН СССР (что удалось найти в Сети и в библиотеке) под редакцией В. А. Кузьмищева:

( Read more... )

книги, латинская америка, сканы

Leave a comment

Учиться работать у

rexy_craxy Dec 15, 2013 01:02

"...ohne die Sixtinische Kapelle gesehen zu haben, kann man sich keinen anschauenden Begriff machen, was ein Mensch vermag" - "И чего только не соорудит незатейливый итальянский мужик одним топором с кисточкой и ведёрком краски"! (23 августа 1787 г., Гёте, осматривая росписи Сикстинской капеллы ( Read more... )

книги, do it yourself, сканы

Leave a comment

TWIMC: о вероятности пропуска страниц в "сканере с пальцем"

rexy_craxy Sep 21, 2013 11:51

Провел простой эксперимент: взял ластик, книжку и вручную сымитировал работу частей листающего механизма. Главный вывод: если листать "чисто по-человечески", то "лишние" страницы иногда прихватываются, но если в момент сдвига "пальцем" нижнего угла страницы удерживать прижатой (как это и делает бот в ролике) ее верхнюю часть, то поднимается строго ( Read more... )

do it yourself, техническое, сканы

Leave a comment

Вкалывают роботы...

rexy_craxy Aug 23, 2013 00:01

Click to view

( http://www.youtube.com/v/kvM-tjrS2-U )

Недурно! Но все же это, в известном (в частности, из ТРТС/ТРИЗ) смысле, дурной подход - копирование в машине движений (и вообще действий) человека. Не помню ужé, ктó совершенно правильно сказал: неверно, что машины-де делают то же, что и ( Read more... )

do it yourself, курьез, триз, техническое, партизанщина, сканы

Leave a comment

Паллиативы (конвертация PDF в DjVu "парой кликов")

rexy_craxy Nov 26, 2012 22:38

Раз: http://any2djvu.djvuzone.org/
Или два: http://www.docspal.com/

Что же до прочего, то я считаю, что частная собственность должна быть уничтожена.

do it yourself, техническое, сканы

Генератор страниц с экслибрисом

rexy_craxy Aug 25, 2012 10:05

( Read more... )

книги, do it yourself, программизЬм, сканы

Leave a comment

Хозяйке на заметку

rexy_craxy Jun 30, 2012 19:56

GQview/Geeqie зачастую отказываются отображать файлы форматов семейства Netpbm. А именно те файлы, заголовок которых не содержит комментария. Поэтому когда конвертируете в форматы Netpbm (*.pbm, *.pgm, *.ppm), пользуйтесь опцией "-comment" ImageMagick'овских утилит, примерно так:

convert ... -comment 'bla-bla' IN.tiff OUT.pgmИ будет вам счастье. ( Read more... )

do it yourself, ошибка, программизЬм, сканы

Leave a comment

Возможно, кому-то пригодится

rexy_craxy Jun 26, 2012 21:56

Из личной переписки, по поводу оцифровки книг по схеме "мыльница -- компутер -- файл DjVu". Ответ не совсем на тот вопрос, который задан :)

--- [один местный товарищ -- RC] wrote:
> добрый день. я отфотографировал одну книжку. какое п.о. нужно что бы из фото сделать книгу, а потом переделать в djvu?Привет. Даже не знаю, чем лучше под Windows ( Read more... )

книги, do it yourself, сканы