Мысли вразброс

Oct 15, 2010 14:39


  Как "нацпатствущий краскон": Гутенберг уже есть, да и что нам до Гутенберга? Вот переименовать бы сообщество в Fjodorov_Book или, поддерживая батьку, в Skorina_Book... Жалко только $15 СУПу отдавать. :)))

Теперь техническое:
  1. Источники:

    • самостоятельное сканирование;
    • Файлопомойки:

      • экзотические форматы:

        • многостраничный .tiff;
        • набор графических файлов: .tiff (одностраничный), .jpeg, .gif, .png, .bmp и т.д.
      • .djvu и .pdf на файлохранилищах

        • без текстового слоя;
        • с текстовым слоем (возможны ошибки OCR)
  2. Вычитка
      Мне понравилась система Orphus у местных капээрэфников (тоже грозились подключиться к проекту - P.S. Ага, они уже здесь! :). И зачатки системы мотивирования у них же, но это тема отдельной проработки. Нужен хостинг с php для разбивки задач по этапам, отслеживания выполнения и т.д. - ЖЖ для этого не подходит, он даже примитивный javascript режет...
  3. Форматы выкладки (желательно покрывать максимально полно):

    • .pdf с картинками - чтобы любой усомнившийся мог убедиться: автор действительно так написал! Ну, или действительно обнаружить ошибку, пропущенную при вычитке.
        Поскольку распознавание уже произведено - следует стремиться к минимизации объема файла за счет ухудшения характеристик (размер страницы, разрешение). Файл размером 90Mb может быть редуцирован в 10-20 раз без утраты читабельности с экрана.
        Почему не .djvu? Потому что многие мобильные устройства дял чтения сейчас понимают .pdf, но "не знают" о наличии этой действительно лучшей альтернативы.
    • .html - основа основ, базовый для Интернета формат, допускает трансформацию в любой из нижеследующих;
    • .rtf - исходно разработанный Microsoft, де-факто не проприетарен (клок шерсти с паршивой овцы), доступен на большинстве платформ, в отличие от .txt содержит форматирование, позволяет переверстать для распечатки под нужды распечатывающего (увеличить шрифт для читабельности или, напротив, уменьшить для экономии бумаги; или повыделять [подчеркиванием-курсивом-полужирным] важные моменты);
    • .pdf как результат распечатки предыдущего пункта на PDF-принтер - гарантия сохранения форматирования на любом девайсе;
    • .fb2 - любимец узкого круга электронных библиотек, но зато КАКИХ! :)
    • .ePub - конкурент предыдущего, дает более широкие возможности форматирования, вплоть до (необязательной!) интеграции использованных шрифтов. Все шире используется в мобильных устройствах, для персоналок существуют программы-читалки под все распространенные ОС, счастливые пользователи Firefox могут установить дополнения EPUBReader или Openberg.
    • .jar - для любителей читать с мобилок;
    • ДОПОЛНИТЕЛЬНЫЕ СООБРАЖЕНИЯ?
  4. Места выкладки:

    • Файлопомойки:

      • RapidShare (ограничен срок хранения, не знаю - продлевается ли). Достоинство - буржуинский, менее доступен козням местных копирастов.
      • Depositfiles (срок хранения - 30 дней с момента последнего скачивания, не знаю - продлевается ли);
      • iFolder - уже становился жертвой "наезда", поэтому сомнительный для наших целей, под прицелом копирастов;
      • Яндекс.Диск - срок хранения тоже ограничен, но продлевается очень легко, мне нравится. Увы, ресурс эрэфийский, легко станет жертвой;
      • на mail.ru еще не пробовал сохраняться, но сервис такой у них есть.
    • Наваять свою файлопомойку, сейчас куча бесплатных хостингов, годится и без php в этих целях, но обязательно у буржуинов, как:
        а) не знающих русский и пропускающих по этой причине коммуняцкую пропаганду
        б) находящихся вне прямого влияния наших копирастов.
      Ограничение дискового пространства элементарно обходится регистрацией нового ресурса: Fjodorov001, Fjodorov002 и т.д. - список ведется на головном.
    • Фотохостинги, допускающие отдачу оригинального файла (например, gallery.ru уродует оригинал!), как описано здесь: http://beobaxter.livejournal.com/944123.html
    • Раздача торрентом. Тут тоже надо продумать систему мотивации, чтобы ни одна раздача не оставалась без сидеров.
    • возродить моду на eMule :)
    • Opera Unite;
    • ДРУГИЕ МАЛО РАСПРОСТРАНЕННЫЕ ПОКА ТЕХНОЛОГИИ?


    P.S. Товарищ главмодер, заведите тэг "техническое" для такого рода постов.
      И стоит ли копипастить алгоритмы обработки с других сайтов?

    техническое

    Previous post Next post
    Up