Как "нацпатствущий краскон": Гутенберг уже есть, да и что нам до Гутенберга? Вот переименовать бы сообщество в Fjodorov_Book или, поддерживая батьку, в Skorina_Book... Жалко только $15 СУПу отдавать. :)))
Теперь техническое:
- Источники:
- самостоятельное сканирование;
- Файлопомойки:
- экзотические форматы:
- многостраничный .tiff;
- набор графических файлов: .tiff (одностраничный), .jpeg, .gif, .png, .bmp и т.д.
- .djvu и .pdf на файлохранилищах
- без текстового слоя;
- с текстовым слоем (возможны ошибки OCR)
- Вычитка
Мне понравилась система Orphus у местных капээрэфников (тоже грозились подключиться к проекту - P.S. Ага, они уже здесь! :). И зачатки системы мотивирования у них же, но это тема отдельной проработки. Нужен хостинг с php для разбивки задач по этапам, отслеживания выполнения и т.д. - ЖЖ для этого не подходит, он даже примитивный javascript режет...
- Форматы выкладки (желательно покрывать максимально полно):
- .pdf с картинками - чтобы любой усомнившийся мог убедиться: автор действительно так написал! Ну, или действительно обнаружить ошибку, пропущенную при вычитке.
Поскольку распознавание уже произведено - следует стремиться к минимизации объема файла за счет ухудшения характеристик (размер страницы, разрешение). Файл размером 90Mb может быть редуцирован в 10-20 раз без утраты читабельности с экрана.
Почему не .djvu? Потому что многие мобильные устройства дял чтения сейчас понимают .pdf, но "не знают" о наличии этой действительно лучшей альтернативы.
- .html - основа основ, базовый для Интернета формат, допускает трансформацию в любой из нижеследующих;
- .rtf - исходно разработанный Microsoft, де-факто не проприетарен (клок шерсти с паршивой овцы), доступен на большинстве платформ, в отличие от .txt содержит форматирование, позволяет переверстать для распечатки под нужды распечатывающего (увеличить шрифт для читабельности или, напротив, уменьшить для экономии бумаги; или повыделять [подчеркиванием-курсивом-полужирным] важные моменты);
- .pdf как результат распечатки предыдущего пункта на PDF-принтер - гарантия сохранения форматирования на любом девайсе;
- .fb2 - любимец узкого круга электронных библиотек, но зато КАКИХ! :)
- .ePub - конкурент предыдущего, дает более широкие возможности форматирования, вплоть до (необязательной!) интеграции использованных шрифтов. Все шире используется в мобильных устройствах, для персоналок существуют программы-читалки под все распространенные ОС, счастливые пользователи Firefox могут установить дополнения EPUBReader или Openberg.
- .jar - для любителей читать с мобилок;
- ДОПОЛНИТЕЛЬНЫЕ СООБРАЖЕНИЯ?
- Места выкладки:
- Файлопомойки:
- RapidShare (ограничен срок хранения, не знаю - продлевается ли). Достоинство - буржуинский, менее доступен козням местных копирастов.
- Depositfiles (срок хранения - 30 дней с момента последнего скачивания, не знаю - продлевается ли);
- iFolder - уже становился жертвой "наезда", поэтому сомнительный для наших целей, под прицелом копирастов;
- Яндекс.Диск - срок хранения тоже ограничен, но продлевается очень легко, мне нравится. Увы, ресурс эрэфийский, легко станет жертвой;
- на mail.ru еще не пробовал сохраняться, но сервис такой у них есть.
- Наваять свою файлопомойку, сейчас куча бесплатных хостингов, годится и без php в этих целях, но обязательно у буржуинов, как:
а) не знающих русский и пропускающих по этой причине коммуняцкую пропаганду
б) находящихся вне прямого влияния наших копирастов.
Ограничение дискового пространства элементарно обходится регистрацией нового ресурса: Fjodorov001, Fjodorov002 и т.д. - список ведется на головном.
- Фотохостинги, допускающие отдачу оригинального файла (например, gallery.ru уродует оригинал!), как описано здесь: http://beobaxter.livejournal.com/944123.html
- Раздача торрентом. Тут тоже надо продумать систему мотивации, чтобы ни одна раздача не оставалась без сидеров.
- возродить моду на eMule :)
- Opera Unite;
- ДРУГИЕ МАЛО РАСПРОСТРАНЕННЫЕ ПОКА ТЕХНОЛОГИИ?
P.S. Товарищ главмодер, заведите тэг "техническое" для такого рода постов.
И стоит ли копипастить алгоритмы обработки с других сайтов?