Сегодня с 9 утра до 12 и с 12.40 до 14.40, суммарно 5 часов, сжимал сфотографированные данные из Ленинской библиотеки для дипломной работы.
Статистика, которую вы видите на своих экранах:
Зачем сжимал?
Во-первых, для экономии места. На данный момент скопировано меньше половины желаемого материала, и уже это чуть более тысячи страниц (1030 шт.).
В среднем получилось по 40 страниц на "книгу", при сжатии очистилось лишняя информация объёмом почти в 1200Мб (1188Мб), или 37% от первоначального объёма.
Объём одной страницы, в среднем, составил чуть меньше 2Мб (1,91Мб - от 3,23Мб/стр., до 1,05Мб/стр.)
Максимальный коэффициент сжатия MGPP (Max\Min Gym per page)- 1,79, минимальный - 1,27.
Дальнейшие исследования продолжатся с поступлением нового материала, однако не думаю, что они сильно повлияют на статистику.
Ясно, возрастёт объём информации (пока только попробовал на зуб систему защиты информации Ленинки. На словах она была неприступна, как Лев Толстой, а на деле оказалась совсем простой).
То есть с 40 страниц "на книгу в среднем", объём увеличится до 70-100 страниц/"книга".
Понятно, что коэффициент сжатия и средний объём одной страницы практически не изменятся при возрастании общего объёма данных с 1к до 2,3 или даже 5к страниц (2000,3000 или 5000, соответственно).
Учебное лето в разгаре -
не упусти момент, прояви себя!