Возможно, я чего-то не понимаю, но если размер словаря слишком велик по сравнению с размеров архива, то начинает играть весомую роль время поиска в словаре?
Но ведь пока слово меньше этого блока - архивация осуществляется.
Если это слово - номер внутри блока данных на 1 гб, то максимальный адрес составит не так много знаков: 2 ^ (от 1 до 30) плюс-минус ещё какое-то не очень длинное число для установления точной позиции. То есть номер в принципе можно ужать до десяти, может быть двадцати цифр. Самые частые блоки расставить на выгодные "круглые" места типа 2^5+1 или 2^7-1.
Не думаю, что оптимальный объём (объем, при котором архивация имеет смысл) для такого словаря такой уж маленький
Есть мнение, что количество универсальных слов, необходимых для такой архивации, растет в геометрической прогрессии по мере удлиннения слова. Теоретически должен быть какой-то предел, после которого рост объема словаря не оправдывается. Но, действительно, было бы интересно это посчитать. Эх, забросил я программирование лет 18 назад, даже жаль иногда...
Насколько я понимаю, наибольшую выгоду такой метод даст при архивации текстовых данных, но они слишком уж "легкие" по сравнению с медиа контентом, например, и архивировать их никакого особого смысла нет. Т.е. идею похоронили техническое совершенство средств передачи данных, большой объем и доступность накопителей.
Я сам об этом думал:) И понял, почему идея без перспектив. Если только ФИДОшникам ее подбросить, вроде бы они сохранились еще? Если кто и заинтересован в такой системе архивации, то только они.
Вообще-то обычно эти гигабайты являются медиаданными и уже пожаты гораздо более эффективными "архиваторами" - кодеками. Фактически, передаваемые медиаданные максимально близки к случайному набору данных.
3G/4G в основном потребляется мобильными устройствами - у которых и так не очень хорошо с быстродействием и набортным объемом памяти. Загрузить еще и так маломощные процессоры распаковкой (привет, батарея!), а небольшие объемы памяти - словарем на 50 гиг (привет, память!)? Интересная мысль, право!
Может это и будет иметь смысл для каких-то узкоспецилизированных применений - но для большинства устройств в настоящее время это нерационально.
Comments 74
Reply
Reply
Если это слово - номер внутри блока данных на 1 гб, то максимальный адрес составит не так много знаков: 2 ^ (от 1 до 30) плюс-минус ещё какое-то не очень длинное число для установления точной позиции. То есть номер в принципе можно ужать до десяти, может быть двадцати цифр. Самые частые блоки расставить на выгодные "круглые" места типа 2^5+1 или 2^7-1.
Не думаю, что оптимальный объём (объем, при котором архивация имеет смысл) для такого словаря такой уж маленький
Reply
Reply
Reply
Reply
Reply
Reply
Т.е. идею похоронили техническое совершенство средств передачи данных, большой объем и доступность накопителей.
Reply
Reply
Если только ФИДОшникам ее подбросить, вроде бы они сохранились еще? Если кто и заинтересован в такой системе архивации, то только они.
Reply
Reply
И да, у кого нет терабайта, могут идти в жопу
Reply
Reply
Может это и будет иметь смысл для каких-то узкоспецилизированных применений - но для большинства устройств в настоящее время это нерационально.
Reply
Reply
Leave a comment