Нутром чую - литр, а как математически выразить - не знаю

Feb 26, 2013 16:52

Разговоры про "архиватор Бабушкина" заставили меня задуматься над вопросом сжатия данных и прийти вот к какой мысли ( Read more... )

Мысли, Программирование

Leave a comment

Comments 74

tezzereth57 February 26 2013, 16:56:19 UTC
Возможно, я чего-то не понимаю, но если размер словаря слишком велик по сравнению с размеров архива, то начинает играть весомую роль время поиска в словаре?

Reply

void_am February 26 2013, 17:59:35 UTC
Растет размер слова, подставляемого вместо архивируемого блока байтов.

Reply

asocio February 26 2013, 18:08:43 UTC
Но ведь пока слово меньше этого блока - архивация осуществляется.

Если это слово - номер внутри блока данных на 1 гб, то максимальный адрес составит не так много знаков: 2 ^ (от 1 до 30) плюс-минус ещё какое-то не очень длинное число для установления точной позиции. То есть номер в принципе можно ужать до десяти, может быть двадцати цифр. Самые частые блоки расставить на выгодные "круглые" места типа 2^5+1 или 2^7-1.

Не думаю, что оптимальный объём (объем, при котором архивация имеет смысл) для такого словаря такой уж маленький

Reply

jack8merkin February 27 2013, 05:34:02 UTC
Есть мнение, что количество универсальных слов, необходимых для такой архивации, растет в геометрической прогрессии по мере удлиннения слова. Теоретически должен быть какой-то предел, после которого рост объема словаря не оправдывается. Но, действительно, было бы интересно это посчитать. Эх, забросил я программирование лет 18 назад, даже жаль иногда...

Reply


anonim_legion February 26 2013, 16:57:27 UTC
Для передачи http что-то подобное применяется. То есть, словарь на клиенте пополняется с сервера, и не передается каждый раз.

Reply


n0kk February 26 2013, 17:18:59 UTC
Анекдот №38!

Reply

asocio February 26 2013, 17:49:06 UTC
*осуждающе* мы при программистах таких анекдотов не рассказываем!

Reply

n0kk February 26 2013, 18:06:51 UTC
Это, походу, у нас словари разные...

Reply


kajaleksei February 26 2013, 17:20:14 UTC
Насколько я понимаю, наибольшую выгоду такой метод даст при архивации текстовых данных, но они слишком уж "легкие" по сравнению с медиа контентом, например, и архивировать их никакого особого смысла нет.
Т.е. идею похоронили техническое совершенство средств передачи данных, большой объем и доступность накопителей.

Reply

asocio February 26 2013, 17:49:45 UTC
Это я и так понимаю, люди уже гигабайты за минуты качают, какая уж там архивация

Reply

kajaleksei February 26 2013, 17:58:45 UTC
Я сам об этом думал:) И понял, почему идея без перспектив.
Если только ФИДОшникам ее подбросить, вроде бы они сохранились еще? Если кто и заинтересован в такой системе архивации, то только они.

Reply

stealthy_shadow February 26 2013, 18:28:28 UTC
Вообще-то обычно эти гигабайты являются медиаданными и уже пожаты гораздо более эффективными "архиваторами" - кодеками. Фактически, передаваемые медиаданные максимально близки к случайному набору данных.

Reply


sandblaster February 26 2013, 17:25:31 UTC
Сейчас это имело бы смысл для 3/4Ж, там, где надо оптимизировать траффик.

И да, у кого нет терабайта, могут идти в жопу

Reply

alex_brab February 26 2013, 17:34:50 UTC
такое давно существует для любых IP сетей.

Reply

stealthy_shadow February 26 2013, 17:49:22 UTC
3G/4G в основном потребляется мобильными устройствами - у которых и так не очень хорошо с быстродействием и набортным объемом памяти. Загрузить еще и так маломощные процессоры распаковкой (привет, батарея!), а небольшие объемы памяти - словарем на 50 гиг (привет, память!)? Интересная мысль, право!

Может это и будет иметь смысл для каких-то узкоспецилизированных применений - но для большинства устройств в настоящее время это нерационально.

Reply

alex_brab February 26 2013, 17:51:08 UTC
вам слово "кеш" о чем-то говорит?

Reply


Leave a comment

Up