Comments | asocio: Нутром чую - литр, а как математически выразить

asocio

Нутром чую - литр, а как математически выразить - не знаю

Feb 26, 2013 16:52

Разговоры про "архиватор Бабушкина" заставили меня задуматься над вопросом сжатия данных и прийти вот к какой мысли ( Read more... )

Мысли, Программирование

Comments 74

tezzereth57 February 26 2013, 16:56:19 UTC

Возможно, я чего-то не понимаю, но если размер словаря слишком велик по сравнению с размеров архива, то начинает играть весомую роль время поиска в словаре?

void_am February 26 2013, 17:59:35 UTC

Растет размер слова, подставляемого вместо архивируемого блока байтов.

asocio February 26 2013, 18:08:43 UTC

Но ведь пока слово меньше этого блока - архивация осуществляется.

Если это слово - номер внутри блока данных на 1 гб, то максимальный адрес составит не так много знаков: 2 ^ (от 1 до 30) плюс-минус ещё какое-то не очень длинное число для установления точной позиции. То есть номер в принципе можно ужать до десяти, может быть двадцати цифр. Самые частые блоки расставить на выгодные "круглые" места типа 2^5+1 или 2^7-1.

Не думаю, что оптимальный объём (объем, при котором архивация имеет смысл) для такого словаря такой уж маленький

jack8merkin February 27 2013, 05:34:02 UTC

Есть мнение, что количество универсальных слов, необходимых для такой архивации, растет в геометрической прогрессии по мере удлиннения слова. Теоретически должен быть какой-то предел, после которого рост объема словаря не оправдывается. Но, действительно, было бы интересно это посчитать. Эх, забросил я программирование лет 18 назад, даже жаль иногда...

Thread 9

anonim_legion February 26 2013, 16:57:27 UTC

Для передачи http что-то подобное применяется. То есть, словарь на клиенте пополняется с сервера, и не передается каждый раз.

n0kk February 26 2013, 17:18:59 UTC

Анекдот №38!

asocio February 26 2013, 17:49:06 UTC

*осуждающе* мы при программистах таких анекдотов не рассказываем!

n0kk February 26 2013, 18:06:51 UTC

Это, походу, у нас словари разные...

kajaleksei February 26 2013, 17:20:14 UTC

Насколько я понимаю, наибольшую выгоду такой метод даст при архивации текстовых данных, но они слишком уж "легкие" по сравнению с медиа контентом, например, и архивировать их никакого особого смысла нет.
Т.е. идею похоронили техническое совершенство средств передачи данных, большой объем и доступность накопителей.

asocio February 26 2013, 17:49:45 UTC

Это я и так понимаю, люди уже гигабайты за минуты качают, какая уж там архивация

kajaleksei February 26 2013, 17:58:45 UTC

Я сам об этом думал:) И понял, почему идея без перспектив.
Если только ФИДОшникам ее подбросить, вроде бы они сохранились еще? Если кто и заинтересован в такой системе архивации, то только они.

stealthy_shadow February 26 2013, 18:28:28 UTC

Вообще-то обычно эти гигабайты являются медиаданными и уже пожаты гораздо более эффективными "архиваторами" - кодеками. Фактически, передаваемые медиаданные максимально близки к случайному набору данных.

sandblaster February 26 2013, 17:25:31 UTC

Сейчас это имело бы смысл для 3/4Ж, там, где надо оптимизировать траффик.

И да, у кого нет терабайта, могут идти в жопу

alex_brab February 26 2013, 17:34:50 UTC

такое давно существует для любых IP сетей.

stealthy_shadow February 26 2013, 17:49:22 UTC

3G/4G в основном потребляется мобильными устройствами - у которых и так не очень хорошо с быстродействием и набортным объемом памяти. Загрузить еще и так маломощные процессоры распаковкой (привет, батарея!), а небольшие объемы памяти - словарем на 50 гиг (привет, память!)? Интересная мысль, право!

Может это и будет иметь смысл для каких-то узкоспецилизированных применений - но для большинства устройств в настоящее время это нерационально.

alex_brab February 26 2013, 17:51:08 UTC

вам слово "кеш" о чем-то говорит?

Thread 7