Росархив опубликовал отчет о научно-исследовательской работе
«Исследование современных процессов документационного обеспечения управления и развития электронного документооборота» по теме «Сравнительный анализ форматов файлов электронных документов постоянного (долговременного) хранения».
Зачем Российскому государственному гуманитарному университету потребовалось доказывать, что открытый формат файла имеет одни лишь неоспоримые преимущества над закрытым или проприетарными аналогами, вернее зачем Росархиву потребовалось заказывать у РГГУ обоснование аксиомы - глубоко непонятно.
Возможно, ответ связан с тем, что научно-исследовательская работа проводилась в рамках государственного контракта № 016-3 <...> в рамках реализации мероприятий ФЦП «Культура России (2012-2018 гг.)», а мы прекрасно знаем, какие чудеса происходят, когда бюджетные деньги встречаются с мастерами культуры... Цена чуда на этот раз -
1,15 млн. наших рублей. Оно того стоило?
Злые языки
утверждают, что нет, и даже
ловят «авторов» на том, что «их» научное исследование чуть менее чем полностью было написано в Университете Флориды, причем авторский текст не везде был даже переведен на русский язык.
Но я не поверил на слово злым языкам и полистал текст самостоятельно. Люблю начинать читать подобные документы с конца, с приложений - в них сразу видна вся суть. Что обычно выносят в приложения? Базовые вещи: список терминов и их расшифровка, первичные данные, на которых строились выводы, статистика, другими словами - фундамент «здания», на который широкой публике смотреть не интересно, а специалистам - самое оно.
Оно самое и есть: список вычислительной техники и программного обеспечения, якобы необходимого для работы по обеспечения постоянного (долговременного) хранения электронных документов. Я вас сильно удивлю, если скажу, что, согласно докладу, рекомендуемая конфигурация ПК для этих целей следующая: материнская плата Asus P5B-V (год выхода на рынок - 2006, разумеется, снята с производства, в продаже практически не встречается), процессор Core 2 Duo E4400 (год выхода - 2007, снят с производства, стоит сейчас - как новейший процессор прошлого года выпуска), монитор Acer AL1716As (год выхода на рынок точно не скажу, но все-таки в этом веке) и так далее - указания на конкретные марки и даже модели комплектующих, включая «мышь» Logitech RX-250, из которых собирается отличный экспонат для музея компьютерного хлама. И «ориентировочная» цена на него тоже музейная указана - более 20.000 рублей.
Долговременное хранение документов экспонат, разумеется, может обеспечить лишь под управлением ОС Windows; для этого понадобится «1С:Бухгалтерия 8. Комплект на 5 пользователей» и еще куча коммерческого ПО, которому есть куда более подходящие для указанных целей бесплатные аналоги.
Ну да ладно, это все мелочи, нам же был обещан разговор про форматы файлов и сравнение их друг с другом с точки зрения постоянного (долговременного) хранения электронных документов. И вот тут нас, дорогие читатели, ждут настоящие открытия вызванные, видимо, сложностями перевода флоридской работы. Оказывается:
1. Для хранения растровой графической информации с высоким разрешением наиболее популярны форматы JPEG, TIFF и BMP. JPEG, с его сжатием с потерей данных и BMP, которому терять просто нечего, кроме огромного размера файла - наиболее популярные форматы постоянного или долговременного хранения, наряду с TIFF, ага...
2. Для хранения векторной графической информации наиболее эффективны <...> SWG, WMF, CGM и им подобные. Однако векторные форматы, как правило, искажают цветовую схему сложного изображения. Что-что? Простите, что они искажают? Палитру встроенных растров что ли? Или мадам и месье про цветовые профили ничего не слышали? Научились бы пользоваться каким-нибудь AI для начала, а уже потом крошили бы батон. А теперь, поднимите руки те, кто слышал про формат векторной графики SWG? Кто хранит векторы в WMF? Кто держал в руках файл CGM? Никого? Я так и думал... Да, кстати, SWG правильно называется SVG, кто знает, что означает аббревиатура, тот никогда не ошибется, и не спутает его с SWF.
3. Аудио документы (?!) кодируют в форматы, обеспечивающие высокое качество сохранения и воспроизведения информации (например, MP3, WMF). Вау! MP3 - формат высококачественного хранения! Вау! WMF может не только растр, но и аудиоданные включать! Вау, вау, вау! Ну вот утверждают, что может: объём файла в формате WMF длительностью звучания 60 минут составляет около 12-14 Мбайт, - при каком потоке данных, а? - что эквивалентно документу MS WORD размером около 2500 страниц. Тут просто занавес и не надо оваций - сравнивать аудиофайл по «объему информации» с текстовым...
4. Видеоинформация обладает свойствами, аналогичными аудиоинформации, но значительно более выраженными (держите меня семеро!) Выбор различных видов кодирования видеоинформации решающим образом сказывается на качестве изображения, что существенно влияет на объём хранимого объекта. Спасибо, что сообщили, а отдельное спасибо - за перечень форматов кодирования (!!!), среди которых BDRip, DVDRip и HDRip. Я не шучу, читайте сами: это, по мнению авторов отчета - форматы кодировки видеоинформации.
Кому и этого мало, наслаждайтесь: практическая независимость размера от длительности воспроизведения может объясняться привязкой размера к стандартной ёмкости традиционных носителей этой информации (CD, DVD-дисков и т.д.). Т.е. эти бретанские учоные взяли 3 «пиратских» диска с 3 фильмами, продолжительностью 3, 2,5 и 2 часа соответственно, и методом научного бреда установили: размеры BDRip’ов каждого фильма примерно равны, следовательно, степень сжатия видеоинформации не сильно зависит от ее объема, на стандартный диск в любом случае должно влезть.
Я вообще думал написать довольно большой текст с большим количеством примеров, но дочитал до этого места и передумал. Как было сказано выше, незачем доказывать аксиомы. В свое оправдание я мог бы сказать, что не трачу на это дело 1,15 млн. рублей налогоплательщиков, но времени на разбор подобного бреда мне тоже жалко, тем более своего личного.
UPD: как напоминают внимательные читатели, я уже
писал о заказываемых Росархивом НИРах-«открытиях»...