Цифровой аудиоформат 24/192, и почему в нем нет смысла. Часть 4 (и последняя) (перевод)

Feb 26, 2015 13:07



Прим. перев.: Это перевод последней части развернутой статьи Кристофера «Монти» Монтгомери (создателя Ogg Free Software и Vorbis) о том, почему обывателям нет никакого смысла хранить и воспроизводить музыку в формате 24/192 и что реально может улучшить качество воспроизведения ваших любимых записей.

[ Первая часть]
[ Вторая часть]
[ Третья часть]

Наконец, хорошие новости!

Что же нужно, чтобы улучшить качество цифрового звука, который мы слушаем?
Лучшие наушники

Самый простой способ - не цифровой. Наиболее сильным улучшением качества звука за деньги становится хорошая пара наушников. Накладные или внутриканальные наушники, наушники открытого или закрытого типов - по большей части это не имеет значения. Они даже не обязательно должны быть дорогими, хотя дорогие наушники могут стоить своих денег.

Помните, что некоторые наушники дорогие, потому что они хорошо сделаны, прочны и отлично звучат. Другие дорогие, потому что это наушники за $20, которые стилизованы на несколько сотен долларов, разрекламированы и носят название какого-нибудь бренда. Я не дам никаких конкретных рекомендаций, но скажу, что, скорее всего, вы не найдете хороших наушников в больших магазинах техники, даже если они специализируются на музыкальном оборудовании.

Формат со сжатием без потерь

Можно считать правдой, что правильно закодированный OGG-файл (или MP3, или AAC) будет неотличим от оригинала при умеренном уровне квантования.

Но что насчет плохо закодированных файлов?

Двадцать лет назад все MP3-кодировщики были очень плохими по современным стандартам. Множество этих плохих кодировщиков все еще используются, предположительно из-за того, что лицензии на них дешевы, а большинство людей не различает или не заботится о разнице звучания. Зачем компаниям тратить деньги и исправлять что-то, если люди даже не знают, что оно работает недостаточно хорошо?

Если перейти к более новым форматам, например Vorbis или AAC, то принципиально ничего не изменится. Например, множество компаний и отдельных людей использовали (и все еще используют) низкокачественный стандартный кодировщик Vorbis от FFmpeg, потому что он поставляется по умолчанию с FFmpeg, и им без разницы, насколько он плохой. У AAC еще более длинная история широко распространённых низкокачественных кодировщиков, которые использовали для сжатия с потерями всех основных форматов.

Форматы со сжатием без потерь, такие как FLAC исключают любую возможность навредить качеству звучания [23] плохим кодировщиком, или даже хорошим, но использованным неправильно.

Вторая причина распространения форматов без потерь - стремление избежать потерь в будущем. Каждое кодирование и перекодирование теряет все большее количество информации, даже если первое кодирование было идеальным, очень вероятно, что после второго кодирования появятся звуковые артефакты. Это важно для тех, кто хочет сделать ремикс или музыкальную выборку. В особенности это важно для нас, исследователей кодеков, нам нужен чистый звук для работы.

Лучшие мастер-диски

В тесте, проведенном БАС, о котором я говорил выше, вскользь упоминалось, что SACD-версия записи может звучать значительно лучше, чем CD. Так получается не из-за увеличенной частоты дискретизации или уровня квантования, а из-за того, что для создания SACD используется мастер-диск более высокого качества. При записи на CD-R, SACD все равно звучит так же хорошо как оригинальная SACD, и лучше чем CD, потому что оригинальный звук, примененный для записи SACD, был лучше. Хороший мастеринг и методики производства, очевидно, вносят свой вклад в качество музыки [24].

Недавно освещавшийся в прессе «Мастеринг для iTunes», и другие подобные инициативы от прочих лейблов несколько обнадеживают. Что еще предстоит увидеть, так это: действительно ли Apple и другие все-таки «займутся проблемой», или это - обычная приманка для того, чтобы продать потребителям музыку, которая у них уже есть, но подороже.

Окружение

Еще одна «уловка для повышения продаж», на которую купился бы и я - это «объемные» записи. К сожалению, здесь есть некоторые технические опасности.

Старомодный дискретный «объемный звук» с несколькими каналами (5.1, 7.1 и т.д.) - это техническая реликвия, использовавшаяся еще в 1960х годах в кинотеатрах. Однако объемная картинка ограничена, и звук ближних динамиков искажается, когда слушатель сдвигается с позиции или садится не туда изначально.

Мы можем восстановить и создать отличные и надёжные системы определения местоположения, используя такие инструменты как Ambisonics. Проблемами становятся стоимость оборудования для воссоздания объёмного звука и тот факт, что запись, закодированная для естественного звукового поля, звучит плохо при воспроизведении в стерео и не может быть воссоздана искусственно должным образом. Очень сложно подделать амбифонический звук или голографическое аудио, эффект будет как у 3D - оно превращается безвкусный трюк и укачивает 5% населения.

Бинауральный звук также очень сложен. Вы не можете сымитировать его, потому что он звучит для разных людей по-разному. Люди подсознательно двигают головой, чтобы лучше отследить источник звука, без этого они не могут определить его местоположение. Это нельзя учесть на бинауральной записи, хотя в зафиксированной обстановке добиться этого все же можно.

Это вряд ли непреодолимые технические препятствия. Дискретное объемное аудио уже доказало свою востребованность на рынке, и я сам лично восхищен возможностями, предлагаемыми Ambisonic.

Кода

«Меня никогда не беспокоила музыка как таковая,
Самый сок был в её качестве!»
- Фландерс и Свон, «Песнь воспроизведения»

Самое главное - это наслаждаться музыкой, так? Современное качество воспроизведения несравнимо лучше, чем хорошие аналоговые системы прошлого поколения. Неужели этот вопрос - еще одна проблема первого мира? Возможно, но плохие миксы и кодировки утомляют меня, отвлекают меня от музыки, и я такой не один.

Почему я выступаю против 24/192? Потому что это решение проблемы, которой нет - это бизнес-модель, построенная на невежестве, с целью обмануть людей. Более того, псевдонаука ходит по миру незамеченной, и тем сложнее правде затмить правдоподобность. Даже если это небольшой и совершенно незначительный пример.

«Мне кажется, что гораздо лучше понять вселенную, как она есть, чем упорствовать в заблуждении, пусть и удовлетворительном и обнадеживающем»
- Карл Саган (Carl Sagan)

Что еще почитать

Читатели дали мне ссылки на парочку отличных работ, о которых я не знал перед написанием моей собственной статьи. Они затрагивают многие из тех же вопросов, но более подробно.

Материал «Кодирование высококачественного цифрового звука» Боба Стюарта из Meridian Audio - невероятно ёмко, хотя и длинно. Наши выводы несколько отличаются (он принимает как должное немного более широкий частотный диапазон и битовую глубину без особых оснований), но мысль его ясна и ей легко следовать. [Правка: могу не согласиться со многими другими его работами, но эта мне сильно нравится]

Статья «Цифровое аудио. Теория дискретизации» Дэна Лаури (Dan Lavry) из Lavry Engineering - еще одна статья, которую выделили несколько читателей. Она объясняет мои две страницы о дискретизации, передискретизации и фильтрации более подробно на 27 страницах, с множеством графиков, примеров и ссылок.

Стефан Пиджен (Stephane Pigeon) с audiocheck.net написал слуховые тесты, доступные в браузере, и разместил их на сайте компании. Набор тестов пока относительно небольшой, но некоторые имеют непосредственное отношение к контексту данной статьи. Они хорошо работают, и я счел их качество довольно неплохим.

Примечания к Части 4

23. Журнал Wired полагает, что форматы со сжатием без потерь, такие как FLAC, не всегда являются действительно форматами без потерь:
Некоторые борцы за чистый звук вообще предложат не обращать внимания на FLAC и сразу купить WAV. […] Купив WAV, вы можете избежать потенциальных потерь, которые могут возникнуть при преобразовании во FLAC. Это редко, но случается.
Это неправда. Процесс сжатия без потерь никогда не изменяет исходные данные, ни при каких условиях, и FLAC не исключение.
В том случае, если Wired имели в виду аппаратные повреждения файлов (сбои дисков, потери памяти, пятна на солнце), то и WAV, и FLAC будут повреждены. Вот только FLAC имеет контрольные суммы, и повреждение может быть отслежено. Также FLAC занимает меньше места, чем WAV, что уменьшает возможность случайного повреждения, потому что данных, которые могут быть повреждены, меньше.
24. «Войны громкости» - это наиболее часто приводимый пример плохого мастеринга в современной индустрии, хотя далеко не единственный. Громкость - это гораздо более старый феномен, чем утверждает Википедия, ведь еще в 1950-е годы артисты и продюсеры настаивали на самых громких записях. Производители оборудования исследовали и создавали новые технологии, чтобы угодить производителям записей. Более продвинутое оборудование для мастеринга винила в 1970х и 1980х годах, например, отслеживало и уплотняло границы дорожек там, где это возможно, что давало возможность записывать более высокие амплитуды, чем обычно позволяло пространство пластинки.
Современные цифровые технологии позволяют поднять громкость до абсурдных уровней. Также существует разнообразие автоматических, очень сложных запатентованных модулей цифровых станций, которые развертываются повсеместно, без полного понимания того, как они работают или что же они делают на самом деле.

аудиомания, 16-битный звук, 24-битный звук, аудиоформаты, перевод, audiomania

Previous post Next post
Up