sonyps4.ru

Как узнать сетевую активность компьютера. Как узнать какие программы соединены с интернетом — TCPView

Эммануэль Дерюти

«Почему музыка стала звучать хуже». «Поклонники жалуются, что Death Magnetic в Guitar Hero звучит лучше, чем на CD». «Даже фанаты хеви-метала считают, что сегодняшняя музыка слишком громкая!» «Dynamic Range Day объявляет новое движение против громкости». «Смерть Hi-Fi»… В прессе и сети растёт движение против «войны за громкость», практики, когда люди пытаются получить максимально возможную громкость в своих треках, чтобы заставить слушателей ощущать их более «горячими» по сравнению с конкурирующими релизами. Согласно этим статьям, неблагоразумные методы мастеринга и, более конкретно, злоупотребление brickwall-ограничителями, ставят музыку под угрозу. В современном производстве не хватает детальности, и оно жертвует качеством ради уровня. Боб Дилан в 2006 году в своём интервью заявил, что «Вы слушаете эти современные альбомы, и они звучат просто по-зверски. У них один звук везде. Нет никакой чёткости и детальности, ни в вокале, ни в чём-то другом. Всё статично».

Но не является ли замечание Дилана отражением извечного конфликта между отцами и детьми? Это был бы не первый случай, когда старая гвардия презирает то, что делает новое поколение. Хотя, верно и то, что многие звукоинженеры присоединяются к обществу, предпочитающему «более динамичную» музыку. Но объективно ли они говорят о том, что такая музыка лучше, или они просто предпочитают какой-то определённый тип звучания? Моё исследование постарается дать ответы на эти вопросы. Мы узнаем, действительно ли стала громче современная музыка, и стало ли в ней меньше динамики. Мы также рассмотрим гипотезу, что громкость может быть стилистическим признаком специфических музыкальных жанров, а не «дурной манерой», мотивированной презренными коммерческими интересами. И, наконец, мы пристально поглядим на печально известный альбом Death Magnetic группы Metallica и выясним, почему многим людям кажется, что он звучит плохо.

Действительно ли теперь музыка стала громче?

Да, это так, и здесь нет никаких сомнений. Давайте возьмём большое количество известных поп-песен, записанных в промежутке между 1969 и 2010 годами, нормализуем их так, чтобы пики стали под 0 dBFS, и измерим значение RMS. Теперь давайте рассортируем все значения согласно году релиза каждой песни. Первая диаграмма (вверху) показывает результаты эксперимента, и они реально возбуждают! Красная линия показывает усреднённые значения RMS для каждого года, а прямоугольники показывают распределение: чем темнее, тем больше песен имеет такой же уровень. Здесь, несомненно, наблюдается постоянный рост среднего уровня между 1982 и 2005 годами, и сегодняшние записи примерно на 5 dB громче, чем было в 70-х.

По общему признанию, RMS даёт только информацию об «электрическом» или «физическом» уровне аудиофайла, но никак не говорит о той громкости, что мы реально воспринимаем. Для этого, согласно нормативным рекомендациям EBU 3341, мы оцениваем «интегрированную громкость». Как видно на второй диаграмме, это значение весьма сильно коррелируется с RMS, и два графика очень похожи друг на друга. Таким образом, второй набор результатов подтверждает первый.

Давайте воспользуемся другими критериями и повторим эксперимент. К примеру, для описания динамического поведения музыки часто используется такой критерий, как крест-фактор. Говоря простыми словами, он показывает разницу между пиковым и RMS-уровнями на протяжении песни. Он является хорошим маркером, позволяющим оценить количество компрессии, применённой к музыке: обычно, чем больше компрессии, тем ниже крест-фактор. Некоторые профессионалы считают аккуратное обращение с крест-фактором залогом успешного мастеринга. В общих словах, опять же, чем ниже крест-фактор, тем громче музыка.

Третья диаграмма показывает эволюцию крест-фактора. Основываясь на тех же самых 4500 песен, этот усреднённый график, начиная с 80-х годов, показывает падение на 3 dB. Это укрепляет нас во мнении, что увеличение громкости, явно начавшееся с 90-х, было порождено компрессией. Нетрудно заметить, что эволюцию крест-фактора можно разделить на три этапа. Первый, с 1969 по 1980-й, показывает увеличение крест-фактора, обусловленное, вероятно, совершенствованием студийного оборудования, улучшением отношения сигнал/шум и, как следствие, расширением его динамического диапазона. С 1980 по 1990-й крест-фактор остаётся довольно устойчивым. Затем, с 1990 по 2010-й – в эпоху войны за громкость – крест-фактор драматически уменьшается.

Наконец, ещё один полезный и информативный критерий – это пропорция сэмплов, после нормализации близко подобравшихся к потолку 0 dBFS. Большая плотность очень громких сэмплов предполагает, что в мастер-копии был клиппинг или использовался цифровой brickwall-ограничитель. Четвёртая диаграмма отслеживает плотность пиковых сэмплов в той же самой коллекции из 4500 треков. Первые две диаграммы показывают, что музыка становится громче; третья указывает, что это происходит, вероятно, в результате компрессии динамического диапазона; а эта иллюстрирует, что компрессия, скорее всего, сопровождалась цифровым brickwall-ограничением.

Что такое динамический диапазон музыки?

Вы удивитесь, но на этот вопрос довольно трудно ответить. Интуитивно, мы чувствуем, что динамический диапазон это некий критерий, показывающий, насколько варьируется уровень в музыкальной композиции. Давайте попробуем материализовать эти догадки. Первая диаграмма сравнивает значения RMS в двух песнях: «Fuk» от Plastikman и «Smells Like Teen Spirit» от Nirvana. Очевидно, что уровень в Smells Like Teen Spirit более подвижен, чем в Fuk. И это не удивляет, поскольку Plastikman приверженец минимал-техно, тогда как для Nirvana характерны мягкие куплеты и громкие припевы.

Однако, результат меняется просто радикально, если для анализа использовать окно не 2 секунды, а 100 миллисекунд. При большем окне музыка Plastikman демонстрирует более стабильный RMS-уровень, но, как Вы видите на второй диаграмме, при меньшем времени интеграции в ней появляются более интенсивные вариации. Это обусловлено громкими и сухими барабанами. Поэтому, если мы хотим объективно измерить «подвижность уровня», то должны тщательно подумать над тем, какой масштаб использовать.

Также есть вопрос по поводу того, как фактически вычислить эту подвижность уровня. Иными словами, как получить цифровое значение, которое было бы мерой «динамического диапазона». Очевидно, мы могли бы измерить полную вертикальную амплитуду кривой RMS в заданном временном масштабе, суммируя амплитуду каждого вертикального движения. На первый взгляд, это даёт идеальную картину: снова посмотрите на первую диаграмму, на которой синяя кривая выглядит более подвижной, чем красная, и имеет большую общую вертикальную амплитуду.

Однако, на практике, этот метод ненадёжен. К примеру, изолированный пик посреди плоской RMS-кривой исказит измерение, давая ложное представление подвижности уровня. Существует более надёжный метод, используемый EBU для оценки диапазона громкости. Он заключается в вычислении распределения значений RMS. Такое распределение показано в третьей диаграмме. Затем мы измерили «разброс» распределения, используя трюк, подобный методу вероятностной выборки из арсенала описательной статистики, оставив только 5% высших значений и 10% низших. Результаты анализа в двухсекундном окне показывают более широкий разброс RMS у Smells Like Teen Spirit.

Давайте теперь изменим масштаб и измерим разброс RMS в окне 0,1 секунды. Итоги эксперимента показаны в четвёртой диаграмме и снова результаты прямо противоположны: разброс в Fuk намного больше, чем в Smells Like Teen Spirit. Теперь, проведём этот же эксперимент с другими размерами окна. Результаты представлены в последней диаграмме. Интересно, что вариации уровня в Smells Like Teen Spirit всегда больше, за исключением окон менее 0,18 секунды. Это как раз тот временной промежуток, где барабаны Fuk оказывают решающее влияние.

То, что изображено на пятой диаграмме, является хорошей кандидатурой на роль измерителя «динамического диапазона» музыки. Теперь предположим, что вместо того, чтобы пользоваться значениями RMS, мы будем иметь дело с некой единицей измерения воспринимаемой громкости, типа той, что упомянута в рекомендации ITU BS 1770. Это и есть тот самый «диапазон громкости». Основы того, как EBU определяет «диапазон громкости» находятся в документе EBU Tech 3342 и объясняются нами в главе «Измерение диапазона громкости по методике EBU».

Теперь остаётся только вопрос, нужно ли вообще использовать такой термин, как «динамический диапазон». Нет никакого официального определения для него, и это понятие можно спутать с динамическим диапазоном носителя записи, который показывает разницу между самым маленьким и самым большим уровнями, с которыми он может работать. Поэтому, в этой статье я не буду говорить о «динамическом диапазоне» музыки. Вместо этого, я буду использовать такие термины, как «RMS-вариабельность» или, в более широком смысле, «динамическая вариабельность». А термин «динамический диапазон» мы оставим для определения отношения сигнал/шум носителя записи. Я буду использовать термин «диапазон громкости» в строгом соответствии с документом EBU 3342 и термин «вариабельность громкости» во всех других случаях, вовлекающих понятие громкости вместо RMS.


Пэт Браун раскрывает важнейшие понятия в оптимизации работы аудио-системы.

Достаточное отношение сигнал/шум является одной из характеристик профессионально разработанной системы звукоусиления. Термины «динамический диапазон» и «сигнал-шум» часто используются как синонимы, но при ближайшем рассмотрении оказывается, что они совсем не то же самое.

Динамический диапазон звуковой системы это разница в уровне между высшим пиком сигнала, который может быть воспроизведен системой (или устройством в системе) и амплитудой высшей спектральной составляющей шума.

Каждый электронный прибор имеет свой динамический диапазон, который определяется, прежде всего, ограничениями электропитания и уровнем остаточного шума прибора. Сильная узкополосная компонента порога шума устройства ограничивает динамический диапазон системы.

Соотношение сигнал/шум это разница между средним уровнем сигнала и средним уровнем шума. Устройство, которое работает на некоем среднем выходном уровне программного материала, должно иметь пики, которые превышают этот уровень на 10-20 дБ.

Именно поэтому мы держим средний уровень около «0» на RMS-индикации на мастере, а весь остальной размах напряжения резервируется для пиков в программном материале. Средний уровень (average level) имеет важное значение — это то, по чему мы, как слушатели, судим о программной громкости.

Если использовать вольтметр для измерения RMS-значений остаточного шума устройства, отношение сигнал/шум будет равно разнице в уровне между этим значением (обычно выраженным в dBV или dBu) и номинальным «нулевым» выходным уровнем (также выраженным в dBV или dBu). При этом предпочтительно, чтобы устройство работало на уровне «около ноля», подобно тому, как большинство микшерных консолей для оптимизации их структуры усиления.

Динамический диапазон системы (или компонента системы) не зависит от присутствия сигнала. Это просто разница между максимально возможным неискаженным выходным уровнем и самым высоким уровнем собственного шума (обычно А-взвешенного) какого-либо компонента в системе. Соотношение «сигнал/шум» требует наличия сигнала, поэтому оно должно измеряться при фактическом использовании системы или компонента системы.

Система с широким динамическим диапазоном может иметь плохое соотношение «сигнал/шум» из-за неудачного способа её эксплуатации. «Динамический диапазон» можно использовать для описания производительности, которой можно добиться от системы или устройства, в то время как «сигнал/шум» может использоваться для описания того, что фактически достигнуто на практике.

На практике

Для измерения уровня звукового давления (SPL) при живом выступлении SPL-метр должен использовать А-взвешивание, а измерительный микрофон должен находиться в типичной позиции слушателя, на высоте около метра.

А-взвешивание обычно используют, поскольку эта шкала, как и люди, наиболее чувствительна к части спектра от 1 кГц до 4 кГц. Поскольку большинство измерителей звукового давления имеют возможность усреднения измерений, то это дает средний уровень звукового давления при исполнении.

На графике справа — кривые А-, В-, и С-взвешиваний.

Конечно, пики в программном материале повышают это среднее значение, хотя измеритель не может реагировать достаточно быстро, чтобы прочитать их. Этот «лаг измерения» составляет обычно порядка 10 дБ, но может быть выше (или ниже) в зависимости от программного материала.

Теперь, если все источники звука на сцене замолчат (но микрофоны останутся открытыми), то можно будет измерить уровень собственных шумов системы, тем же SPL-метром, и тем же способом. В правильно спроектированной звуковой системе этот шум будет создаваться окружающей средой из открытых микрофонов (но не остаточными шумами электронных компонентов).

В аудитории с собственным уровнем шума 40 дБА, отношение сигнал/шум с типичным «лекторским» микрофоном будет только порядка 37 дБ со «средним» спикером (77 dBA), стоящим на расстоянии 1 фут от микрофона. Десять открытых микрофонов могут повысить минимальный уровень шума еще на 10 дБ, если их чувствительность и настройки такие же, как у первого микрофона, исходя их 10 log (количество открытых микрофонов) = 10 дБ.

К сожалению, для повышения отношение сигнал/шум системы в данном случае нет никакого выбора, увеличение уровня полезного сигнала также приведет к увеличению шума. Это очевидное последствие применения дальних микрофонов и невозможности отключения ненужных микрофонов.

Теперь, если сильный вокалист способен произвести 120 dBA в ручной микрофон в этой же системе (что не редкость для вокалистов, поющих в ручные, ближние микрофоны), то сигнал/шум будет порядка 80 dB (120 dB — 40 dB = 80 dB). Вот почему мы настаиваем, что правильная микрофонная техника имеет важное значение для хорошей производительности, поскольку, в конечном счете, влияет на соотношение сигнал/шум системы.

Мы используем минимальное значение в 25 dB для отношения сигнал/шум в звуковой системе в аудитории с большим количеством открытых микрофонов.

Скажем, в той же системе самый громкий звук, который система может произвести линейным способом, будет 110 dBA в том же положении слушателя.

Даже если система эксплуатируется на среднем уровне в 90 dBA, пики такого масштаба, безусловно, возможны. Наивысший программный пик будет определяться используемым громкоговорителем и усилителем мощности, подключенным к нему. Мы сейчас имеем один ингредиент, который требуется, чтобы найти динамический диапазон системы.

Если самым громким компонентом шума является гул от кондиционера, который находится на уровне 35 dBA, то динамический диапазон системы некуда увеличивать (110 dBA — 35 dBA = 75 dBA). Динамический диапазон может быть увеличен только путем отключения кондиционера, чтобы удалить гул.

Как вы можете видеть из этих примеров, среда определяет и динамический диапазон, и отношение сигнал/шум звуковой системы. Поскольку большинство электронных компонентов в системе имеют динамический диапазон порядка 100 dB или больше, звуковая система сама по себе никогда не должна быть слабым звеном, когда дело доходит до конечного результата для слушателя. Профессиональная система должна иметь динамический диапазон не менее 96 dB со всеми работающими электронными устройствами.

Только для студии или домашнего кинотеатра порог шума электронных устройств должен быть фактором, определяющим динамический диапазон или отношение сигнал/шум в положении слушателя. Поэтому можно спроектировать акустическую систему с очень широким динамическим диапазоном, но в целом соотношение сигнал/шум может быть довольно низким из-за особенностей самого помещения.

Можно даже спроектировать систему с более чем 100 dB динамического диапазона в каждом компоненте, и обнаружить, что сигнал/шум резко уменьшается во время фактического использования из-за неверно установленной (диаграммы уровней) при настройке системы. Наиболее распространенной причиной этого является применение усилителей, открытых «на-полную», что приходится компенсировать, держа средний уровень на мастере микшерной консоли на уровне -20 dBV.

При проектировании системы мы выбираем отдельные компоненты, которые имеют широкий динамический диапазон, и затем калибруем систему, чтобы достичь максимального соотношения сигнал/шум.

Пэт и Бренда Браун

Пэт и Бренда возглавляют компанию SynAudCon, которая проводит аудио-семинары и онлайн-семинары по всему миру. Для получения дополнительной информации зайдите на сайт www.prosoundtraining.com .

____________________________________________________

ВОЛОГДИН Э.И.

ДИНАМИЧЕСКИЙ ДИАПАЗОН

ЦИФРОВЫХ АУДИО ТРАКТОВ

Конспект лекций

Санкт Петербург

Динамический диапазон звуков и музыки......................................................................

Динамический диапазон фонограмм.................................................................................

Динамический диапазон цифрового аудио тракта.........................................................

Расширение динамического диапазона c использованием технологии Dithering .....

Расширение динамического диапазона с использованием технологии Noise Shaping

.......................................................................................................................................................

Список литературы...............................................................................................................

1. Динамический диапазон звуков и музыки

Человек слышит звук в чрезвычайно широком диапазоне звуковых давлений. Этот диапазон простирается от абсолютного порога слышимости до болевого порога 140 дБ SPL относительно нулевого уровня, за который принято давление 0,00002 Па (рис.1 .). Зона риска на этом рисунке обозначает область звуковых давлений, которые при

Абсолютный порог слышимости

Частота тональных звуков, кГц

Рис. 1. Области слышимости слуха

длительном воздействии могут привести к полной потери слуха. Болевой порог для тональных звуков зависит от частоты, для звуков с произвольным спектром за болевой порог принят уровень давления 120 дБ SPL. График абсолютного порога слышимости достаточно точно описывается эмпирическим равенством

В тишине чувствительность слуха человека повышается, а в атмосфере громких звуков – понижается, слух адаптируется к окружающей звуковой среде, поэтому динамический диапазон слуха не такой большой – около 70..80 дБ. Сверху он ограничен давлением 100 дБ SPL, а снизу шумом с уровнем -30…35 дБ SPL. Этот динамический диапазон может сдвигаться вверх и вниз до 20 дБ. Для комфортного восприятия музыки рекомендуется, чтобы звуковое давление не превышало 104 дБ SPL в домашних условиях и 112 дБ SPL, в специально оборудованных помещениях.

Динамический диапазон музыки определяется отношением в децибелах самого громкого звука (фортиссимо) и самого тихого звука (пианиссимо ).Динамический диапазон симфонической музыки составляет 65…75 дБ, а на концертах рок-музыки он возрастает

до 105 дБ, при этом пики звуковых давлений могут достигать 122…130 дБ SPL.

Динамический диапазон вокальных исполнителей - не превышает 35…45 дБ (табл.1 ).

Динамический диапазон музыки существенно зависит от выбора максимального

звукового давления P max , так как он ограничивается снизу абсолютным порогом

слышимости. Эта зависимость наиболее сильно выражена на краях звукового диапазона.

На рис. 2

приведены примеры изменения динамического диапазона тональных звуков. В

120dB Болевой порог

P max

80dB

DR 40 dB

50dB

80dB

50dB

Абсолютный порог

слышимости

Частота тональных звуков, кГц

Рис. 2. Динамический диапазон музыки и пороги слышимости слуха

зависимости от выбора P max

и частоты тональных звуков

динамический

диапазон

80 дБ уменьшается на краях

звукового диапазона до 40

Именно поэтому

принято измерять динамический диапазон звуков на частоте 1 кГц, на которой он может

достигать 117 дБ.

помещения маскирует звук и этим уменьшает его динамический диапазон

музыки снизу . Нарис.3 . показано как при уменьшении звукового давления от 120 до 80 дб

SPL динамический диапазон музыки из-за шума помещения уменьшается с 90 до 50 дБ.

120 dB SPL

DR 90 dB

Влиянием

полностью

пренебречь

только при

90dB

90dB

минимального уровня музыкальных звуков.

70dB

В студиях звукозаписи уровень шума не

90dB

превышает

квартирах

50dB

разговор

увеличивает уровень

шума до 60дБ SPL.

Именно поэтому тихая музыка часто тонет

Шум в квартире

помещения

прослушивания

невольно

возникает

увеличить

громкость.

Шум квантования, являющийся белым

шумом, заметен на слух при его

Шум в студии

интенсивности всего 4 дБ SPL, даже когда

общий шум аудио аппаратуры в помещении

достигает

Рис. 3. Динамический диапазон музыки в

необходимо сопоставить с тем, что полной

шкале FS цифрового измерителя уровня

соответствуют уровень между 105 и 112 дБ SPL. Поэтому для

бытовых помещений

динамический диапазон музыки не должен превышать 101 - 108 дБ.

Динамический диапазон микрофонов определяется так же, как это обычно делается в электрических трактах. Верхняя граница ограничивается допустимой величиной нелинейных искажений, а нижняя - уровнем собственных шумов. Современные студийные микрофоны допускают максимальное звуковое давление 125…145 дБ SPL, при этом нелинейные искажения не превышают 0,5% … 3%. Уровень собственных шумов микрофонов составляет 15…20 дБА, динамический диапазон – от 90 до 112 дБА, а отношение сигнал/шумот 70 до 80 дБА. Эти микрофоны с запасом перекрывают весь диапазон слуха человека от 120 дБ SPL до уровня шума студии 20 дБ SPL. В современных студиях запись производится с использованием 22 или 24 разрядных АЦП, иногда используется квантование с плавающей запятой, поэтому проблем с динамическим диапазоном не возникает. Стоит такая аппаратура крайне дорого.

2. Динамический диапазон фонограмм

Музыкальный и речевой сигналы представляют собой последовательность быстро нарастающих и более медленно затухающих звуковых импульсов (рис.4 .). Такой сигнал характеризуетсясреднеквадратическим и пиковым значениями уровней , разность этих уровней называется пик-фактором . Прямоугольная волна (меандр) имеет единичный пик-фактор 0 дБ, пик-фактор синусоиды равен 3 дБ. Фонограммы музыкальных и речевых сигналов имеют пик-фактор до 20 дБ и более.Время определения пик-фактора связано временем интегрирования при вычислении среднеквадратического значения сигнала, и обычно, оно равно 50 мс.

Динамический диапазон и пик-фактор музыкальной фонограммы определяют путем статистической обработкимгновенных значений сигналов. Наиболее подробно статистические характеристики рассчитываются в звуковом редакторе Audition 3 (рис.4 ).

Рис.4. Фрагменты фонограмм музыкальных отрывков различной длительности

Из них основными являются следующие: Peak Amplitude (L pic ), Maximum RMS Power (L max ), Minimum RMS Power (L min )и Average RMS Power (L avr ) (уровни максимального,

минимального и среднего среднеквадратического (эффективного) значения мощности сигнала).

Динамический диапазон фонограммы по данным этой таблицы определяется как

DR mL picL min ,

пик-фактор рассчитывается по формуле

PF mL picL avr

Динамический диапазон может быть также определен по гистограмме распределения уровней фонограммы, приведенной на рис.5. Такие операции удобно быстро делать до и после динамической обработки фонограммы.

Рис.4. Статистические характеристики фонограмммы музыки Бетховена «Элизе»

Рис.5. Гистограмма распределения музыки Бетховена «Элизе»

зависимости от задачи исследования. Если, например, важным является динамический диапазон мгновенных значений уровней фонограммы, то время интеграции должно быть 1-5 мс. Если измеряется динамический диапазон музыки с учетом слухового восприятия, то время интеграции выбирается равным 60 мс, это постоянная времени слуха.

позволяет определять динамический диапазон и пик-фактор с заданной вероятностью при выбранном времени интеграции. В звуковом редакторе Adobe Audition 3 используется нормализация гистограммы, при которой максимальной вероятности событий всегда соответствует значение 100. Такая гистограмма описывает распределение вероятностей уровней сигналов фонограммы относительно максимального значения. При ее построении автоматически подбирается масштаб по оси Х, поэтому затруднительно сравнивать гистограммы различных фонограмм.

Практическое применение. Кому и зачем нужна статистическая информация и гистограмма фонограммы. Эти данные прежде всего оказывают неоценимую помощь при динамической обработке фонограммы, так как они позволяются обоснованно выбрать характеристики компрессора и экспандера. Статистические результаты обработки фонограмм с музыкой различных жанров позволяют определить необходимый динамический диапазон электроакустического тракта, сформировать требования по пиковой и средней мощности головок акустических система. Они играют существенную роль при разработке алгоритмов компрессии звуковых сигналов.

Эмоциональную музыку с широким динамическим диапазоном и большим пик-

фактором можно слушать только на высококачественной дорогой аппаратуре с хорошими

акустическими

агрегатами.

наушниками и в автомобилях из-за шумов динамический

15 диапазон сокращается и она

просто отвратительно.

Поэтому широким спросом такие записи не пользуются и,

неизбежно, с каждым годом динамический диапазон и пик-

Рис.7. Фонограмма песни “I`ll Be There For You”

Рис. 6. Пик-фактор CD дисков

фонограмм преднамеренно изготовителями уменьшается (рис.6 .). На современных CD

дисках в большинстве случаев динамический диапазон не превышает 20 дБ, а пик-фактор-

чуть больше 3 дБ, что вполне достаточно для танцевальной музыки. На рис.7. приведена

картинка современной фонограммы с компакт диска.

3. Динамический диапазон цифрового аудио тракта

Обычный цифровой тракт

включает в себя АЦП и ЦАП.

Первый осуществляет

квантование аналоговых сигналов, и преобразование их в цифровой поток. Второй

производит обратное преобразование цифрового потока в аналоговый сигнал.

Квантование

округление

последовательности выборок

до целого двоичного

значения. При импульсно-кодовой модуляции (ИКМ) такая

операция

осуществляется

линейного

квантователя, называемого в технической литературе Mid-

Tread . У

него передаточная

имеет форму

«лестницы» с одинаковыми ступеньками

обязательно,

нечетное число уровней квантования. Округление

цифровых данных в этом квантователе производиться

ближайшего

двоичного значения (рис.8 ).

Этот алгоритм

принято называть rounding.

алгоритме

выходной

квантователя

симметричен относительно оси времени, и квантование

Рис. 8. Передаточные

осуществляется с порогом, равным

0,5 шага квантования

функции квантователей

Пока входной сигнал меньше этого порога выходной

Mid-Tread и Mid-Riser

сигнал квантователя равен нулю, это значит, что

квантование осуществляется с центральной отсечкой.

входном сигнале несколько выше порога квантования выходной сигнал имеет вид

последовательности импульсов со скважностью, зависящей

от уровня

дальнейшем увеличении уровня ЗС формируется выходной сигнал ступенчатой формы.

Округление цифровых данных в квантователе Mid-Riser производится до ближайшей меньшей величины (рис.8 ), поэтому данный алгоритм принято называть- truncating . Квантователь Mid-Riser отличается тем, что у него отсутствует порог квантования, поэтому он передает звуковые сигналы очень маленьких уровней, даже ниже уровня

шума. Однако, при отсутствии ЗС любой ничтожный шум порождает на выходе последовательность случайных импульсов с амплитудой 1 квант, это значит, что такой квантователь усиливает шумы.

Динамический диапазон АЦП с квантователем Mid-Tread определяется через логарифм отношения максимального и минимального значений сигнала синусоидальной формы на входе квантователя

DR А 20 logA max ,

A min

Q 2 (q 1), A

Q – шаг квантования,q - число разрядов. Поэтому

DRА

Q 2 (q 1)

) 6.02q (1)

Q / 2

При q = 8 этот динамический диапазон равен 48 дБ, а приq = 16 он увеличивается до 96 дБ. ЗначениеDR A определяет нижнюю границу динамического диапазона по уровню входных сигналов квантователя типа Mid-Tread.

Динамический диапазон ЦАПа измеряется в соответствии с рекомендациями стандартаEIAJ через отношение максимального среднеквадратического значения сигнала

синусоидальной формы A max на его выходе к среднеквадратическому значению шума квантования, измеренному в полосе от 0 до частоты НайквистаF N

A max

Q 2 (q 1)

A max

q 1, 76;q

При q = 16

DR R = 98 дБ, что

децибела

динамического диапазона

квантователя, определяемого формулой (1). Измеренный таким образом динамический диапазон ЦАПа отождествляется со значением его SNR .

Если верхний диапазон частот ограничивается значением F max F N , то расчетная формула дляSNR иDR R принимает вид

SNR R DR R 6.02q 1,76 10 log

2 F max

где f s - частота дискретизации,F max - максимальная частота звукового диапазона. При

f s = 44,1 кГц иF max = 20 кГц иSNR R =DR R = 98,5 дБ. Как видно, отношение сигнал/шум лишь на 2 децибела больше динамического диапазона. Надо обратить внимание на то, что величинаSNR зависит от частотf s иF max , тогда какDR от этих параметров не зависит.

Тем не менее, в большинстве технических публикаций динамический диапазон отождествляется с отношением сигнал/шум. Это подтверждается и стандартами AES 17 и

IEC 61606.

В стандарте IEC 61606 рекомендуется измерятьSNR иDR при подаче на вход АЦП синусоидального сигнала с частотой 997 Гц и уровнем минус 60 дБ FS c обязательным использованием технологииTPDF Dithering . При этом расчетное соотношение дляSNR из-за вносимого дополнительного шума предлагается в виде

SNR T DR T 6.02q 3,01 10 log

2 F max

При прежних условиях DR =SNR = 93,7 дБ, а не 96 дБ, как это часто встречается в технической литературе. Следовательно, уменьшается и расчетный динамический диапазон. ВместоSNR часто используется его обратная величина, определяющая интегральный уровень шума квантования

L nTSNR T.

В соответствии со стандартом IEC 61606 измерение динамического диапазонаDR R производится в соответствии со схемой, приведенной нарис.9. В этой схеме тестовый

Рис..9. Схема измерения динамического диапазона ЦАП

цифровой сигнал с частотой 1 кГц, и уровнем минус 60 дБ, сформированный с использованием технологии TPDF Dithering , подается на вход ЦАПа. Аналоговый сигнал с ЦАПа поступает на вход ФНЧ с частотой среза 20 кГц, ограничивающий спектр шума квантования. Далее производится фильтрация с помощью взвешивающего фильтра типаА , учитывающего особенности слухового восприятия шума квантования, что увеличивает динамический диапазон на 2-3 дБ. Тестовый сигнал и шум усиливаются на 60 дБ и подаются на измеритель уровняTHD+N . В этом измерителе тональный сигнал подавляется режекторным фильтром и вольтметром эффективных значений измеряется уровень шума в децибелах. Это измеренное значение уровня шума отождествляется, с обратным знаком, с динамическим диапазоном ЦАПа.

При квантовании сигналов минимального уровня возникают громадные искажения, достигающие 100% (рис.10 ). В связи с этим на практике приходиться руководствоватьсяреальным динамическим диапазоном АЦП. При определении этого диапазона необходимо учитывать: пик-фактор музыкальных сигналов, достигающий 12…20 дБ, необходимость поднимать уровень нижней границы динамического диапазона над уровнем шума квантования хотя бы на 20 дБ и иметь дополнительный запас в верхней части динамического диапазона около 10…12 дБ для предотвращения случайной перегрузки.

В результате реальный динамический диапазон

записи 16-ти разрядного АЦП ИКМ

не превышает 48…54 дБ. Этого

даже близко не хватает для хорошей

студийной

звукозаписи.

автоматической регулировке уровней, что

имеет место при записи компакт-дисков,

диапазон может быть расширен до 74

16 бит,1000 Гц, 93 дБ

заметным

ухудшением

качества звука сигналов низкого уровня.

Рис.10. Последовательность выборок искаженной

Запас динамического диапазона сверху

формы синусоидального сигнала

предохраняет от возможности перегрузки,

превышают

ожидаемое значение. При записи танцевальной музыки вполне достаточно запаса в 6 дБ.

При записи симфонической музыки иногда приходиться иметь запас до 20…30 дБ. Запас динамического диапазона снизу предотвращает возможность тихих пассажей оказаться ниже уровня шума и, тем более, ниже порога слышимости.

В цифровых трактах верхняя граница динамического диапазонаограничивается уровнем сигнала 0 дБ FS . Без использования технологии Dithering нижняя граница динамического диапазонаограничивается уровнем

LA 1 / DRA .

При q = 8 бит он равен минус 48 дБ, а приq = 16 бит – минус 96 дБ. Неизбежный шум тракта повышает этот уровень.

Интегральный уровень шума минус 93,7 дБ – это много или мало. Важно насколько этот уровень превышает порог слышимости. С использованием технологии Dithering шум

Рис.11. Пороги слышимости шума квантования в зависимости от числа разрядов

квантования становится белым шумом, порог слышимости которого равен 4 дБ SPL . Это значит, что вблизи 3 кГц шум квантования при q = 16 бит будет превышать порог слышимости на 22,3 дБ (рис.11). Как видно из этого рисунка, для того чтобы шум квантования был не слышен требуется использовать 20-разрядное квантование.

4. Расширение динамического диапазона c использованием технологии Dithering

Для расширения динамического диапазона ИКМ тракта с квантователем типа MeadTread без увеличения числа разрядов и частоты дискретизации разработано множество

аналоговых сигналов к ЗС добавляется небольшой аналоговый шум. Более часто эта технология используется при реквантовании цифровых ЗС , когда производится

осуществляется с 24 разрядами, а затем производиться реквантование, обычно до 16 разрядов, как это принято в стандарте CD. При этом качество такого CD по шумам соответствует 20разрядной записи.

В процессе реквантования чаще применяют операцию truncating , при которой просто отбрасываются младшие разряды кодовых слов. В этом случае в выходном сигнале



Загрузка...