Статьи про нормализацию звука и громкость. Нормирование громкости и максимально допустимый уровень аудиосигнала. Говоря в дальнейшем о звуковых файлах мы будем иметь ввиду файлы с расширением.WAV, то есть wav-файлы. Поскольку это именно те файлы, которые

Совсем недавно я набрёл на замечательный ресурс независимого звукоинженера Des McKinney . Это просто кладезь полезных статей по современной звукозаписи и сведению! И вот одна из них (вольный перевод by ):

Процесс нормализации часто смущает новичков в цифровой звукозаписи. Откровенно говоря, “нормализация” имеет различные значения, что, естественно, сбивает с толку. Однако новички и специалисты могут быть сбиты с толку мифами и дезинформацией, которых достаточно на эту тему.
Я расскажу о 10 распространённых заблуждений и том, что же происходит на самом деле.

Пиковая Нормализация

Для начала, некоторые пояснения: Так как “нормализация”, может означать несколько вещей (см. ниже), мифы ниже прежде всего относятся к пиковой нормализации.

Пиковая нормализация - это автоматизированный процесс, который изменяет уровень каждого сэмпла в сигнале цифровой звукозаписи равным количеством, таким образом, что самый громкий сэмпл достигает указанного уровня. Обычно, процесс используется для того чтобы сигнал достигал максимума в 0dB - самого громкого уровня, допустимого в цифровом звуке.
Процесс нормализации похож на перемещение ручки громкости или фейдера: весь сигнал изменяется тем же самым «неподвижным» количеством, вверх или вниз. При нормализации, система находит самый громкий пик и по нему уже выстраивает общий уровень.

Некоторые из мифов ниже отражают не что иное, как недопонимание этого процесса, как бывает с распространенными заблуждениями, но тем не менее, некоторые из мифов происходят от более фундаментального недопонимания - в данном случае в звуке, микшировании и цифровой звукозаписи.

Мифы и дезинформация.

Миф #1: После нормализации нескольких треков, они звучат с одинаковой громкостью.

Нормализация нескольких треков к общему уровню гарантирована только при условии, что треки идентичны. Однако, наше восприятие громкости зависит от многих факторов, включая интенсивность звука, длительность и частоту. Пиковый уровень сигнала важен, но он не имеет прямого отношения к полной громкости трека.

Миф #2: Нормализация делает трек настолько громким, насколько это возможно.

Послушайте эти два mp3 файла, каждый нормализован к уровню -3dB:

Когда уровень трека настолько низок, что вы уже не можете использовать регуляторы гейна (Gain) и громкости, чтобы сделать трек достаточно громким. Это указывает на проблему с записью, в идеале вы можете переписать трек с необходимым уровнем… Но когда это не возможно, нормализация может спасти неудачный дубль.

Когда нужно установить пиковый уровень трека без изменения его воспринимаемой громкости. Например, работая с испытательным сигналом, белым шумом и другим немузыкальным контентом. Конечно же, вы можете установить пиковый уровень вручную – прослушивая трек и отмечая пики… но эту работу за вас может сделать функция нормализации.

Миф #9: Нормализация гарантирует, что трек не будет перегружен (clipping).

Одиночный трек, нормализованный к 0dB, не будет перегружаться. Однако, если трек будет обработан или фильтрован с повышением громкости (например, при эквализации) появятся искажения. И если трек - часть микса, который включает другие треки, нормализованные к 0dB, есть гарантия, что сумма всех треков превысит самый громкий пик любого из одиночных. Другими словами, нормализация защищает вас от перегрузки только в самом простом случае.

Миф #10: Нормализация требует дополнительную операцию дизеринга (dither).

Этот последний миф является слегка эзотерическим, но он изредка появляется в сетевых обсуждениях записи. Обычно, в форме заявления: “это хорошо нормализовать в 24 битах, но не в 16 битах, потому что …”, сопровождаемый объяснением, которое передает неправильное понимание цифровой звукозаписи.

Просто скажу: дизеринг применяется при изменении разрядности. (например, преобразование с 24 бит до 16 бит). Нормализация же, работает независимо от битовой глубины, изменяя только уровень каждого сэмпла. Поскольку, никакого изменения разрядности не происходит, дизеринг не требуется.

Другие Определения.

Нормализация может означать несколько других вещей. В контексте мастеринга альбома инженеры часто нормализуют треки альбома одному уровню. Это относится к воспринимаемой громкости и не имеет отношения к пиковому уровню каждого трека.

Некоторые системы (например SoundForge) предлагают «Нормализацию по RMS», действие которой основано на вычислении среднеквадратического уровня громкости. Это приблизительно соответствует воспринимаемой громкости и также не зависит от пикового уровня. Однако, как и с пиковой нормализацией, его применение также требует осмысленного подхода.

Нормализация аудиосигналов по пикам приводила к значительным различиям в громкости между каналами вещания;

Показания стандартизованного в европейских странах документом EBU Tech Doc 3205-E и обычно использующегося измерителя квазипиковых значений уровня QPPM не отражает громкость сигнала, т.к. это прибор изначально не предназначался для регистрации среднего значения сигнала;

При быстром росте цифрового производства фонограмм и цифровой дистрибуции аудиоконтента нормирование разрешённого максимального уровня аудиосигнала, определённое документом ITU-R BS. 645, не соответствует современным требованиям и изжило себя;

Документом ITU-R BS. 1770 определён международный стандарт измерения громкости аудиопрограмм, вводящий новый параметр аудиосигнала – единицу громкости.

В соответствии с вышеизложенным, Европейский вещательный союз рекомендует при измерениях аудиосигнала пользоваться новой единицей уровня LU (Loudness Unit) и LUFS (единицей громкости относительно полной шкалы). (Наименование “LUFS”, соответствует международной конвенции по терминологии и эквивалентно наименованию LKFS, которое используется ITU-R BS.1770-2).
Рекомендуется для полной характеристики передачи производить измерения по трём основным параметрам:

- Громкости программы (Program Loudness);
- Диапазону громкости (Loudness Range);
- Максимальному мгновенному уровню (Maximum True Peak Level).

Основные правила измерений этих параметров сводятся к следующим пунктам:

За номинальное значение громкости программы документом EBU R 128 рекомендуется принимать уровень равный -23 LUFS, а в случаях, когда точное поддержание номинального уровня недостижимо (например, при живой трансляции), допустимое отклонение от номинального уровня не должно превышать ± 1,0 LU.

Аудиосигнал передачи должен быть, как правило, измерен как единое целое без выделения отдельных специфических фрагментов, таких, как речь, музыка или звуковые эффекты.

Максимально допустимый мгновенный уровень передачи должен быть равен -1 dBTP (децибелы истинного пика).

Все измерения должны производиться измерителями, специфицированными соответствующими документами: ITU-R BS.1770, EBU Tech Doc 3341 и EBU Tech Doc 3342.

*EBU - European Broadcasting Union (Европейский вещательный союз)

Для справки, членами EBU (EBC) в России являются только "Первый канал", "ВГТРК", "Радио Маяк", "Орфей", "Голос России". Какими стандартами пользуются остальные вещательные компании остается только гадать.

Во вложении архив с документами EBU на русском языке, а именно:

EBU Tech 3341 ;
EBU Tech 3342 ;
EBU Tech 3343 ;
EBU Tech 3344 ;
Эссе_625в2 - эссе Анатолия Соколина: "Революция, которая потрясла мир аудио";
R68_2000_EBU - техническая рекомендация EBU R68-2000. Установочный уровень в оборудовании производства цифрового аудио и цифровых аудиорекордерах;
EBU R1771 - требования к приборам, измеряющим громкость и истинный пиковый уровень;
EBU R1770-1 - рекомендация МСЭ-R BS.1770-1. Алгоритмы измерения громкости звуковых программ и истинного пикового уровня звукового сигнала;

Здесь всегда можно получить актуальные оригиналы документов.

Так и со звуковыми файлами, только они не слышат, а хранят. Одни файлы хранят звук с уровнем громкости соответствующим норме . Другие же хранят звук с уровнем громкости, отклоняющимся от нормы . Однако уровень громкости исходного звукового сигнала от этого не меняется. Всё определяется только уровнем записи звукового сигнала. А уровень записи в целях не допущения искажений устанавливают таким образом, чтобы звуковой сигнал, подаваемый на вход аналого-цифрового преобразователя (АЦП) был немного ниже своего максимально возможного уровня при максимальных значениях (пиках) громкости. Иначе искажений не избежать и звук приобретает неестественный искажённый характер.. К тому же уровень записи может быть ниже ещё и по самым разным техническим причинам .

Для человека норма чувствительности слуха определяется диапазоном или двумя позициями соответствующими нижнему и верхнему уровню звука - это так называемый динамический диапазон или область слышимости. Одна позиция соответствует самому слабому уровню громкости звука (порогу чувствительности) ещё различимому человеком. Другая позиция соответствует самому сильному уровню громкости звука (болевому порогу) ещё воспринимаемому человеком.

Для звуковых файлов также существует норма, но это норма уровня записи громкости . Определяется она диапазоном или двумя позициями соответствующими нижнему и верхнему уровню записи громкости звука и это также так называемый динамический диапазон . Поскольку компьютер понимает и обрабатывает звук в цифровом виде то и хранит он его в файлах также в цифровом виде. И поэтому диапазон определяют два числа соответствующие верхней и нижней границе динамического диапазона . В зависимости от качества хранимого звука диапазон будет иметь разную ширину.

Говоря в дальнейшем о звуковых файлах мы будем иметь ввиду файлы с расширением .WAV , то есть wav-файлы . Поскольку это именно те файлы, которые используют для записи аудио компакт-дисков .

На аудио компакт-дисках звуковые файлы хранятся с расширением .RAW . При записи на жёсткий диск они при помощи специальной программы риппера или грабера преобразуются в wav-файлы . При записи на аудио компакт-диск звуковые файлы с расширением .WAV преобразуются в файлы с расширением .RAW .

Довольно часто уровень записи громкости звука на аудио компакт-дисках для разных музыкальных композиций оказывается неравным или ниже нормы , что создает неприятное ощущение при переходе от одной музыкальной композиции к другой. Также часто, оказывается неравными и значения по уровню записи громкости звука у двух стереоканалов одной музыкальной композиции. Для устранения этих недостатков необходимо выполнить нормализацию . Которую и придумали для этого.

Если не выполнить нормализацию , то низкий уровень громкости записи звука музыкальной композиции при воспроизведении аудио компакт-диска потребует компенсации в виде большего усиления со стороны звуковоспроизводящей аппаратуры. Что довольно неудобно и ведёт к возникновению совсем не обязательных искажений со стороны звуковоспроизводящей аппаратуры. Которые можно было бы избежать, воспользовавшись неискажающей обработкой звука в виде нормализации.

В качестве возможного инструмента для выполнения нормализации wav-файлов хотелось бы порекомендовать Вам условно-бесплатную (shareware) программу . Эта программа позволяет обрабатывать wav-файлы с обычным 8 и 16-битным цифровым форматом и одним или двумя стереоканалами. Открывая и обрабатывая звуковые wav-файлы программа Sound Normalizer 2.2 создаёт копию оригинального звукового файла, с которым она и работает. Позволяя тем самым в критических ситуациях избежать необратимого изменения оригинального файла. Также одним из достоинств программы является возможность независимой регулировки уровня нормализации звука по каждому каналу. В отличие от других подобных программ Sound Normalizer 2.2 обладает простым и понятным интерфейсом .

Нормализация осуществляется по пиковым или максимальным уровням звука. А это означает, что каждое значение уровня звука подвергнется пропорциональному изменению и тем самым сохранится естественное звучание всей музыкальной композиции.

Однако бывает и так что звук для двух стереоканалов после нормализации по максимальному уровню будет восприниматься как имеющий различные уровни громкости . Это объясняется тем, что восприятие громкости имеет ещё динамическую и частотную составляющие, которые могут настолько сильно отличатся в двух каналах, что вызывают сильный перекос среднего значения уровня громкости для каждого канала. В этом случае можно порекомендовать выполнить методом проб и ошибок ручную регулировку уровня нормализации для каждого канала.

Компьютерная программа позволяет выравнивать громкость музыкальных MP3-файлов. Первая версия данной утилиты существует ещё с 2002 года. Программа хороша тем, что совершенно не требует перекодирования файлов — это позволяет сохранить изначальное качество звучания. MP3Gain выравнивает уровень громкости как отдельно взятого файла, так и целой группы файлов (пакетное преобразование).
Не будем сильно погружаться во все тонкости настроек и возможностей программы — просто научимся как просто без лишних заморочек нормализовать уровень громкости в mp3-файлах.
Находим и .

Все достоинства программы
Программа полностью бесплатна.
Инсталлируется на любую версию ОС Windows.
Можно использовать и работать в режиме командной строки и графической оболочки для Windows.
Возможность пакетного анализа и обработки файлов.
Нормализация происходит без перекодировки файлов.
Можно преобразовывать один и тот же mp3-файл множество раз без риска его испортить.
Существует режим применения нормализации только к выделенным в рабочем окне трекам.
Программа полностью сохраняет ID3 теги и даты создания файлов.
Многоязычный интерфейс, в том числе присутствует русская локализация.
Локализованное справочное руководство на официальном сайте.

Установка MP3Gain
Забираем программу с SourceForge в виде инсталлятора. Установка предельно проста, единственный важный момент — необходимо включить чекбокс «Language Files», при этом будут установлены все языковые локализации программы, в том числе и русский. Если выбрать «Custom» установку, то можно самостоятельно выбрать директорию парковки программы.

Настройка MP3Gain
После установки программы запускаем её и первым делом выбираем русскую локализацию MP3Gain. Далее открываем подопытные mp3-файлы. В настройках программы ищем очень важный пункт «Изменение уровня без клиппинга» и на нём ставим галку. Для краткости, «клиппинг» — это превышение уровня сигнала, при этом происходит обрезание уровня и перекодирование mp3-файлов, но нам это не нужно. И ещё следует разобрать вопрос по настройке уровня громкости. По умолчанию «Норма» громкости установлена 89 децибел (лучше эту цифру не менять). По мнению специалистов 89,0 dB дают наиболее качественные результаты в плане нормализации и устранения клиппинга. Остальные пункты настроек предельно понятны и выставляются по личным предпочтениям или просто сделать всё как показано на картинке. Таких настроек вполне достаточно для простой нормализации уровня громкости в mp3-файлах.

Совет! На всякий случай надо сделать копии аудио файлов. В MP3Gain нет функции сохранения обработанных файлов под другим именем, программа переписывает исходные.

Использование MP3Gain
Чтобы понять, что делать с двумя рабочими кнопками «Анализ» и «Тип» надо вкратце разобраться с их доступными режимами.
Рассмотрим режимы «Трек», «Альбом» и «Константа».
Трек - программа рассчитывает уровень громкости, индивидуально для каждого трека. Затем корректирует громкость каждого трека в соответствии с требуемым уровнем. Например, имеется три песни с уровнем громкости 87, 95 и 91 dB. При применении «Тип Трек» для приведения их к требуемому уровню 89 dB, на выходе у всех этих песен будет уровень около 89 dB.
Альбом - общая громкость альбома будет отрегулирована в соответствии с требуемым уровнем, но разница в громкости между треками в альбоме будет сохранена. Например, имеется три песни с уровнем громкости 87, 91 и 89 dB, общая громкость этого альбома будет около 89 dB. При применении «Тип Альбом» для приведения их к требуемому уровню 92 dB, программа увеличит громкость каждой из этих песен на 3 dB.
Константа - этот режим похож на режим Альбом. При нём громкость всех треков просто увеличивается или уменьшается на заданное количество децибел без какой-либо нормализации относительно друг друга.

Итак, проведём эксперимент над открытыми ранее mp3-файлами на режиме «Трек». Первым делом запускаем анализ файлов кнопкой «Анализ Трек». Смотрим результат анализа исходных файлов. На картинке ниже видно, что в файлах «3.mp3» и «5.mp3» есть превышение уровня громкости, иначе говоря присутствует «клиппинг», в этих колонках появилась буква «Y» и все строки стали красными. Напротив, в файле «6.mp3» видно что он имеет пониженный уровень громкости.
И вот далее, по итогу проведённого анализа, вторым действием исправляем (нормализуем) эту разницу уровней нажатием на кнопку «Тип Трек». После благополучной нормализации, занявшей некоторое время (всё зависит от мощности компьютера), смотрим получившийся результат. На последней картинке видно, что уровень всех обработанных mp3-файлов очень близок к заданному значению в 89 dB. Т.е. треки «3.mp3» и «5.mp3» понизили свой уровень громкости, а трек «6.mp3» наоборот увеличил. Что и требовалось сделать!