Александр Загуменнов - Компьютерная обработка звука
Для удобства этот же параметр дублируется на вкладке Noiseprint (Отпечаток шума).
Теперь перейдите на вкладку Noiseprint, пометьте опцию Capture noiseprint (Собрать данные об отпечатке шума) и нажмите на кнопку Preview (Предварительно). Модуль выполнит анализ шума в выделенном фрагменте и вернется к его началу. Будут собраны данные для отпечатка шума, модуль переключится из режима сбора данных в режим обработки, и вкладка Noiseprint примет вид, показанный на рис. 3.2. Таким образом, анализ закончен, и можно приступать к обработке файла.
Рис. 3.2. Вкладка Noiseprint окна Sonic Foundry Noise ReductionОбратите внимание, что в режиме сбора данных изменить настройки процесса невозможно.
Если настроена опция Automatic capture timeout (Автоматическое отключение режима сбора данных по времени), режим Capture по истечении определенного времени будет выключен. Это полезно для сокращения времени анализа.
Для удобства опции Capture и Automatic capture timeout дублируются на вкладках General и Noiseprint.
Маленькие черные квадратики на графике – это точки изгиба огибающей отпечатка шума, расположенные на 6 дБ выше уровня шума. Алгоритм шумоподавления использует огибающую для определения той части записанного сигнала, которая является шумом. Частоты с амплитудами, лежащими ниже точек изгиба, будут считаться шумом, и в процессе обработки их амплитуда будет существенно уменьшена. Частоты с более высокими амплитудами останутся нетронутыми.
Теперь модуль в режиме реального времени может выполнить шумопонижение для выделенного фрагмента. Чтобы обработать весь файл, щелкните правой кнопкой мыши в пустом месте окна под опцией Real-time (В реальном времени) и в появившемся контекстном меню выберите команду Select All Data (Выделить все данные).
Теперь можно воспроизводить весь файл, одновременно изменяя параметры и прослушивая результат. Чтобы выполнить обработку, нажмите кнопку OK.
Самую большую трудность можно считать преодоленной, как только получен отпечаток шума. Вкладка Noiseprint не понадобится, пока вы не соберетесь обрабатывать другой файл. Вернемся к вкладке General и рассмотрим остальные настройки.
При шуме, с трудом поддающемся обработке, хорошие результаты дает многократное повторение процесса при значениях Reduce noise от 10 до 20 дБ. После первой обработки файла получают новый отпечаток шума и снова обрабатывают файл. Рекомендуется дважды обработать файл со значениями в 20 дБ, а не один раз с 40 дБ: это приведет к лучшему результату.
Регуляторами Attack speed (Скорость реакции на атаку сигнала) и Release speed (Скорость реакции на затухание сигнала) устанавливается скорость реакции программы на изменения в уровне шума.
Опцией Attack speed определяется, как алгоритм шумоподавления поведет себя при появлении сигнала. Рекомендуемое значение по умолчанию – 80. При очень низких значениях алгоритм не успевает реагировать на быстрые переходы, и они могут быть удалены из звука. В свою очередь слишком высокие значения могут привести к заметным искажениям при быстрой атаке сигнала. При очень большом размере FFT следует увеличить Attack speed.
Опция Release speed определяет, как быстро алгоритм шумоподавления реагирует на затухание шумового сигнала. Значение 50 рекомендуется по умолчанию. Более высокие значения могут привести к отсечению окончаний медленно затухающих звуков. При использовании очень больших значений FFT-размера Release speed следует увеличить.
Часто после шумоподавления пропадает яркость звучания высоких частот. Для компенсации такого явления применяется высокочастотный фильтр. Он включается с помощью опций High-shelf start freq. (Частота среза высокочастотного фильтра), которая устанавливает частоту среза (от 500 до 15000 Гц), и High-shelf gain (Усиление высоких частот), которая устанавливает уровень усиления или ослабления фильтром высоких частот (от -20 до 20 дБ). Обычно достаточно усиления примерно на 3 дБ, чтобы компенсировать высокочастотные потери при шумоподавлении.
В секции Windowing расположена система настройки для корректировки точности частотного анализа.
Опция FFT Size (FFT-размер) указывает размер выборок для анализа частотного спектра звука. Чем выше значение, тем точнее анализ, но и тем дольше обработка и больше нагрузка на центральный процессор. Настройка по умолчанию обычно пригодна для большинства ситуаций.
При помощи опции Overlap (Перекрытие) устанавливается, какая часть выборок накладывается друг на друга при частотном анализе звука. Перекрытие выборок дает более высокую точность анализа. Для большинства ситуаций подходит настройка по умолчанию в 75 %. При увеличении этого значения обработка замедлится в гораздо большей степени, чем повысится качество шумоподавления.
Переключателем Keep residual output (Сохранить остаточный сигнал) инвертируется процесс шумоподавления. Вместо звука без шумов вы будете слышать шум, который удаляете. Такая возможность окажется очень ценной при настройке параметров, потому что можно услышать, действительно ли удаляется шум, от которого вы хотели избавиться.
Например, если вы удаляете некоторый фоновый шум из записи разговора, и при этом в остаточном сигнале частично прослушивается разговор, это значит, что вы неблагоприятно воздействуете на качество исходного материала. Следует изменить параметры настройки, чтобы в остаточном сигнале содержалось как можно меньше материала, который вы хотите сохранить. Подобный метод удаления фона (или, наоборот, исследования его) часто используется в криминалистике.
В заключение вернемся еще раз на вкладку Noiseprint, чтобы описать не рассмотренные нами параметры.
Переключателем Noiseprint выбирается режим вычислений для отображения графика огибающей шума: peak (по пиковым значениям) или average (по средним значениям).
Fit size (Подогнать размер) определяет, на сколько частотных полос разбивается звук для обработки. Рекомендуется использовать большое число точек огибающей. Чем больше точек, тем точнее работает алгоритм шумоподавления. Если изменялся Fit size, нажмите кнопку Fit (Подогнать) для генерации новых точек изгиба огибающей.
Слева внизу окна расположены две кнопки для изменения амплитуды огибающей. Каждое нажатие на одну из них уменьшает или увеличивает амплитуду на 1 дБ. Если удерживать кнопку нажатой, через некоторое время шаг изменений увеличится. Так как алгоритмом шумоподавления обрабатывается любой сигнал, амплитуда которого оказывается ниже огибающей, ее перемещение вверх или вниз сильно влияет на то, сколько шума удаляется из исходной записи. Если процессом генерируется слишком много звуковых искажений, можно снизить амплитуду огибающей и тем самым предохранить сигнал от изменений.
Иногда требуется переместить отдельные точки или группы точек огибающей. Например, если частотные составляющие исходного материала имеют много общих с шумом точек, полезно уменьшать шум только в тех местах, где нет большого перекрытия по частоте. Скажем, имеется запись речи с сильным шипением ленты. Если выделить все точки ниже 1000 Гц и перетащить их вниз, чтобы шумоподавление не воздействовало на эти частоты, то устранится более слышимый высокочастотный шум и при этом сохранятся низкочастотные составляющие речи.
Чтобы переместить отдельную точку, нажмите на один из квадратных маркеров огибающей и перетаскивайте его.
Чтобы переместить группу точек, щелкните левой кнопкой мыши по графику и очертите прямоугольный блок, охватывающий нужные точки. Выбранные точки изменят свой цвет на красный. После того как группа точек выбрана, можно щелкнуть по ней и перетаскивать всю группу сразу.
В любое время можно убрать огибающую, нажав кнопку Reset (Сброс). Для повторной ее генерации снова нажмите кнопку Fit.
При ручной корректировке формы огибающей часто требуется изменить размер графика, чтобы лучше видеть, на какие частоты оказывается воздействие.
Изменить масштаб изображения можно несколькими способами. Один из способов состоит в том, чтобы левой кнопкой мыши выделить на графике область для увеличения. Щелкнув затем правой кнопкой и выбрав из контекстного меню команду Zoom Selection (Увеличить выделенную область), вы получите на экране увеличенное изображение области, как показано на рис. 3.3.
Рис. 3.3. Увеличенное изображение графика на вкладке Noiseprint в окне Sonic Foundry Noise ReductionДругой способ заключается в смене режима масштабирования. Если, удерживая нажатой левую кнопку мыши, нажимать правую, нормальный режим можно заменить на любой из трех других: масштабирование по вертикали, по горизонтали или одновременно по вертикали и по горизонтали.
Чтобы вернуться к нормальному режиму обычного выделения, переключайтесь таким образом до тех пор, пока курсор не примет форму знака + .