Главная » Программирование звука » Восприятие звука человеком

0

При  тщательном  выборе  формата  записи  звуковой  информации  и  метода  обработки  звука  приходится  учитывать  множество  критериев,  в  том  числе  объем  данных и скорость процессора. Один из самых важных вопросов насколько хорошо будет это звучать.

Если  бы  достаточно  было  купить  соответствующий  измеритель,  направить  его на  громкоговоритель,  воспроизводящий  звук  и  получить  значение,  характеризующее качество звучания, все было бы очень просто. Производители дорогой стереоаппаратуры могли бы гордиться тем, что в их системах «качество звучания составляет

99,2%», а алгоритмы обработки звука точно измеряли бы ухудшение качества звучания.  Создание  столь  полезного  устройства,  безусловно  нереально,  что  отчасти обусловлено   существенным,   хотя   и   едва   уловимым   различием,   существующим между  характеристиками  звука,  которые  можно  измерить  и  теми,  которые  можно услышать.  В  конечном  счете,  единственные  «приборы»,  которым  можно  доверять, это расположенные у нас по бокам головы.

Наука,  занимающаяся  изучением  того,  как  слышит  человек,  называется  психоакустикой  (это  раздел  психофизики).  В  течение  последнего  столетия  ученым удалось  создать  довольно  четкое  описание  механизма,  благодаря  которому  человек слышит. Он исключительно сложен и запутан.

В  дальнейшей  дискуссии  мы  рассмотрим  различия  между  единицами  измерения  восприятия,  то  есть  понятиями,  относящимися  к  ощущаемым  человеком  характеристикам  звука,  и  понятиями,  относящимися  к  математическим  и  физическим характеристикам звука.

Частота и высота тона

Музыкальные инструменты труба и туба похожи друг на друга, однако первая издает  более  «высокие»  звуки.  Описывая  различие  между  их  звучаниями,  люди говорят о высоте тона у трубы «тон выше», чем у тубы. Высота тона тесно связана с физической характеристикой звука, называемой частотой.

Период  синусоидальной  волны   это  время,  затрачиваемое  на  один  полный цикл.  Частота  измеряется  как  количество  полных  циклов  за  одну  секунду,  единица измерения 1 герц (краткое обозначение Гц). Мы также будем измерять частоту в килогерцах [кГц], один килогерц равен тысяче герц. Для справки: люди слышат синусоидальные волны в диапазоне приблизительно от 30 до 20000 Гц.

Это  определение  частоты  основано  на  том,  что  синусоидальные  волны  явля-

ются периодическими: форма колебаний волн в точности сохраняется. Несмотря

на  то, что большая часть математического аппарата, используемого  для работы  со звуком,  основывается  на  базовом  постулате  повторяемости  сигнала  (в  частности, на преобразовании Фурье, о котором мы поговорим в главе 24), в реальной жизни очень немногие звуки обладают свойством периодичности.

На  практике  непосредственно  частота  имеет  значение  только  для  синусои-

дальных волн.

К  счастью,  любой  звук  можно  представить  набором  синусоидальных  колебаний.  И  наоборот,  любой  звук  можно  синтезировать,  сложив  подходящий  набор синусоидальных  волн.  Уравнение,  проиллюстрированное  рис.  2.1,  работает  в  обе

стороны:  если  читать  его  слева  направо,  оно  показывает,  как  получить  звук,  сло-

жив  две  синусоидальные  волны,  а  справа  налево   как  разложить  сложный  сиг-

нал на две отдельные синусоидальные составляющие.

Поскольку любой звук раскладывается на синусоидальные волны, мы можем построить частотный спектр звука. Спектр частот звуковой волны представляет собой график зависимости амплитуды от частоты. На рис. 2.2 показана амплитуда состав-

ляющих звук волн. В данном случае спектр очень прост: мы видим, что звук состав-

лен  волнами  двух  частот и  амплитуда  одной  из  них  вдвое  больше,  чем  у  другой.

В главе 24 рассказывается о том, как можно вычислить спектр частот звука.

В  действительности  люди  говорят  о  частоте  сложного  звука.  Обычно  эта  характеристика  измеряется  путем  обработки  частотного  спектра  выделением  частоты  синусоидальной  волны,  имеющей  максимальную  амплитуду.  Однако  данный

подход не всегда можно использовать.

-

Рассмотрим  рис.  2.3.  Подобно  спектрам  частот  большинства  музыкальных  инструментов   этот   спектр   содержит   последовательность   равномерно   расположенных  пиков,  называемых  гармониками.  Они  соответствуют  частотам,  кратным  некоторой   базовой   частоте.   Характеристический   звук   (или   тембр)   музыкального инструмента  нередко  основывается  на  относительной  громкости  различных  гармоник. Обычно базовая частота является также частотой самой сильной из составляющих звук синусоидальных волн.

Судя  по  всему,  воспринимаемую  человеком  высоту  тона  всего  звука  в  целом наиболее  точно  передает  базовая  частота.  Данная  зависимость  достаточно  устойчива,   что   позволяет   использовать   в   некоторых   компьютеризированных   инструментах  метод  идентификации  сыгранных  нот  по  фундаментальной  частоте  звука. Этот метод называется слежением за базовой частотой или слежением за высотой тона.  В  результате,  компьютеризованные  инструменты  могут  автоматически  следовать за мелодией, сыгранной на другом инструменте.

При  рассмотрении  частоты  сложного  звука,  на  наш  взгляд,  было  бы  лучше оперировать  понятиями,  относящимися  к  ощущениям  человека:  частотой  сложного  звука  является   частота  синусоидальной  волны  такой  же  воспринимаемой высоты тона.

Высота тона в музыке

Большинство  музыкантов  западной  школы  пользуются  набором  высот  тона, называемых  нотами.  Такой  набор  называется  равномерно  темперированным  звукорядом,  который  представляет  собой  результат  постепенной  эволюции  теории музыки, разработанной математиками Древней Греции.

Древние  греки  заслужили  признание  благодаря  тому,  что  заметили  зависимость  между  частотой  и  высотой  тона.  Они  обнаружили,  что  в  зависимости  от длины  колеблющейся  струны,  получаются  звуки  различной  высоты  тона  (длина струны  напрямую  связана  с  частотой),  и  создали  изящную  математическую  теорию,  которая  объяснила,  почему  комбинации  определенных  частот  созвучны.  Они открыли,  например,  что,  если  частота  одного  звука  ровно  вдвое  превосходит  частоту другого, такие звуки особенно подходят друг к другу. Сейчас это отношение

известно  под  названием  октава.  Оно  получило  настолько  широкое  распространение,  что  мы  теперь  часто  относим  отличающиеся  на  октаву  тональности  к  одной и той же ноте. С течением времени музыканты Запада пришли к соглашению, что каждая  октава  должна  быть  поделена  на  12  нот.  Но,  как  я  объясню  чуть  позже, возникло  некоторое  разногласие  относительно  того,  какая  именно  частота  должна соответствовать каждой из этих нот.

Греки  сделали  попытку  объяснить,  почему  одни  пары  звуков  образовывали консонанс вместе они звучали согласованно, в то время как другие пары образовывали   диссонанс.   Разработанная   ими   теория   основывалась   на   относительных частотах.  Согласно  этой  теории,  два  звука  образовывали  консонанс,  если  отношение  их  частот  можно  было  свести  к  небольшим  числам.  Пусть,  например,  имеются   две   идеальные   синусоидальные   волны,   частота   одной     660   Гц,   другой   -

440 Гц. Тогда отношение их частот составит 660:440, или 3:2. Так как 3 и 2 небольшие  числа,  можно  было  бы  ожидать,  что  совместное  звучание  этих  двух  нот будет  приятным.  Согласно  данной  теории,  высота  нот  определяется  относительно:  начинают  с  одной  ноты,  называемой  тоникой,  а  затем  устанавливают  остальные ноты в соответствии с отношениями их частот к частоте тоники.

Самыми   важными   из   этих   соотношений   являются   пятое   (отношение   3:2) и  третье  (отношение  5:4).  Если  мы  назовем  начальную  ноту  До,  то  сможем,  используя  предложенные  греческими  учеными  отношения,  определить  систему  из

12  нот,  называемую  натуральным  или  чистым  звукорядом.  Отношения  для  этих нот  приведены  в  табл..  2,1.  В  первой  колонке  даны  общепринятые  названия  нот западной  школы.  (Значок  #  читается  как  «диез»,  a  b   как  «бемоль»).  Во  второй и  третьей  колонке  содержатся  соответственно  названия  и  отношения  для  различных музыкальных интервалов. Например, нота Ми это «третья после До».

Чистый   звукоряд   позволяет   получать   очень   благозвучные   аккорды.   Например,   отношение   4:5:6   называется   главной   триадой   (трихордом)   и   получается в  результате  объединения  тоники  с  ее  четвертой  и  пятой  нотами  (скажем,  ДоМи-Соль).

Несмотря  на  это,  чистый  звукоряд   не  очень  гибкая  структура.  Если  вы,  например,  настроите  инструмент  так,  чтобы  отношения  его  тональностей  точно  соответствовали  чистому  звукоряду,  то  не  у  всех  нот  будут  третьи.  При  настройке До-мажор, приведенной в табл. 2.1, вы не сможете сыграть третью ноту после Ми (которая должна была бы иметь отношение 5:4 к ноте Ми или 25:16 к До). Наиболее  подходящей  нотой  окажется  Соль#,  чья  частота  будет  приблизительно  на  3% выше, чем требуется.

Эта  несогласованность  имеет  четко  выраженные  последствия  в  музыке.  Например,  если  вы  настроите  свой  любимый  музыкальный  инструмент  в  соответствии с чистым До-мажорным звукорядом, который приведен в табл. 2.1, и попробуете   сыграть   главную   триаду,   начинающуюся   с   ноты   Ми,   то   получившийся аккорд будет звучать слегка фальшиво.

В  зависимости  от  вашего  вкуса  это  либо  серьезная  проблема,  либо  возможность  придать  вашим  музыкальным  композициям  характерный  оттенок.  История знает примеры как одного подхода к этой проблеме, так и другого.

С  появлением  стандартного  нотного  письма  {общепринятая  практическая  нотация)  люди  все  в  большей  и  большей  степени  стали  рассматривать  12-тоновую шкалу  как  последовательность  12  отношений,  называемых  полутонами.  Каждый полутон   это  отношение  частот  двух  последовательно  идущих  нот.  При  использовании  чистого  звукоряда,  безусловно,  не  все  полутона  одинаковы.  В  табл.  2.2 к  чистому  звукоряду  добавлена  колонка,  в  которой  приведены  отношения  между последовательно стоящими нотами (например, До-диез и До).

Было  сделано  немало  попыток  «поправить»  расположение  нот  путем  небольшого смещения  частот некоторых из них. По правде говоря, тот вид чистого звукоряда,  который  представлен  в  данной книге,  сформировался  только  в XVI  столетии.   В   соответствии   с   настройкой,   первоначально   предложенной   греческим математиком  Пифагором,  вся  шкала  конструировалась  на  основе  последовательно  идущих  пятых,  или  чистых  квинт.  Данные  Пифагорова  строя  также  включены  в  табл.  2.2.  Последовавшие  попытки  согласования  шкалы  настройки  и чистого звукоряда Пифагора назвали темперациями.

Настойчивые  попытки  принять  единую  темперацию  в  конце  концов  привели

к  появлению  равномерной  темперации,  в  которой  все  полутона  были  одинаковы. Для  этого  требовалось  сместить  частоты  нот  таким  образом,  чтобы  отношения частот у стоящих друг за другом нот сравнялись. Так как у нас 12 нот, а одна октава  по-прежнему  соответствует  соотношению  частот  2:1,  в  итоге  коэффициент  отношения   между   последовательными   тональностями   получается   равным   12/2   иррациональному числу, приблизительно равному 1,0595.

В  табл.  2.3  сравниваются  отношения  частот  для  чистой  интонации,  шкалы настройки Пифагора и равномерно темперируемой системы.

Равномерная темперация представляет собой изящный компромисс. Этот звуко-

ряд позволяет использовать в качестве базиса любую из нот и по ходу дела стирает

Таблица 2.2. Отношения частот нот для различных звукорядов

Нота

Чистый

звукоряд

Чистые

полутона

Интервалы

Пифагора

Полутона

Пифагора

С (До)

1,0

1,0667

1,0

1,0679

C#/Db (До-диез/Ре-бемоль)

1,0667

1,0547

1,0679

1,0535

D(Pe)

1,125

1,0667

1,125

1,0679

D#/Eb (Ре-диез/Ми-бемоль)

1,2

1,0417

1,2013

1,0535

E/Fb (Ми/Фа-бемоль)

1,25

1,0667

1,2656

1,0679

F/E# (Фа/Е-диез)

1,3333

1,05

1,3515

1,0535

F#/Gb (Фа-диез/Соль-бемоль)

1,4

1,0714

1,4238

1,0535

G (Соль)

1,5

1,0667

1,5

1,0679

G#/Ab (Соль-диез/Ля-бемоль)

1,6

1,0417

1,6018

1,0535

А (Ля)

1,6667

1,08

1,6875

1,0679

А#/ВЬ (Ля-диез/Си-бемоль)

1,8

1,0417

1,8020

1,0535

В/Cb (Си/До-бемоль)

1,875

1,0667

1,8984

1,0535

С/В# (До/Си-бемоль)

2,0

2,0

Таблица 2.3. Отношения частот нот в различных звукорядах

Нота

Чистый звукоряд

Пифагоров строй

Равномерная

темперация

С (До)

1,0

1,0

1,0

C#/Db (До-диез/Ре-бемоль)

1,0667

1,0679

1,0595

D(Pe)

1,125

1,125

1,1225

D#/Eb (Ре-диез/Ми-бемоль)

1,2

1,2013

1,1892

E/Fb (Ми/Фа-бемоль)

1,25

1,2656

1,2599

F/E# (Фа/Е-диез)

1,3333

1,3515

1,3348

F#/Gb (Фа-диез/Соль-бемоль)

1,4

1,4238

1,4142

G (Соль)

1,5

1,5

1,4983

G#/Ab (Соль-диез/Ля-бемоль)

1,6

1,6018

1,5874

А (Ля)

1,6667

1,6875

1,6818

А#/ВЬ (Ля-диез/Си-бемоль)

1,8

1,8020

1,7818

В/Cb (Си/До-бемоль)

1,875

1,8984

1,8877

С/В# (До/Си-бемоль)

2,0

2,0

2,0

различия  между  тонами.  Исторически  сложилось  так,  что  ряд  тонов  стал  ассоциироваться  с  определенной  тональностью.  В  значительной  степени  на  это  повлияла  неизбежная  несогласованность,  возникающая  при  попытке  построить  12-тоновую шкалу, основываясь на идеальных третьих и четвертых.

Определив частоту базовой ноты, вы можете использовать указанные выше отношения для того, чтобы задать весь звукоряд. Чаще всего музыканты применяют в качестве базовой ноту Ля440, то есть ноту Ля с частотой звука 440 Гц. Воспользовавшись равномерной темперацией, вы получите частоты, указанные в табл. 2.4.

Таблица 2.4. Частоты нот в соответствии с равномерной темперацией (Гц)

С  (До)

32,70

65,41

130,81

261,63

523,25

1046,50

2093,00

С#(До-диез)

34,65

69,30

138,59

277,18

554,36

1108,73

2217,46

D(Pe)

36,71

73,42

146,83

293,66

587,33

1174,66

2349,32

D# (Ре-диез)

38,89

77,78

155,56

311,13

622,25

1244,51

2489,02

Е(Ми)

41,20

82,41

164,81

329,63

659,25

1318,51

2637,02

F(Oa)

43,65

87,31

174,61

349,23

698,46

1396,91

2793,83

Р#(фа-диез)

46,25

92,50

185,00

369,99

739,99

1479,98

2959,96

G (Соль)

49,00

98,00

196,00

391,99

783,99

1567,98

3135,96

С#(Соль-диез

) 51,91

103,83

207,65

415,31

830,61

1661,22

3322,44

А  (Ля)

55,00

110,00

220,00

440,00

880,00

1760,00

3520,00

А#(Ля-диез)

58,27

116,54

233,08

466,16

932,33

1864,65

3729,31

В(Си)

61,74

123,47

246,94

493,88

987,77

1975,53

3951,07

С(До)

65,41

130,81

261,63

523,25

1046,50

2093,00

4186,01

Одним   из   аргументов,   свидетельствующих   в   пользу   принятия   равномерной темперации, является то, что ее применение позволяет сыграть все ноты на одном физическом   инструменте,   который   не   придется   постоянно   перестраивать.   Эта проблема,  однако,  была  полностью  устранена  после  появления  электронных  инструментов.  В  то  время  как  взятый  в  отдельности  физический  инструмент  непросто  перенастроить  с  До-мажор  на  Ми-мажор  в  пределах  чистого  звукоряда,  электронный   инструмент   может   мгновенно   автоматически   перенастраиваться,   что позволит  использовать  подобные  перемены даже в пределах  одной песни.  В некоторых  современных  композициях  вообще  не  применяется  12-тоновый  ряд.  Микротональные композиции, ряд в которых поделен особым  образом, или атональные, где  фиксированные  частоты  для  нот  вообще  не  задаются,  исполняют  электронные инструменты.

Высота тона и частота звука

Теория  древних  греков,  согласно  которой  высота  тона  и  частота   одно  и  то же,  привлекает  своей  простотой.  Тем  не  менее  проведенные  в  последнее  время эксперименты,  в  ходе  которых  были  сделаны  попытки  измерить  ощущение  высоты  тона  человеком,  выявили  ряд  ситуаций,  где  эта  простая  идея  срабатывала  не совсем точно. Например, у громких звуков высота тона ниже, чем у тихих звуков той же частоты.

Теория  звука,  разработанная  греками,  также  перестает  работать  на  очень  высоких  или  на  очень  низких  частотах.  Если  тщательно  протестировать  правильно настроенное  пианино,  обнаружится,  что  высокие  ноты  настроены  на  несколько большие,  а  низкие   на  несколько  меньшие  частоты,  чем  можно  было  бы  ожидать.   Не   так   давно   исследователи   подтвердили   то,   что   настройщики   пианино уже  знали  давным-давно:  человек  обычно  слышит  высокие  ноты  чуть  ниже,  чем они есть на самом деле. Аналогичным образом, низкие ноты слышатся чуть выше. Установленное греками родство между высотой тона и частотой справедливо

только для среднего диапазона нот и теряет точность для более высоких или низ-

ких звуков.

Картина становится еще более запутанной, когда речь заходит о сложных звуках.  Выше  я  упомянул,  что  у  большинства  музыкальных  инструментов  звучание состоит  из  сильных  компонент  на  частотах  (гармониках),  кратных  некоторой  базовой частоте. Чаще всего эта базовая частота является еще и частотой самой сильной  синусоидальной  волны  в  звуке.  В  результате,  мы  зачастую,  построив  спектр частот  звука  и  выделив  в  нем  самую  громкую  составляющую,  можем  заранее  определить,  какую  высоту  тона  будет  иметь  звук.  Однако  звук  на  базовой  частоте в ряде  случаев бывает совсем  слабый или вообще отсутствует, а мы  по-прежнему слышим  звук  той  же  самой  высоты  тона.  Известно,  что  у  некоторых  инструментов,  в  том  числе  у  фортепиано,  существуют  растянутые  частичные  тона,  где частоты    появления    гармоник    не    совсем    соответствуют    значениям,    кратным базовой частоте.

Шум

Если вы получили спектр частот, похожий на тот, что показан на рис. 2.2, то имеет  смысл  определить  частоты  с  максимальной  амплитудой  и  воспользоваться ими для описания свойств звука. Но что делать, если спектр звука имеет вид графика,  показанного  на  рис.  2.4?  В  такой  ситуации  невозможно  выделить  частоту или  хотя  бы  несколько  частот,  с  помощью  которых  можно  было  бы  попробовать охарактеризовать звук.

Звук,   образованный   колебаниями   всего   диапазона   частот,   подобный   тому, спектр  которого  показан  на  рис.  2.4,  называется  шумом.  Толкование  этого  слова, принятое  в  технике,  отличается  от  общепризнанного.  Свист  высокого  тона  (издаваемый,  например,  старым  монитором)  может  считаться  шумом  в  бытовом  смысле. Но у этого звука есть четко определенный спектр частот, и, следовательно, он не  может  считаться шумом  в техническом  смысле этого  слова. Я буду использовать слово «шум» только в данном техническом смысле.

Шум,  как  ни  странно,  встречается  повсюду.  Большинство  ударных  инструментов,  включая  барабаны,  деревянные  бруски  и  тарелки,  производит  преимущественно шум. Много шумовых составляющих содержит голос человека. Шум

издает двигающийся воздух   независимо от  того, дуновение  ли это человека или шорох ветра в микрофоне. Можно сказать, что нежные звуки флейты в некоторой степени  извлекаются  из  шума,  производимого  выдуваемым  человеком  воздухом. Так   как  шум   содержит   все   частоты,   флейта   может   выделить   в   нем   нужные и усилить  их.  Как  оказывается, эта  идея  весьма эффективна  для синтеза  звучания некоторых инструментов.

Если  анализировать  дискретные  значения  (отсчеты)  уровня  шума  (а  не  спектр его  частот),  то  получится,  что  перед  нами  случайная  выборка.  Хорошим  источником   шума   является   высококачественный   генератор   случайных   чисел,   который используется  в  качестве  сигнала  возбуждения  для  синтеза  звучания  многих  ударных инструментов.

Источник: Кинтцель Т.  Руководство программиста по работе со звуком = A Programmer’s Guide to Sound: Пер. с англ. М.: ДМК Пресс, 2000. 432 с, ил. (Серия «Для программистов»).

По теме:

  • Комментарии