Научная литература
booksshare.net -> Добавить материал -> Медицина -> Чистович Л.А. -> "Физиология речи. Восприятие речи человеком" -> 99

Физиология речи. Восприятие речи человеком - Чистович Л.А.

Чистович Л.А. , Венцов А. В., Гранстрем М.П. Физиология речи. Восприятие речи человеком — Л.: Наука, 1976. — 388 c.
Скачать (прямая ссылка): fizrech1976.djvu
Предыдущая << 1 .. 93 94 95 96 97 98 < 99 > 100 101 102 103 104 105 .. 159 >> Следующая

Следующий этап расчета обеспечивает переход от а (г), или вычисленной описанным выше способом, или определенной в эксперименте, к g(z).
Согласно Цвикеру, используется формула
В (г) =0.08 {[а (*)]'••« -К (2)]*-"}, (1)
где а„ (2) = 10011"(2:) , А, (г) — порог слышимости (в дБ относительно абсолютного порога). Плотность громкости (#) выражается в сон/Барк, где сон — принятая единица громкости [145].
Как говорилось выше, единственный существующий в настоящее время прямой метод измерения эквивалентного спектра, применимый для любых произвольных стимулов, основан на определении порога пульсаций. Поэтому для оценки качества описываемой процедуры существенно сравнить g (г), полученную в результате вычислений а (г) по энергетическому спектру стимула, с g (г), полученной из экспериментально определенного (методом пульсаций) эквивалентного спектра.
На рис. 10.5 приведены данные для стимула из 10 гармоник, применявшегося в экспериментах Хоутгаста (рис. 10.1, Б, кривая 1). Кривая 1 показывает слуховой спектр (зависимость плотности громкости от частоты), полученный при использовании а (г), соответствующей кривой порога пульсаций. Кривая 2 — слуховой спектр, полученный при использовании а (г), вычисленной по линейчатому спектру стимула. Основной интерес при сравнении кривых 2 и 1 представляет изрезанность кривой (разница между
256
минимумами и максимумами) и изменение изрезанности с увеличением г. Эти характеристики отражают разрешающую способность слухового анализатора и зависимость разрешающей способности от частоты. Можно видеть, что по этим признакам обе кри-
Рис. 10.5. Слуховой спектр сложного стимула, приведенного на рис. 10.1, В.
По оси абсцисс — частота; по оси ординат — плотность громкости. 1 — результаты вычислений по значениям порога пульсаций [>02]; 2 — результаты расчета по линейчатому
спектру стимула.
вые достаточно похожи. Так как изрезанность кривой 1 в области нижних частот несколько больше, чем изрезанность кривой 2, следует считать, что, используя описанную выше процедуру вычисления, мы получаем слегка сглаженное по сравнению с истинным изображение слухового спектра.
10.2.3. ПРИМЕРЫ СЛУХОВЫХ СПЕКТРОВ ГЛАСНЫХ
На рис. 10.6 приведены пороги пульсаций для двух синтетических гласных [302]. Так как порог определялся только на частотах гармонических составляющих стимула, полученные кривые следует рассматривать не как полный эквивалентный спектр стимула, но как его огибающую.
Рис. 10.7 показывает значения плотности громкости (#) на частотах (значениях г) гармоник синтетического [а], приведенного на рис. 10.6. Кривая 2 получена при использовании значений а (г), соответствующих порогу пульсаций. Кривая 1 получена при использовании значений а (г), вычисленных непосредственно по гармоническому спектру стимула. Можно видеть, что совпадение кривых является вполне удовлетворительным. Это означает, что вычислительная процедура обеспечивает достаточно близкую к реальной картину а (г).
На рис. 10.8 показан слуховой спектр естественного гласного Ш. Для вычислений использован гармонический спектр этого гласного, приведенный Фантом [2БЗ].
На рис. 10.9 показан слуховой спектр синтетического гласного [а], применявшегося в экспериментах Хирато и др. [296].
17 Физиология речи
257
во
—I-1-1-1—I—I [ I I I-1_I_I 111111
0.1 0.2 0.5 1.0 2.0 5.0 10 кГц
Рис. 10.6. Пороги пульсаций для синтетических гласных [а] и [е]. По [302].
По оси абсцисс — частота; по оси ординат —- уровень звукового давления. Вертикальные линии, соединенные кривой, — амплитуды гармонических составляющих в спектре гласного. Кружки, соединенные жирной кривой, — значения порога пульсаций на частотах гармоник стимула. Штриховая кривая — порог слышимости.
Рис. 10.7. Огибающие слухового спектра синтетического гласного [а], линейчатый спектр которого приведен на рис. 10.6.
По оси абсцисс — частота; по оси ординат — плотность громкости. 1 — результаты расчета по линейчатому спектру стимула; 2 — результаты вычислений по значениям порога пульсаций [5ог], приведенного на рис. 10.6.
Общий вывод, основанный на этих примерах, а также на результатах вычислений слуховых спектров большого числа естественных русских гласных, состоит в том, что в слуховом спектре обнаруживается, как правило, больше чем два формантних мак-
г, Бари 0 2 Ь 6 8 10 12 Н 16 18 20 22
г, Барп
Рис. 10.8. Слуховой спектр естественного гласного [і], рассчитанный по линейчатому спектру, приведенному Фантом [268].
Ло оси абсцисс — высота; по оси ординат — плотность громкости. У,—У5 —формантные
максимумы.
Рис. 10.9. Слуховой спектр синтетического гласного [а], рассчитанный по линейчатому спектру стимула, из работы Хирато и др. [2М].
Обозначения те же, что на рис. 10.8.
симума (рис. 10.8 и 10.9), кроме того, имеются максимумы, соответствующие первым низкочастотным гармоникам (рис. 10.9).
Если верно распространенное допущение о том, что фонемное распознавание гласных основывается на весьма сглаженном изображении их спектров [191> 20в- *26], то такое сглаживание следует, очевидно, искать на уровнях дополнительной обработки g (г), обеспечивающих выделение признаков.
Предыдущая << 1 .. 93 94 95 96 97 98 < 99 > 100 101 102 103 104 105 .. 159 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed