Научная литература
booksshare.net -> Добавить материал -> Медицина -> Чистович Л.А. -> "Физиология речи. Восприятие речи человеком" -> 96

Физиология речи. Восприятие речи человеком - Чистович Л.А.

Чистович Л.А. , Венцов А. В., Гранстрем М.П. Физиология речи. Восприятие речи человеком — Л.: Наука, 1976. — 388 c.
Скачать (прямая ссылка): fizrech1976.djvu
Предыдущая << 1 .. 90 91 92 93 94 95 < 96 > 97 98 99 100 101 102 .. 159 >> Следующая

и
гДе 8( — значение плотности импульсации в г-том канале периферической слуховой системы, п — число каналов периферической слуховой системы, к^. — возбуждающий или тормозной коэффициент связи 1-того канала с ;-тым суммирующим элементом.
Описанием спектра гласного на выходе такой модели будет набор значений щ, . . ., ип где I — число сумматоров. Такие представления лежат в основе многих работ по автоматическому распознаванию речи.
Мы коротко остановимся на группе работ, в которых этот подход был использован для описания восприятия гласных (обзор этих работ см. [425]). В работе [ш] было показано, что субъективная разница по тембру между двумя стационарными сигналами довольно хорошо коррелирует с разностью их спектров, определенной как
/т 2 (1<я-1^\
где Ь!ч — уровень звукового давления одного сигнала в треть-октавной полосе под номером п, Ь,п — то же для второго сигнала, т — общее число полос.
Это послужило основанием для использования в качестве начального описания спектров естественных гласных (12 голландских гласных по 50 реализаций каждой) значений уровня звукового давления в 18 третьоктавных полосах. Оказалось, что исходное 18-размерное пространство может быть без заметных потерь сокращено до четырех- или трехмерного. Признаки (оси) этого нового пространства являются линейными комбинациями начальных признаков [3281.
На основании оценок субъективной разницы между гласно-подобными стимулами (11 гласных) и на основании матрицы ошибок при идентификации гласных были сконструированы трехмерные и четырехмерные субъективные пространства гласных. Оказалось, что эти трехмерные и четырехмерные конфигурации очень хорошо совмещаются с соответствующими конфигурациями, полученными при анализе [328' 431].
Трудность интерпретации этих результатов состоит в том, что конфигурация гласных в пространстве двух главных признаков, найденных в работе [328], практически идеально совмещается с конфигурацией гласных в пространстве частот первой и второй формант [432]. Авторы делают вывод об эквивалентности использованного ими полосного метода анализа с формантным анализом гласных. Этот вывод означает, что примененный авторами подход фактически не дает возможности определить, какими признаками спектра пользуется человек при восприятии гласных.
Данные, приводимые ниже в настоящей главе, позволяют надежно исключить только крайний вариант гипотезы кодирования величиной возбуждения. Он состоит в том, что число суммирующих элементов мало и каждый элемент имеет отличные от нуля коэффициенты связи с частотными каналами на всем интервале шкалы г.
10.1.2. ПРОСТРАНСТВЕННОЕ КОДИРОВАНИЕ
Основной смысл гипотезы пространственного кодирования состоит в том, что обработка #(г) обеспечивает выделение (обнаружение) некоторых локальных особенностей этой функции. Характеристикой выделенной особенности является ее положение на шкале г. Значения этих характеристик используются при фонемной интерпретации гласных.
Эта точка зрения соответствует распространенному представлению о том, что, воспринимая гласный, человек выделяет форманты и основывается при классификации на значениях частот формант. Вместе с тем гипотеза пространственного кодирования и формантная гипотеза не обязательно совпадают, они лишь частично перекрываются.
Гипотеза пространственного кодирования заранее не определяет, какие именно особенности выделяются на #(г). Этих особенностей может быть, в принципе, как больше, так и меньше числа формант в гласном звуке, особенность может или совпадать с формантой, или быть ее приближенной оценкой.
С другой стороны, с позиции формантной гипотезы безразлично, как кодируется частота форманты в нервной системе. Она может быть представлена как номером возбужденного нейронного канала, так, например, и частотой (периодом) импульсации. Важно лишь, чтобы соблюдалась монотонная зависимость между частотой форманты и соответствующей выходной переменной.
249
Для рассмотрения вопроса о том, какие особенности g(z) могли бы служить признаками при распознавании гласных и как можно было бы выделять эти особенности, необходимо прежде всего выяснить, насколько подробно отражен в g(z) спектр гласного.
Так как слуховой анализатор обладает ограниченной разрешающей способностью, естественно, что слуховой спектр гласного должен быть «размыт» по сравнению с идеальным спектром. Если бы свойства улитки как анализатора были полностью известны и функциональная модель периферической слуховой системы была создана, g(z) можно было бы просто промерить. К сожалению, окончательной модели улитки пока нет (см. главу 7). По этой причине все еще необходимо пользоваться психоакустическими методами измерения и расчета слухового спектра; принципы их будут описаны в следующем разделе.
10.2. ОПРЕДЕЛЕНИЕ СЛУХОВОГО СПЕКТРА СТИМУЛА
Для психоакустики g(z) является изображением сигнала на выходе функциональной модели периферической слуховой системы. Это изображение можно сконструировать, используя результаты психоакустических измерений и приняв ряд априорных допущений.
Модель периферической слуховой системы считается состоящей из набора частотных каналов; каждый канал включает фильтр звуковых частот и преобразователь. Проблема нахождения g(z), соответствующей исследуемому звуку, разделяется на две задачи. Первая из них состоит в том, чтобы экспериментально определить (или вычислить) для каждого частотного канала модели эквивалентный уровень интенсивности чистого тона той частоты, на которую настроен данный канал. Под эквивалентным понимается такой уровень интенсивности тона, при котором величину им-пульсации в данном канале можно считать такой же, как при действии исследуемого звука. Совокупность найденных эквивалентных уровней мы будем называть эквивалентным спектром. Вторая задача заключается в переходе от эквивалентного спектра к g{z). Для этого нужно знать амплитудную характеристику преобразователя.
Предыдущая << 1 .. 90 91 92 93 94 95 < 96 > 97 98 99 100 101 102 .. 159 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed