Научная литература
booksshare.net -> Добавить материал -> Медицина -> Чистович Л.А. -> "Физиология речи. Восприятие речи человеком" -> 22

Физиология речи. Восприятие речи человеком - Чистович Л.А.

Чистович Л.А. , Венцов А. В., Гранстрем М.П. Физиология речи. Восприятие речи человеком — Л.: Наука, 1976. — 388 c.
Скачать (прямая ссылка): fizrech1976.djvu
Предыдущая << 1 .. 16 17 18 19 20 21 < 22 > 23 24 25 26 27 28 .. 159 >> Следующая

3.2. РИТМИЧЕСКИЙ РИСУНОК ФОНЕТИЧЕСКОЙ ПОСЛЕДОВАТЕЛЬНОСТИ
Ритмический рисунок фонетической последовательности чрезвычайно интересен тем, что в качестве основной характеристики элемента выступает длительность. Длительность является признаком отрезка физического процесса; измерять длительность можно лишь после того, как речевой сигнал сегментирован, определены моменты начала и конца отрезка.
Фонетическим элементом, принимаемым при описании ритмического рисунка, обычно служит слог. Это основывается на том, что фонетические последовательности, соответствующие двум разным словам или двум разным строкам стиха, воспринимаются как ритмически совпадающие, если число слогов в этих последовательностях одинаково и порядковые номера ударенных слогов совпадают Iм4]. Число звуков речи (фонем) может при этом быть различным, однако это касается только согласных, так как общепринято, что каждый слог обязательно включает гласный, причем только один гласный (случаи, когда роль гласного выполняет слогообразующий сонант, в русском языке сравнительно редки, и мы пока их рассматривать не будем).
Если элементом является слог, то самое простое предположение состоит в том, что длительность, присваиваемая элементу, — это длительность слогового отрезка в речевом сигнале.
Один из способов экспериментальной проверки этого предположения заключается в том, чтобы получить субъективные оценки длительностей слогов во фразе и выяснить, коррелируют ли они с длительностями слоговых отрезков. Результаты эксперимента [433] показали, что субъективная длительность слога коррелирует с длительностью не слогового отрезка, но отрезка гласного.
Другой возможный способ проверки состоит в таком изменении длительностей гласного и согласного в слоге, чтобы суммарная длительность слога сохранялась постоянной. Если сделанное предположение верно, то ритмический рисунок не должен при этом меняться и должен наблюдаться эффект «компенсации» длительностей гласного и согласного. Эксперименты показали, что эффекта «компенсации» нет [303] и что ударенность слога определяется длительностью отрезка гласного [31.1-
Эти данные не опровергают предположения, что именно слог является фонетическим элементом. Однако они говорят о том, что обработка речевого сигнала должна обеспечивать выделение отрезков гласных.
Обратим внимание на два существенных обстоятельства. Во-первых, ритмический рисунок фонетической последовательности в первом приближении не зависит от фонемного состава этой последовательности и, соответственно, от конкретных спектральных характеристик речевого сигнала на отрезках гласных и согласных. Во-вторых, ритмический рисунок может быть передан с помощью сигнала, состоящего из тональных посылок (см. главу 2), или сигнала, образуемого при «произнесении» фразы с закрытым ртом [169]. В обоих этих случаях вместо согласных в сигнале имеется пауза.
Приходится считать, что отрезки, на которые сегментируется речевой сигнал, должны соответствовать не согласным и гласным, но гласным и негласным, где негласный может быть как согласным
53
(сочетанием согласных), так и паузой. Формально это то же самое, что обнаружение (выделение) гласных в речевом потоке.
Понятно, что выделение отрезков гласных в речевом потоке автоматически обеспечивает возможность выделения слоговых отрезков. Слог определяется как интервал между началами соседних гласных в речевом потоке {закрытый слог) или как интервал между концами соседних гласных (открытый слог).
3.3. ФОНЕМНЫЙ СОСТАВ ФОНЕТИЧЕСКОЙ ПОСЛЕДОВАТЕЛЬНОСТИ
Распространенная точка зрения, на которой основывается большинство работ по автоматическому распознаванию речи, заключается в том, что элементами речевого сигнала являются звуки речи и что фонемы распознаются последовательно одна за другой. Исследователи восприятия речи за последнее время все больше склоняются к тому, что фонемы могут распознаваться параллельно и что в качестве фонетического элемента выступает слог [19- 196- 22°]. Далее мы начнем с изложения этой наиболее привычной точки зрения и попытаемся пояснить разницу между последовательным и параллельным распознаванием фонем.
3.3.1. ФОНЕМНАЯ КЛАССИФИКАЦИЯ ТЕКУЩИХ ЗНАЧЕНИЙ РЕЧЕВОГО СИГНАЛА
Существо традиционных представлений относительно связи между речевым сигналом и фонемой, используемых в теориях восприятия речи и автоматическом распознавании, сводится к следующим основным допущениям: 1) фонема является характеристикой звука речи — указанием класса, которому этот звук принадлежит; 2) каждому звуку речи соответствует определенное состояние речевого аппарата и соответственно определенная форма спектра звука (и тип источника возбуждения); 3) звуки речи произносятся последовательно один за другим.
На первом этапе развития работ по автоматическому распознаванию речи было сделано дополнительное допущение, что длительность квазистационарных участков, в течение которых сохраняется спектр, типичный для данного звука речи, существенно больше длительности участков, соответствующих переходам от одного звука речи к другому.
Если все эти допущения верны, то для фонемного распознавания речи нужно только научиться классифицировать спектры, т. е. найти оптимальные решающие правила, обеспечивающие переход от значения спектра к фонеме — названию класса спектров. Реализовав эти правила в соответствующем классификаторе и подавая на его вход отклик на речевой сигнал спектрального
Предыдущая << 1 .. 16 17 18 19 20 21 < 22 > 23 24 25 26 27 28 .. 159 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed