Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 108

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 102 103 104 105 106 107 < 108 > 109 110 111 112 113 114 .. 149 >> Следующая


/00

200 , 300 Время, моек

?10 500

Рис. 7.,14. Упрощенные спектрограммы синтетических слогов типа «фрикативная согласная—гласная». Частота резонанса фрикативной согласной обозначена Ff. Четырехформантная гласная является приближением /а/. Три нижних графика показывают изменение во .времени интенсивности возбуждения и положения формантных частот (Геннц и Стивене)

2 3 * 5 6 7 8

Резонансная частота вспышки шума, кгц

р)И)с. 7.15. Абсоиютная опознаваемость вачальиых согласных в синтетических слогах, схематически показанных иа рис. 7.14. Границы областей оценок ооответст---- опознаваемости 90 и 75%

вуют

звуко-в. Приведенные данные соответствуют разностям уровней интенсивностей согласной и гласной _5 и —25 дб (ГеГшц и Стивене)

298

ВОСПРИЯТИЕ РЕЧИ И РЕЧЕПОДОБНЫХ ЗВУКОВ

выше, проведено для фрикативных согласных японского языка* (Наката — Nakata, 1960).

В других, во многом аналогичных, экспериментах изучались формантные переходы с применением синтезатора с распределенными параметрами (Стивене и Хаус — Stevens and' House, 1956). Результаты показывают, что положение F2 в низкочастотной области (1000 гц и ниже), как правило, связано е-билабиальными или лабиодентальными артикуляторными конфигурациями. Положение F2 в среднечастотной области (1500-н -=-2000 гц) ассоциируются с альвеолярными, а выше 2000 гц — с палатальными конфигурациями.

Несколько иной подход к синтезу и восприятию может быть показан на примере формирования слитной речи из отдельных синтетических сегментов с неизменными спектрами (Коэн И' 'ТАрт — Cohen and 'T Hart). Продолжительность сегмента была порядка фонемы, причем следовали они с заранее определенными временами нарастания, спада и длительностью. На основе полученных результатов сделан вывод, что при соответствующем выборе временных параметров можно пренебречь, многими деталями формантной структуры, которые обычно считались первостепенными. Известно, что ухо является анализатором мгновенного спектра (см. гл. V), непрерывно следящим за вариациями как по частоте, так и по интенсивности. Сторонники точки зрения «временных параметров» имеют в виду соотношения эквивалентности информации о спектре и о деталях временной структуры. Такая эквивалентность действительно существует, но диапазон ее применимости должен.' быть ограничен. Высококачественную, разборчивую речь вряд ли можно систематически синтезировать без учета спектральных переходов между сегментами длиной в фонему.

7.3,3. Влияние обучения и лингвистических ассоциаций на абсолютную опознаваемость речеподобных сигналов

Выше упоминалось, что применение классических психофизических данных к опознаванию речи наталкивается, по крайней мере, на два ограничения. Во-первых, классические измерения обычно касаются лишь дифференциальной различимости. Во-вторых, они, как правило, проводятся для одного параметра образца. Речь же является многомерным сигналом. Единицы ее восприятия, если они существуют (а они, вероятно, различны в зависимости от цели опознавания), по-видимому, опознаются абсолютно. Имеются сведения, по крайней мере, об одной попытке экспериментально оценить роль обучения и лингвистических ассоциаций для абсолютного опознавания. Испытания

АБСОЛЮТНОЕ РАЗЛИЧЕНИЕ РЕЧИ И РЕЧЕПОДОБНЫХ ЗВУКОВ 299

проводились для нескольких координат сложных речеподоб-ных звуков (Хаус, Стивене, Сандел и Арнолд — House, Stevens, Sandel and Arnold).

Применялись четыре группы образцов (А, В, С и D), в разной степени приближавшихся к звукам речи. Образцы каждой группы делились на подгруппы. Сигналы каждой подгруппы квантовались по заданному числу координат, причем количество информации, приходящееся на один сигнал, составляло З дв. ед. Например, сигналы группы А получались фильтрацией случайного шума с помощью одиночного резонансного контура. Они квантовались по координатам время—интенсивность—частота. Образцы подгруппы Ay квантовались по одной координате соответственно восьми позициям резонансной частоты контура, которая менялась в пределах от 500 до 5000 гц. Соответствующие значения полосы пропускания находились в пределах от 300 до 3120 гц. Интенсивность и длительность (300 мсек) были фиксированными. В отличие от Аь образцы группы Ai квантовались соответственно двум возможным положениям максимума спектра шума по оси частот (820 или 3070 гц), двум значениям длительности (150 или 450 мсек). В остальных подгруппах (от A2 до Л6) применялось различное сочетание координат с квантованием в диапазоне, ограниченном упомянутыми предельными значениями.

Образцы В были также элементарными сигналами, свойства которых в большей степени приближались к свойствам речевых сигналов. Их временные и спектральные характеристики подобны соответствующим характеристикам слогов типа «гласная—согласная». Гласная имитировалась возбуждением одиночного резонансного контура импульсами частотой 125 гц. Резонансная частота была равной 300 гц, а полоса пропускания— 60 гц. Согласная формировалась также фильтрацией белого шума одиночным контуром. Сигналы В квантовались по координатам: резонансная частота и ширина полосы пропускания контура при фильтрации шума (диапазон частот 500—-5000 гц, пределы изменения ширины полосы — от 100 до 1000 гц); интенсивность шума (±14 дб); длительность паузы между гласной и согласной (от 10 до 180 мсек). Общая длительность всегда была равной 350 мсек. Как и в группе А, квантование для ?i осуществлялось по одной координате соответственно восьми значениям частоты при фиксированных интенсивности и длительности, а для B7 — по трем координатам {два значения частоты, два значения интенсивности и два значения длительности паузы).
Предыдущая << 1 .. 102 103 104 105 106 107 < 108 > 109 110 111 112 113 114 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed