Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Деркач М.Ф. -> "Динамические спектры речевых сигналов" -> 46

Динамические спектры речевых сигналов - Деркач М.Ф.

Деркач М.Ф., Гумецкий Р.Я., Гура Б.М., Чабан М.Е. Динамические спектры речевых сигналов — Лв.: Высшая школа, 1983. — 168 c.
Скачать (прямая ссылка): dinamichspektrrechsignal1983.djvu
Предыдущая << 1 .. 40 41 42 43 44 45 < 46 > 47 48 49 50 51 52 .. 53 >> Следующая

ческие спектрограммы следующих фраз: «Федя и Ваня ловили рыбу», «Илюшу мама водит в ясли», «У Левы была собака Бобик», «Летом серый, зимой белый», «По ночам филин ловит мышей», «Шарик роет мох под елкой». Читателю предоставляется возможность, при желании, идентифицировать их самостоятельно. В данном случае задача заключается в том, чтобы осуществить выбор из шести возможных фраз, анализируя отдельные ключевые признаки динамических спектрограмм.
Во фразе «Федя и Ваня ловили рыбу» четко выражен фрикативный шум мягкого глухого щелевого [ф'], за которым следует и—з-образный сегмент с последующей звонкой смычкой [д']. По-видимому, ей соответствует верхняя спектрограмма на рис. 5.3.2. Действительно, дальнейшие фонемные события, выступающие на этой спектрограмме, хорошо укладываются в структуру фразы «Федя и Ваня ловили рыбу».
С глухого щелевого согласного также начинается нижняя спектрограмма рис. 5.3.4, но в ней имеется совсем другая последовательность звуковых явлений. Это, очевидно, фраза «Шарик роет мох под елкой». Здесь на своих местах находятся такие хорошие идентификаторы, как глухие взрывные [п], [т], [к], видна характерная полоса шума глухого [х] и носовые резонансы [м], в нужном направлении движутся форманты, маркируя эффекты палатализованного произношения.
На верхней и нижней (рис. 5.3.3) спектрограммах выделяются в середине фразы сегменты с-образного шума. Это очевидно фразы «У Левы была собака Бобик» и «Летом серый, зимой белый». Конечно, [с] верхней спектрограммы рисунка 5.3.3 принадлежит слову «собака» — там находится и звонкая смычка [б], и глухая смычка со взрывом [к]. И также ясно, что [с] нижней спектрограммы на рис. 5.3.3 принадлежит слову «серый» с его характерным и—з-образным движением формант, переходящим в дрожа-щ'ее переднеязычное [р].
Наконец, легко находим фразу «Илюшу мама водит в ясли» — она изображена на нижней спектрограмме рис. 5.3.2; на ней выделяются характерные шумы звуков [ш] в слове «Илюшу» и [с'] в слове «ясли».
Вполне соответствует структуре фразы «По ночам филин ловит мышей» последовательность акустико-фонетических событий, изображенных на верхней спектрограмме рис. 5.3.4.
Мы надеемся, что приведенный материал динамических спектрограмм и принципы их «чтения», изложенные выше, позволили читателю убедиться в той важной роли, которую играет контекст в расшифровке спектрограмм, о роли формирования текущих предложений в осуществлении процесса восприятия осмысленной речи. В реализации указанных механизмов речевого мышления в значительной мере заключается феномен использования избыточности речевого сигнала, воспринимаемого слушателем. Есть основания думать, что принцип выдвижения словесно-фонемных гипотез о речевом сигнале и их текущей проверки
145
в пространстве фонетически значимых спектрально-временных признаков окажется перспективным в плане построения систем автоматического понимания речи — моделей естественного восприятия речи человеком [13, 36].
5.4. СЛУХОВАЯ СПЕКТРОГРАФИЯ РЕЧЕВЫХ СИГНАЛОВ
Динамическая спектрография речи развивалась в основном в сторону выявления в спектре все большего количества деталей, увеличения чувствительности и динамического диапазона частотно-временных характеристик речевого сигнала. За время 35-летней эволюции приборов «видимой речи» их основные структурные схемы принципиально не менялись. В них по-прежнему используются полосовые фильтры с фиксированной шириной полосы. Если основной интерес исследователя сосредоточен на спектральных особенностях речевого сигнала, он может пользоваться набором узкополосных фильтров шириной 45 Гц, если же он заинтересован в изучении временных подробностей сигнала, в его распоряжении имеются широкополосные фильтры шириной 300 Гц. Практикуется подъем высоких частот, начиная, как правило, с частоты 1 кГц, который может иметь разную крутизну, от 6 до 18 и более дБ на октаву. Этим компенсируется падение интенсивности гармоник в спектре источника голосового сигнала, крутизна которого в сторону высоких частот составляет около 12 дБ на октаву. При помощи указанных приемов на динамических спектрограммах типа «видимой речи», называемых обычно сонограммами, удается визуализировать множество спектрально-временных деталей. Одновременно с этим для увеличения адекватности динамических спектрограмм «видимой речи» и слухового описания речевого сигнала имеется ряд неиспользованных резервов, и в направлении их реализации движется исследовательская и конструкторская мысль. Одна из плодотворных попыток в этом отношении осуществлена в Институте физиологии им. И. П. Павлова, где была разработана модель спектрального слухового анализа [2, 18, 19, 35].
Структура модели основывается на биофизических представлениях о гидродинамике улитки внутреннего уха, а ее частотные характеристики аппроксимируют данные, известные на основании психоакустических и нейрофизиологических экспериментов. Модель воспроизводит только линейные явления слуховой периферии.
Модель выполнена в виде аналогового устройства, в которое входят следующие принципиальные блоки. Первый блок корректирует входной сигнал согласно частотной характеристике среднего уха и базальной части улитки. Далее следует 128 низкочастотных фильтров второго порядка с малыми значениями добротности и понижающейся с возрастанием номера фильтра («координаты») резонансной частотой. Они включены последовательно и развязаны буферными усилителями. Их частотные характеристики умножаются, в результате чего формируются харак-
Предыдущая << 1 .. 40 41 42 43 44 45 < 46 > 47 48 49 50 51 52 .. 53 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed