Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 117

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 111 112 113 114 115 116 < 117 > 118 119 120 121 122 123 .. 149 >> Следующая


Один из подходов к достижению поставленной цели состоит в следующем. Надо определить физические характеристики процессов образования и восприятия речи, а также языка и ввести эти характеристики в систему пе-

ПОЛОСНЫЕ ВОКОДЕРЫ

319

редачн. По существу этн характеристики представляют информацию, которую не нужно передавать. В идеальном случае этн характеристики описываются небольшим числом независимых параметров, служащих в качестве сигналов, несущих информацию. Системы передачи, в которых сознательно стремятся использовать этн факторы, обычно называются системами синтетической телефонии.

Из гл. Ill и VII следует, что речевые сигналы могут быть описаны через свойства механизма, генерирующего сигнал, т. е. через свойства речевого тракта н его возбуждения. Такой подход открывает широкие возможности для эффективного кодирования речи. Фактически большой (класс систем компрессии спектров основывается на таком методе. Эта идея поясняется иа рис. 8.1. Сюда включены трн операции. Во-первых, автоматический анализ сигнала с целью получения параметров, описывающих возбуждение !речевого тракта и ре-зонаисную структуру тракта; во-вторых, уплотнение и передача указанных параметров и, наконец, восстановление ,исходного сигнала по принятым параметрам.

Материалы, обсуждавшиеся їв гл. IV, свидетельствуют о том, что в периферической части слухового тракта производится своего рода кратковременный частотный анализ. Анализ включает механическую фильтрацию, процессы, эквивалентные выпрямлению, и процессы нервного кодирования, при которых, по-видимому, на ранних ступенях происходит интегрирование. При этом некоторые детали исходного речевого колебания теряются и становятся несущественными для восприятия. Предполагается, что в системе передачи также можно отбросить эту информацию, не оказывая прн этом существенного влияния на воспринимаемый сигнал. Тем самым удалось бы уменьшить требуемую пропускную способность канала. Подобным образом можно было бы использовать и другие особенности сигнала; например, ограничения на последовательность звуков в данном языке нли паузы естествеииого происхождения в связанной речи. Короче говоря, почти все результаты теории речеобразования, теории слуха и лингвистики имеют непосредственные отношения и к синтетической телефонии. Это будет показано в следующих разделах, где предполагается рассмотреть ряд систем синтетической телефонии.

8.1. Полосные вокодеры

8.1.1. Изобретение Гомера Дадли

Синтетическая телефония окончательно оформилась после изобретения более двадцати лет назад Дадли аппарата для анализа и синтеза речи, названного вокодером. За последнее время название вокодер, происходящее от двух английских слов

Источник возбуждения

Модельрече-вого тракта
-К»

Шфовмация' О дозауждении

Канал передачи,.

1__Г

Информация о речевом тракте

LL

Анализатор

6

Речевой сигнал на Входе

Рис. 8.1. Представление механизма речеобразования в виде источника возбуждения и фильтрующей системы

320

СИСТЕМЫ СИНТЕТИЧЕСКОЙ ТЕЛЕФОНИИ

Voice—голос, Coder—кодирующий аппарат, применяется большей частью в качестве термина, обозначающего класс систем синтетической телефонии, в которых разделяют функцию возбуждения и передаточную функцию артикуляционной системы. Первый вокодер, называемый теперь спектральным полосным вокодером, описан в литературе больше, чем любая другая система. Тем не менее для полноты картины и в качестве удобного отправного пункта целесообразно повторить здесь еще раз краткое описание этой старой идеи, приведшей к созданию новых принципов передачи речи.

Согласно схеме кодирования (рис. 8.1) в вокодере используется одна важная особенность речеобразования и одна особенность восприятия. Учитывается, что возбуждением речевого тракта может служить либо квазипериодический звук с широким спектром (на звонких звуках), либо случайный сигнал, также с широким спектром (на глухих звуках). Учитывается также, что правильность восприятия в большой степени зависит от сохранения формы мгновенного спектра амлитуд. Блок-схема первого вокодера Дадли показана на рис. 8.2 (Дадли, 1939, Ь).

Характеристики возбуждения измеряются в верхней части схемы. Основной тон квазипериодических звонких звуков измеряется с помощью частотного дискриминатора и счетчика. Электрическое напряжение, получаемое на выходе счетчика, пропорционально частоте основного тона. Это напряжение пред-

Канал

Диализатор передача Синтезатор

Канал основного тона

Q-

Исходная речь

Диск рими- ,, нот op Wacwmoftep

Фильтр ^ (0-25гцП

?Схема предыскажений

Спектральные каналы

/7<Р Выпр. <РНЧ

о-зоо
гц



0-25 гц





К 9 другим спектральным каналам, перекрывающим через 300 гц диапазон частот JO0SOO0 гц

Рис. 8.2. Блок-схема первого полосного ©оиодера (Дадли, 1939, Ь);

ПОЛОСНЫЕ ВОКОДЕРЫ

321

ставляет собой частоту основного тона и ее изменения во времени. Сигнал основного тона сглаживается фильтром нижних частот с полосой пропускания 25 гц. Глухие звуки обычно имеют малую мощность в диапазоне частот основного тона, и частотомер от них не срабатывает. Таким образом, наличие напряжения на выходе измерителя основного тона свидетельствует об озвученности, а величина напряжения указывает величину основного тона.
Предыдущая << 1 .. 111 112 113 114 115 116 < 117 > 118 119 120 121 122 123 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed