booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 124

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu

Предыдущая << 1 .. 118 119 120 121 122 123 < 124 > 125 126 127 128 129 130 .. 149 >> Следующая

Невозможно переоценить огромные выгоды такого метода исследования и конструирования устройств обработки сигналов. Пользуясь методами цифрового моделирования, можно исследовать и оценить работу целой системы, прежде чем будет изготовлена хоть одна ее деталь. Единственная плата за это — работа моделируемой системы не в реальном времени. В данном случае коэффициент времени составлял 172 к 1, т .е. обработка 1 сек речи требовала 172 сек машинного времени. Однако развитие цифровых методов и увеличение скорости счета будут соответственно уменьшать этот коэффициент.

Другое направление в разработке вокодера завершилось созданием цифрового полувокодера с временным уплотнением (Ягги; Ягги и Масон — Jaggi; Jaggi and Mason). В этом устройстве применена ИКМ, и предназначено оно для работы со скоростью 9600 дв. ед./сек. Нулевой канал устройства может иметь верхнюю граничную частоту или 800 гц, или 950 гц по выбору. В первом случае оставшийся до 4000 гц участок перекрывают 12 вокодерных фильтров, во втором — 11. Отсчеты нулевого канала берутся с удвоенной максимальной частотой и квантуются 5 разрядами. Спектральные каналы отсчитываются 50 раз в секунду (64 раза в секунду при нулевом канале 950 гц); нижние три канала после квантования кодируются трехзначными кодовыми комбинациями, верхние — двузначными. При этом амплитуды спектральных каналов подвергались нормализации. Временное уплотнение и разделение передаваемых ИКМ данных выполнялись с помощью устройств современной цифровой техники.

корреляционные вокодеры

337

8.4. Корреляционные вокодеры

Полосный вокодер показал, что разборчивость речи в значительной степени определяется формой мгновенного амплитудного спектра. Можно ожидать, что ту же информацию переносит и любое другое эквивалентное определение формы спектра. Одним из описаний квадрата спектра амплитуд является функция автокорреляции. Соотношения между этими величинами уже были подробно рассмотрены в разделе 5.1. Поэтому можно ожидать, что определение речевого сигнала его кратковременной функцией автокорреляции будет эквивалентно полосному вокодеру во временной области.

В гл. V кратковременная функция автокорреляции определена как параметр задержки т:

t

Ф(т. *)= j7(W + T)?fr-X)d>s («Л)

-OO

где k(t) = 0 при ^<0 — весовая функция или временная апертура [обычно это импульсная реакция физически реализуемого фильтра нижних частот, см. ур-ние (5.15)]. В частном случае, когда k(t) =2ае — 2at =h2(t), функция ф(т, t) может быть связана с мгновенным спектром мощности, получаемым с помощью измерительного прибора:

гр(о, t) = \FК І) \\

где

F(®,t)=jf (X) h (t - X) е-ішХ d X. (8.2)

— OO

Действительно, было показано, что

»hl °°

Ф (т, t) = -^- j* К t) eimzdx, (8.3)

— OO

и

OO

грК 0= j е-^'Ф(т, t)e~imxdx. (8.4)

—OO

Здесь измеряемый мгновенный спектр мощности [та величина (вернее, квадратный корень из нее), которая используется в полосном вокодере], есть преобразование Фурье от произведения весовой е-"1'11 и автокорреляционной ф(т, t) функций. Та-

338

системы синтетической телефонии

ким образом, информацию о спектре можно выразить функцией корреляции. Испытано несколько методов применения этой связи для передачи речи (Хаггинс — Huggins, 1954; Шредер — Schroeder, 1959, 1962; Кок —Kock; Биддалф — Biddulph) l).

Схема автокорреляционного вокодера показана на рис. 8.82). B верхней части схемы показана передача основного тона, ко-

ИыОелитель основного тони входная речь

Диализатор Сигнал основного тона

Выравт тель спектра.

Ta-

Линия Задержки

•0

Согласованная нагрузка

нагрузка

<РНЧ

Wo)

Уплотнение и передача

Синтезатор

Источник t"*" возбуждения

•0

Линия задержки ХВыходнаи Полное синтези-отражение рованная речь

Рис. 8.8. Автокорреляционный вокодер (Шредер, 1959, 1962)

торая осуществляется так же, как и в полосном вокодере. В нижней части схемы речевой сигнал поступает на спектральный выравниватель, который фактически извлекает из спектра выходного сигнала квадратный корень. Необходимость этой операции обусловлена тем, что после автокорреляционной обработки мы должны получить функцию корреляции, преобразование Фурье которой есть спектр мощности (т. е. квадрат спектра амплитуд) входного сигнала. Хотя речь, спектр которой возведен в квадрат, вполне разборчива, она отличается неестествен-

') Gm. также * В. Е. Муравьев, Г. И. Чечерникова.

2) В корреляционном вокодере применен предложенный в СССР гармонический косинусный синтезатор речи. Возможность реализации такого анализатора на линии задержки была указана в нашей первой публикации (Пирогов). Корреляционный вокодер с гармоническим косинусным синтезатором независимо от работ, выполненных в США, был построен к продемонстрирован В. Е. Муравьевым. Легко видеть, что корреляционный вокодер относится к классу ортогональных систем синтетической телефонии, см. далее, п. 8.7.5 (прим. ред.).

КОРРЕЛЯЦИОННЫЕ ВОКОДЕРЫ

339

ными изменениями интенсивности и ударений. Поскольку квад-рирование спектра в данном методе неизбежно, оно учитывается с самого начала

Предыдущая << 1 .. 118 119 120 121 122 123 < 124 > 125 126 127 128 129 130 .. 149 >> Следующая