booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 132

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu

Предыдущая << 1 .. 126 127 128 129 130 131 < 132 > 133 134 135 136 137 138 .. 149 >> Следующая

ПФ ' ПФ ПФ

200-3200 гц

+2

-2

75-1925 гц

\Х2ШЕ

200-3200

ПФ —Ш.

Рис. 8.14. Блок-схема системы деления—умножения частоты типа «В'обэмк» (Богерт, 1956)

раза и выходной сигнал ограничивается по спектру полосовыми фильтрами B1, B2, B3, полосы пропускания которых в два раза уже. Сигналы с выходов фильтров складываются и образуют групповой сигнал, спектр которого в два раза уже исходного.

В месте приема сигнал снова расфильтровывается на три полосы—Вь B2, B3. В каждой полосе путем умножения на 2 происходит восстановление исходных полос. Результирующие напряжения складываются, образуя выходной сигнал. При артикуляционных испытаниях системы вобэнк с участием 48 слушателей и 10 дикторов получена разборчивость согласных около 80%- Испытания разборчивости непреобразованного сигнала, но ограниченного по спектру полосой 200-=-1700 гц, проведенные в тех же условиях, дали результат около 66%.

Исследовались и другие системы деления спектров, подобные системе вобэнк (Секи, Марку и Даге—Seki, Marcou and Daghet). В одном из предложений (система кодимекс) рассматривается потенциальная возможность деления спектров в восемь раз (Даге).

В одном из исследований подробно рассмотрены возможности применения оптических и механических струнных фильтров, а также ультразвуковых запоминающих устройств для деления и умножения спектров, причем особое внимание обращено на отдельные составляющие спектра сигнала (Вилбиг—Vilbig, 1950, 1952; Вилбиг и Хаазе—Vilbig and Haase, 1956, b). В результате аналогичных исследований разработан электрический «расширитель спектра» (Гулд—Gould). В нем используется идея увеличения масштаба времени с помощью устройства, показанного на

ДРУГИЕ МЕТОДЫ СОКРАЩЕНИЯ ПОЛОСЫ

357

рис. 8.15. Речевой сигнал фильтруется гребенкой из 32 полосовых фильтров, перекрывающих диапазон от 75 до 7000 гц. Полосы пропускания фильтров до 1000 гц приблизительно равны 100 гц, а далее логарифмически увеличиваются. Удвоение час-

Вход речи

Диодный\ Лпт2\ удвоительГ*\"*І I—

П<Ро

Диодный. удвоитель

л?;

Запись

Воспро заиеа

К]

—I_I
—з»
Диодный удвоитель

Выход речи

Рис. 8.15. «Расширитель» речи с умножителями частоты для получения эффекта расширения шкалы времени (Гулд)

тот в каждой полосе достигается за счет двухполупериодного выпрямления. Большая часть продуктов нелинейности устраняется с помощью полосовых фильтров, ширина полосы которых удвоена по сравнению с исходной. После записи результирующего сигнала и его воспроизведения с половинной скоростью положение спектральных составляющих восстанавливается, но масштаб времени расширяется в два раза.

В целом система деления—умножения спектров с достаточно большим числом фильтров, в полосы пропускания которых попадала одна гармоника основного тона, исследовалась путем моделирования на ЦВМ (Шредер, Логан и Престиджиакомо — Schroeder, Logan and Prestigiacomo). При реализации метода в устройстве, названном «гармоническим компрессором», использовалась гребенка из 50 полосовых фильтров с полосами по 60 гц, перекрывающих диапазон от 240 до 3240 гц. Блок-схема устройства для двукратного сжатия спектра показана на рис. 8.16. На передающей стороне сигналы с выхода полосовых фильтров делятся по частоте в два раза и при сложении образуют групповой сигнал, который по сравнению с исходным сигналом занимает при передаче полосу частот в два раза уже. В месте приема спектральные полосы снова разделяются фильтрами и восстанавливаются с помощью двукратного умножения частоты. Все фильтры и преобразования моделировались на универсальной ЦВМ. По предварительным оценкам на слух передаваемый сигнал по качеству и разборчивости занимает промежуточное положение между сигналом полувокодера с нулевым каналом полосой 700 гц и непреобразованным сигналом исходной полосы частот. Для восстановления спектра в перво-

358

СИСТЕМЫ СИНТЕТИЧЕСКОЙ ТЕЛЕФОНИИ

начальных пределах можно применить воспроизведение, также ускоренное в 2 раза.

В ряде других методов используется квазипериодичность звонких звуков речи. В одном из них предусматривается син-

МО- }4^Н^тН 1/2ПЧ>2|>ф--32Ь0гц

120-W20 ги

1/2Щ ПФ,

ноВлениая речь

Рис. 8.16. Блок-схема гармонического компрессора (Шредер, Логан и Престиджиакомо)

хронная с основным тоном коммутация сигнала для передачи только одного из каждых очередных п периодов (Дэвид и Мак-доналд—David and McDonald, 1956, а). На выходе канала связи принятые сигналы дополняются повторением (и—1) раз переданного периода1). Предложен также метод несинхронного преобразования с исключением части отрезков исходного сигнала, в котором используются подвижные относительно перемещающейся магнитной ленты воспроизводящие головки (Фербенкс, Эврит, Иеиге—Fairbanks, Everitt, Jaeger).

8.7.4. Метод статистического использования пауз речи

(ТАСИ)

Известно, что при переговорах двух абонентов каждый из них в среднем 50% времени молчит, слушая другого абонента. Кроме того, имеются короткие и продолжительные паузы. В среднем абонент занимает канал только на 35—40% времени. На линиях дальней связи с промежуточными усилительными пунктами двусторонние каналы связи обычно обеспечиваются четырехпроводными цепями, т. е. двумя однонаправленными линиями передачи. Каждый абонент имеет отдельные передающую и приемную цепи. Из-за неполной загрузки разговорным сигналом канал каждого направления простаивает 60 — 65% времени. Если между двумя станциями ведется большое число

Предыдущая << 1 .. 126 127 128 129 130 131 < 132 > 133 134 135 136 137 138 .. 149 >> Следующая