Анализ, синтез и восприятие речи - Джеймс Л. Фланаган
Скачать (прямая ссылка):
Действительная же часть нулей при этом увеличивается настолько, что спектр «заполняется» (пунктирная линия на рис. 6.20). В данном случае относительно малое отклонение от симметрии вызывает относительно большое изменение спектра.
Другие приближения к импульсу, создаваемому голосовыми связками. Предыдущие рассуждения относились исключительно к аппроксимации колебаний голосовых связок треугольными импульсами. На самом деле они .могут иметь различную форму, поэтому полезно рассмот-
12
IhJt 12л
Нули
6-й
5-й
!Oft
_h-u
***
3
67t
3-й 2-й
hit
1-й
2я
А
А
Й
N
U
OO
О 2 5 2 5
0,1 1,0 IO
Коэффициент асимметрии,/:
Рис. 6.19. Мнимые части комплексных нулей треугольного импульса как функция асимметрии-. Мнимая частота -нормализована но шт0, а асимметрия лежит в пределах 0<к<оо
S О
Рис. 6.20. Амплитудный спектр двух тре-
У'ГОЛШЫХ ИМПУЛЬСОВ .при k—\ И k= —JJ"
(Даии, Фланаган и Джестрли)
9*
260
СИНТЕЗ РЕЧИ
реть расположение нулей при других простых аппроксимациях. В треугольнике имеются точки разрыва производной. Каково будет, например, влияние устранения одного или нескольких разрывов путем скруглення или сглаживания колебания?
Существует несколько видов симметричных кривых, которые можно рассматривать с точки зрения возможности их использования при аппроксимации колебаний голосовых связок при соответствующем скруглении. На рис. 6.21 в качестве примера по-
iw/2x
iw/2x
k/J/2fC
Шо
[\Ь/?о
Uk
Ut0
Uk
п2/г0
U/ъ
Ьіг0
-^6
-U6
-\-~6
Симметричный Половина Половина Период треугольник синусоиды эллипса косинусоиды
Рис. 6.21і. Четыре симметричные аппроксимации имлульса голосовых связок и их комплексные нули
казаны три такие кривые: половина периода синусоиды, половина эллипса и приподнятая косинусоида. Первые две имеют по две точки разрыва производной, третья—ни одной. Их временные и спектральные функции описываются следующим образом.
Половина периода синусоиды
/(r) = asin?f, 0<(<-^, ? = -u
? t0
/(0 = 0, o>r>-^
p
(6.60)
ЭЛЕКТРИЧЕСКИЕ МЕТОДЫ СИНТЕЗА РЕЧИ
261
Нули расположены в точках со
= + (2я + 1>л = + (2п+1)р, п=1, 2 to
Половина эллипса 4
fit) =
лт0
Nf її"
fit) = о
Ul>f
(6.61)
Здесь нули (кроме точки (0 = 0) совпадают с корнями Ji | 0^0 j . Приподнятая косинусоида
/fc) = a(l-cos?f), 0<;<^,?=^
P т0
/(0 = 0,
о>г>
F (со) = а Г—
?2
2л
Нули спектра лежат в точках
1
(6.62)
со = 4- n? =
2п л
, п=2, 3
Комплексные «ули этих функций изображены на нижней части рис. 6.21. Эти ,картинки свидетельствуют о том, что относительно малые изменения формы импульса и вида скруглення могут оказывать большое влияние на расположение нулей и на вид спектра в области низких частот. Хотя такие нули могут сдвигаться, среднее число нулей на некотором заданном интервале частот в области выше окрестностей — остается неиз-
т0
') У всех этих симметричных колебаний нули !расположены на оси iw.
262
СИНТЕЗ РЕЧИ
менным у всех видов колебаний, а именно один на интервал 1
шириной -' .
T
Предельная плотность нулей источника возбуждения. На высоких частотах средняя плотность нулей также сохраняется. Рассмотрим произвольный импульс от голосовых связок /(/), конечный и не равный нулю на интервале 0</<т0 и равный
тч
нулю за его пределами. Поскольку функция I fit) z~s'dt іолжна
о
быть конечной, она может не иметь полюсов. Положим, что вторая производная f(t) лежит в том же интервале, а первая производная имеет разрывы в точках /=0 и /=?. Оба дифференцирования f{t) не изменяют нулей спектра, кроме точки s = 0, а в моменты начала и конца импульса образуют острые пики с площадями /'(0+) и /'(т0-). Преобразование Фурье после двойного дифференцирования имеет вид
S2^(S) = Jf (t)e~a dt = /'(O+)+ Г (X0J) є""'+ J f"(t)<Tstdt.
o+
Так как f"(t) ограничено 0</<То, интеграл третьего члена должен иметь порядок — или меньше. На высоких частотах он
S
становится малым по сравнению с первыми двумя членами, следовательно, s2F(s) ~\f'(0+) +/'(то_) e_ST°]. Нули лежат в точках
S=--In
t0
/'(г»-)
, . (2п + 1) я
± і -——¦—, п = 0, 1 . . . (6.63)
t0
Однако на низких частотах нули могут располагаться, как показывают проведенные ранее расчеты, гораздо более неравномерно.
Влияние нулей в колебаниях голосовых связок на восприятие. Этот вопрос применительно к реальной речи вполне уме-
;) Приведенные здесь спектры относятся к одиночным импульсам, т. е. они сплошные н определены как преобразования Лапласа или Фурье. Спектры периодически ^повторяемых импульсов являются дискретными линиями с амплитудами — F (mQ0), где F(mQ0)—преобразование Фурье одиночного
2я
импульса на частотах гармоник mQ0=m- , m=l,2,3. . .