booksshare.net -> Добавить материал -> Медицина -> Чистович Л.А. -> "Физиология речи. Восприятие речи человеком" -> 52

Физиология речи. Восприятие речи человеком - Чистович Л.А.

Чистович Л.А. , Венцов А. В., Гранстрем М.П. Физиология речи. Восприятие речи человеком — Л.: Наука, 1976. — 388 c.
Скачать (прямая ссылка): fizrech1976.djvu

Предыдущая << 1 .. 46 47 48 49 50 51 < 52 > 53 54 55 56 57 58 .. 159 >> Следующая

Особый интерес представляет проблема синхронизации изменений в мелодическом контуре с элементами речевого потока. На рис. 5.25, А приведен контур частоты основного тона в вопросительной фразе СГСГ. Аналогичный вид имеет контур частоты основного тона фразы СГСГ, но произнесенной с утвердительной интонацией: подъем частоты происходит на безударном гласном, а понижение — на ударном [123]. Возникает вопрос, заключается ли разница в параметрах самих контуров (скоростях изменения частоты, разнице минимальной и максимальной частот и т. п.) или важно положение контура относительно ударного гласного (происходит ли повышение частоты на ударном или безударном гласном).
5.4. ОБ ИЗМЕРЕНИИ ПРОСОДИЧЕСКИХ ПАРАМЕТРОВ В НЕПРЕРЫВНОМ РЕЧЕВОМ ПОТОКЕ И ПРАВИЛАХ ПРИНЯТИЯ РЕШЕНИЙ О НИХ
В начале настоящей главы мы говорили о том, что в оперативную память просодическая информация записывается одновременно с фонемной, т. е. в одни и те же ячейки памяти. Другими словами, это означает, что при записи в оперативную память просодическая информация должна быть представлена в дискретном виде.
Возникает вопрос, как должна быть организована система выделения и измерения просодических признаков, чтобы из физических параметров речевого сигнала, часть которых непрерывна по своей сущности, можно было получить последовательность
9*
131
дискретных признаков для записи в оперативную память одновременно с фонемной информацией.
К такому результату может, очевидно, привести одна из двух измерительных процедур. В первой сегментация речевого сигнала предшествует выделению просодических параметров, и последние получаются в результате обработки сигнала на соответствующих участках речевого потока. Вторая предполагает, что выделение марок сегментации и непрерывное преобразование исходного речевого сигнала в описание по признакам производится в независимых каналах, а в момент появления сигнала окончания некоторого отрезка речевого потока производится считывание «показаний» измерителей и запись результатов в соответствующую ячейку оперативной памяти. Следует иметь в виду, однако, что обе процедуры должны обеспечивать возможность измерения не только локальных изменений в сигнале и мгновенных значений просодических параметров, но и таких «средних» характеристик, как темп и громкость речи данного диктора, средняя высота голоса за время произнесения некоторых слов или словосочетаний во фразе. Последняя может использоваться, например, для выделения авторских слов в прямой речи [132]. Попытаемся теперь рассмотреть, насколько успешно эти процедуры обеспечивают выделение и использование просодической информации.
Длительность любого элемента в речевом потоке может быть измерена только при условии, что предварительно были выделены метки начала и конца этого элемента. Это значит, что при использовании длительности звуков речи, а также и темпа, измеряемого как период следования гласных, для извлечения просодической информации сегментация в принципе должна предшествовать измерению.
Уже с громкостью дело обстоит сложнее. Суть в том, что и измерение громкости, и сегментация базируются, очевидно, на одних и тех же исходных сигналах — огибающей плотности импульсации в частотных каналах. Различие заключается в том, что для сегментации необходимо дифференцирование огибающей (или полосовая фильтрация в сравнительно высокочастотной области), а для измерения громкости — фильтр низких частот или полосовая фильтрация, но в значительно более низкочастотной области. Таким образом, системы сегментации и измерения громкости, работая с одним и тем же входным сигналом, оказываются в значительной степени независимыми. Это позволяет предположить, что для измерения громкости обе процедуры могут быть использованы с одинаковой вероятностью: на фильтр нижних частот может подаваться сегментированный сигнал и марки сегментации могут использоваться для считывания результатов измерения. Однако когда мы говорим о двух процедурах измерения громкости и пытаемся анализировать возможные различия в конечных результатах, мы имеем в виду то обстоятельство, что любая модель измерения громкости в слуховой системе человека
132
имеет сглаживающее звено (фильтр низких частот). Так как интенсивность гласных и согласных в речевом потоке различна, то в зависимости от величины постоянной времени такого фильтра громкость звуков может оказаться разной при использовании разных измерительных процедур: в одном случае на фильтр будет подаваться непрерывный сигнал, в другом — он будет работать в переходном режиме.
Изменения высоты речевого сигнала, определяющие мелодический компонент интонации, создаются изменением частоты основного тона, управление которым в процессе речеобразования осуществляется непрерывно [3- 29]. Результирующий контур частоты, как правило, представляет собой достаточно сложную кривую, для описания которой применяют ответ сложного апериодического фильтра на ступенчатое возмущение [268, 414]. Если бы при восприятии просодической информации человек пользовался процедурой «анализа через синтез», а любые мелодические изменения можно было описать реакцией одного и того же фильтра, то достаточно было бы указать, на каком элементе в речевом потоке произошло ступенчатое изменение управляющего сигнала и какова была величина этого изменения. Однако анализ экспериментально полученных контуров частоты основного тона показывает, что параметры фильтров должны зависеть от темпа речи и могут изменяться от произнесения к произнесению, а точность аппроксимации, используемая в качестве критерия правильности теоретических построений, практически не зависит от формы аппроксимирующей функции и может быть достаточно высокой даже при использовании линейно изменяющихся функций [30]. Оказалось также, что при задании на контуре частоты основного тона ряда «особых» точек восприятие мелодии слушателем почти не зависит от вида траектории изменений частоты между этими точками [2911. Меловероятно в этих условиях, чтобы человек пользовался методом «анализ через синтез» при восприятии мелодических изменений в речи. Скорее он пользуется результатом измерения некоторых параметров в контуре изменяющейся частоты основного тона. Что это за параметры и как они могут измеряться в речевом сигнале, будет показано в главе 12. Здесь мы попытаемся рассмотреть только вопрос о том, на каких отрезках в речевом потоке производится их измерение.

Предыдущая << 1 .. 46 47 48 49 50 51 < 52 > 53 54 55 56 57 58 .. 159 >> Следующая