booksshare.net -> Добавить материал -> Медицина -> Чистович Л.А. -> "Физиология речи. Восприятие речи человеком" -> 63

Физиология речи. Восприятие речи человеком - Чистович Л.А.

Чистович Л.А. , Венцов А. В., Гранстрем М.П. Физиология речи. Восприятие речи человеком — Л.: Наука, 1976. — 388 c.
Скачать (прямая ссылка): fizrech1976.djvu

Предыдущая << 1 .. 57 58 59 60 61 62 < 63 > 64 65 66 67 68 69 .. 159 >> Следующая

155
был на 12 дБ ниже уровня интенсивности конечного сегмента. Разница между стимулами заключалась в том, что стимул А состоял из трех сегментов (уровень интенсивности среднего сегмента был на 6 дБ ниже начального уровня), а стимул Б — из двух сегментов.
По предположению, стимулу А должна соответствовать последовательность марок границ, характерная для сочетания ГСГ — за первой маркой начала следует марка конца. Стимулу Б должна соответствовать последовательность марок, характерная для
1235^

i
\12дВ

Рис. 0.14. Схематическое изображение трехсегментного (А)'ш двухсегмент-
ного (Б) стимулов. Обозначения см. в тексте.
Рис. 6.15. Обнаружение первого гласного в трехсегментных двухсегмент-
ных стимулах.
Но оси абсцисс — длительность интервала от начала стимула до момента возрастания его интенсивности; по оси ординат — относительное количество случаев, когда стимул воспринимался как последовательность ГСГ. 1 — трехсегментный стимул (Л на рис. 6.14); 2 и 3 — двухсегментный стимул (Б на рис. 6.14). Остальные обозначения см. в тексте.
слога СГ — за первой маркой начала следует еще одна марка начала.
Длительность среднего сегмента в стимуле А (?2) (и соответствующей части первого сегмента в стимуле Б) равнялась 75 мс. Переменным параметром была длительность ^ (рис. 6.14).
В таблице, записанной на пленку, стимулы обоих типов следовали в случайном порядке. Испытуемые должны были определять, является ли стимул одним гласным, слогом СГ или сочетанием ГСГ.
Полученные данные (% ответов ГСГ) приведены на рис. 6.15 (сплошные кривые). Штриховой кривой приведены данные работы [85], где применялись только стимулы типа Б.
Данные для трехсегментного стимула А практически совпали с данными, полученными ранее (см. раздел 6.1.2) для последовательностей посылок гласного, разделенных паузами. 50% ответов ГСГ соответствует длительности первого сегмента (^), равной
156
35 мс (^+^=110 мс). Таким образом, если у отрезка гласного выделяется конец, обнаружение гласного может осуществляться достаточно быстро.
Для восприятия двухсегментного стимула Б как сочетания ГСГ требуется большая длительность первого сегмента. 50% ответов ГСГ приходится на значение длительности, равное 170 мс. Судя по тому, что и при 200 мс ГСГ воспринимается еще не в 100% случаев, максимальная задержка фонемной интерпретации первого отрезка может, очевидно, превышать 200 мс. Если верны приведенные выше соображения о связи максимальной задержки с длиной отрезка сигнала, хранимого в «сенсорной» памяти, то длина этого отрезка должна быть не меньше 200 мс.
Вся сумма данных, приведенных в разделах 6.1.1—6.1.3, подтверждает представление о том, что слоги обрабатываются последовательно и что понятие слога используется при членении потока на элементы. Для формирования в модели понятия слога необходимы такие промежуточные понятия, как марки начала и конца отрезка. Вопрос о том, как и где образуются эти марки, тесно связан с проблемой описания сигнала в сенсорной памяти.
6.2. ОПИСАНИЕ СИГНАЛА НА ВХОДЕ ФОНЕТИЧЕСКОГО ИНТЕРПРЕТАТОРА
До сих пор мы говорили о том, что отрезок сигнала, обрабатываемый фонетическим интерпретатором, можно представить себе как картинку, изображающую или динамическую спектрограмму этого отрезка, или кривые параметров сигнала на этом отрезке. Сейчас необходимо более точно определить, что можно понимать под картинкой и какие допущения скрываются за предположением о том, что интерпретатор «видит» картинку.
Картинкой естественно считать последовательность из п равно-отставленных (на Л х) временных отсчетов значений или спектра сигнала, или его параметров (частот формант, основного тона, огибающей и т. д.).
Говоря, что фонетический интерпретатор «видит» картинку стимула на временном интервале т4=«Дт, мы подразумеваем, что он одновременно имеет на входе информацию о всех п отсчетах и что упорядоченность значений изображения стимула по оси т воспроизводит порядок появления этих значений стимула во времени. Это означает, что мы допустили, что до интерпретатора имеется память. Элементы этой памяти образуют упорядоченную шкалу, на которой отображается время. Память, отвечающая этим требованиям, может быть реализована или в виде набора линий задержки, где каждая линия имеет п отводов с интервалами Ат, или в виде упорядоченного множества запоминающих элементов, в которые последовательно, по мере поступления сигнала, записываются значения его временных отсчетов.
157
В случае первого предположения (линии задержки) мы имеем дело с «временным окном», мимо которого скользит изображение. При этом возникает проблема выбора моментов времени, когда это изображение будет передаваться на вход интерпретатора. В случае второго предположения, если ък не превышает длительности слога, возникает проблема управления записью и стиранием информации.
При представлении сигнала картинкой появляется неприятный эффект: одному и тому же слогу, многократно произнесенному одним и тем же диктором, будут соответствовать разные изображения. Это обусловлено случайными колебаниями темпа речи и тем, что движения разных артикуляторных органов не являются идеально синхронизированными. В результате возникает очень сложная проблема временной нормализации изображения. Нормализация должна логически предшествовать распознаванию.

Предыдущая << 1 .. 57 58 59 60 61 62 < 63 > 64 65 66 67 68 69 .. 159 >> Следующая