booksshare.net -> Добавить материал -> Физика -> Арратуна Р. -> "Оптические вычисления" -> 120

Оптические вычисления - Арратуна Р.

Арратуна Р. Оптические вычисления — М.: Мир, 1993. — 441 c.
Скачать (прямая ссылка): opticheskievichesleniya1993.pdf

Предыдущая << 1 .. 114 115 116 117 118 119 < 120 > 121 122 123 124 125 126 .. 175 >> Следующая

восходящая схема подразумевает использование цифровых методик,
осуществляемых в начале алгоритма для улучшения качества сигнала и
выделения всех признаков, что в целом составляет обработку речи низкого
уровня (рис. 10.11). Последующая обработка высокого уровня состоит в
использовании знаний, которые в данном случае возникают после завершения
обработки низкого уровня. Понятие иерархии характеризует переход от
процедур управления низкого уровня через несколько промежуточных этапов к
управлению, при котором осуществляется взаимодействие знаний.
Данная парадигма не является единственной и, как для случая обработки
непрерывной речи, может быть отнесена с точки зрения ее структуры к
нисходящей иерархии или даже
302
Часть IV. Символьные вычисления и искусственный интеллект
схеме выведения среднего. В каждом из обсуждавшихся случаев, однако,
остались без внимания соображения о том, где и когда знания о проблеме
должны быть найдены и использованы. Если это происходит в начале
процедуры, то речь идет о парадигме нисходящей иерархии; если это
происходит в конце процедуры, как в случае распознавания отдельных слов,
то это относится к восходящей схеме.
В системах понимания естественной речи для ограничения процесса поиска
знаний используются грамматические или лингвистические модели, что
означает ограничение активного словаря до определенного числа возможных
слов в любой момент времени. При ограничении размера пространства поиска
экономится не только время обработки для каждого слова, но и снижается
вероятность неудачи и достигается рост скорости распознавания.
Основная система распознавания естественной речи состоит из акустического
процессора, выполняющего преобразование сигнал-символ, и лингвистического
декодера, применяющего знание для понимания вводимой речи. Типичные
системы распознавания естественной речи могут быть реализованы в двух
вариантах: во-первых, с распознаванием отдельных слов при случайном их
следовании (как, например, для поиска в базе данных) и, во-вторых,
понимание значения непрерывно произносимых предложений. В обоих случаях
имеются не только общие свойства, аналогичные свойствам систем
распознавания отдельных слов, но и различия. Однако главное различие
заключается в разных подходах к разделению слов на фрагменты.
Разделение слов на фрагменты, или определение начала и конца отдельных
слов, является критической проблемой для систем понимания непрерывной
речи. Поскольку слова, произносимые в непрерывной речи, имеют тенденцию
сливаться между собой, то алгоритмы обнаружения конца слова, используемые
в распознавании отдельных слов, не работают. Существует несколько методов
преодоления этой проблемы, и все они являются вариациями алгоритма
динамического изменения временного масштаба, обсуждавшегося ранее.
Последний алгоритм, хотя и является критической процедурой в вычислениях,
но представляет менее трудную задачу, чем сопоставление с образцом или
процесс поиска знаний.
Большинство систем понимания непрерывной речи построены по нисходящей
схеме, ориентированной на знания и использующей знания о проблеме,
обсуждаемой в произносимой речи, для ограничения ожидаемого объема
информации, содержащейся во входном сигнале [11]. Такая, методика была
успешно реализована в системе Hearsay-Ill [12], где каждый вид знаний
может взаимодействовать с частично обработанным входным
Глава 10. Оптика и символьные вычисления
303
сигналом независимо от других типов знаний, как показано на рис. 10.14.
Особенностью архитектуры данной системы является наличие рабочей области
общего доступа, предназначенной для связи между различными "экспертами"
по знаниям. Фактически, позволяя каждому типу знаний оказывать влияние на
входной сигнал, получают по существу развитую "экспертную систему"
индивидуальной речи (см. разд. 10.3.5). Эта концепция области общего
доступа, допускающая взаимодействие между собой большого числа баз
знаний, была успешно использована как в системах понимания естественного
языка, так и в экспертных системах.
Использование эвристического поиска для ограничения объема информации во
входном сигнале имеет свою цену и требует установления компромисса между
общностью выполняемых задач и получаемыми характеристиками. Этот вопрос
составляет предмет рассмотрения данного раздела и затрагивает в настоящее
время практически все вопросы исследований ИИ. Чтобы оценить трудности
достижения указанного компромисса, читателю следует принять к сведению,
что словарный запас английского языка очень велик - 24 тома Оксфордского
словаря английского языка составляют его "священное писание". Хотя
Рис. 10.14. Архитектура системы понимания непрерывной речи Hearsay-Ill,
304
Часть IV. Символьные вычисления и искусственный интеллект
большинство людей в обиходе использует намного меньший словарный запас,
но даже 20 000 слов создают ошеломляющее число возможных комбинаций слов
и число вариантов их произношения. Ранние речевые системы, в которые

Предыдущая << 1 .. 114 115 116 117 118 119 < 120 > 121 122 123 124 125 126 .. 175 >> Следующая