booksshare.net -> Добавить материал -> Физика -> Арратуна Р. -> "Оптические вычисления" -> 118

Оптические вычисления - Арратуна Р.

Арратуна Р. Оптические вычисления — М.: Мир, 1993. — 441 c.
Скачать (прямая ссылка): opticheskievichesleniya1993.pdf

Предыдущая << 1 .. 112 113 114 115 116 117 < 118 > 119 120 121 122 123 124 .. 175 >> Следующая

показана большая степень общности между всеми этими дисциплинами. Во
многих случаях это является результатом переноса основных идей из одной
области в другую. Использование архитектуры, включающей память общего
доступа, обсуждаемой в разд. 10.3.2, является именно таким случаем.
Hearsay, впервые разработанная для системы понимания речи [4],' была
успешно применена в системах обработки естественного языка и экспертных
системах.
Ниже более детально обсуждается каждая из этих способностей символьных
вычислений, при этом особое внимание уделено сути лежащих в основе этого
методик. После этого для каждой из областей применения символьных систем
будут описаны основные трудности и недостатки существующих систем. Каждый
из подразделов завершается кратким обзором интеллектуальных возможностей
существующих и проектируемых машин, а также анализом проблем и
критических параметров вычислительных систем.
10.3.2. Понимание речи
При разработке систем понимания речи основные усилия были приложены к
обеспечению компьютерных систем необходимыми знаниями и разработке
методов фильтрации посторонних шумов с целью достижения понимания машиной
непрерывной речи в реальном времени. К большому сожалению для
разработчиков компьютерных систем люди произносят слова не одинаково.
Таким образом даже системы, ориентированные на узнавание речевых входных
сигналов (без обязательного понимания ее), сталкиваются с задачей
различать слова независимо от личности говорящего, скорости его речи,
любых диалектов или акцентов, словарного запаса, пропущенных слогов и,
наконец, что не менее важно, фонового шума окружающей среды.
Это, очевидно, представляет трудную задачу, поскольку сами люди не
обладают надежной на 100% не зависящей от говорящего системой понимания
речи. Существуют проблемы понимания речи, связанные с тем, что соседние
слова произносятся слитно, что типично для произношения географических
названий, таких как "Лонг Айленд", которые часто произносят как
"Лонгойлэн". Так же возникают трудности с различными диалектами, где
слово "ойл" (нефть) произносится в разных частях страны как "ол" или как
"оул", и очень часто приходится из контекста подбирать значения словам
или пропущенным фразам. Это последнее обстоятельство заключает в себе
большие трудности для поиска знаний и проведения рассуждений в речевых
системах, поскольку предъявляет серьезные требования к использованию
методик сравнения с образцом для
298
Часть IV. Символьные вычисления и искусственный интеллект
идентификации слов, а также к использованию знаний для понимания значений
слов и их интерпретации. Вопрос состоит в том, как и где применить знания
(рис. 10.11).
Был разработан ряд методик, основанных на использовании знаний в речевых
системах, но двумя наиболее совершенными из них являются системы
распознавания отдельных слов (IWR) и понимания непрерывной речи (CSU)
[11]. Система распознавания отдельных слов основывается на идентификации
слов при раздельном произнесении слов во входном речевом сигнале, как,
например,
"гелий-неоновый.. .лазер.. .сломался" или "погода.. .сегодня..
.дождливая".
Это делается с целью уменьшения числа проблем, связанных с идентификацией
начал и окончаний слов. Задача идентификации слова из преобразованного
акустического входного сигнала все еще остается, и в этом случае она
может быть выполнена методом сопоставления с образцом. Данный процесс
(рис. 10.12) включает в себя прием входного сигнала, идентификацию
основных признаков, таких как вариации основных звуков, а также начала и
окончания слова. Следующий шаг - динамическое изменение временного
масштаба, за счет чего подстраивают длину произнесенного слова к длине
образца (шаблона), используемого для сравнения. Примером этого являются
слова "гелий-неоновый" и "Карибское море", которые иногда произносятся
так:
"гелий-неоновый" "Карибское море"
"ге-е-лий не-о-навый" "Ка-риб-ско-е мо-ре"
"ге-лий ни-оновый" "Ка-рибское море",
при этом каждый из вариантов произносится с разной скоростью.
Для приведения длин слов к стандартной величине сигнал, являющийся
функцией времени, расширяют или сжимают, чтобы сделать его совместимым с
опорной длиной образца. Особенности этого "стандартизированного слова"
затем сравниваются с образцом, хранящимся в памяти системы, а для
сравнения слова с его копией в памяти используются взвешенные
количественные метрики, такие как показаны на рисунке.
На данном этапе основные трудности встречаются в процессах низкого
уровня. Представления о требованиях к скорости вычислений дает тот факт,
что обычно на расшифровку одного слова требуется около 500 вычислений
количественных коэффициентов. При этом динамическая система изменений
масштаба времени приводит данное слово к стандартному фрагменту речи
длительностью 500 мс [13]. Для количественных оценок можно полагать, что
полное число операций умножения или
Глава 10. Оптика и символьные вычисления
299
вычисления внутреннего произведения на одно слово составляет от 5 до 10

Предыдущая << 1 .. 112 113 114 115 116 117 < 118 > 119 120 121 122 123 124 .. 175 >> Следующая