Сигнал о некоторых понятиях кибернетики - Полетаев И.А.
Скачать (прямая ссылка):
Если меняется высота голоса, говорящего перед, микрофоном, то та же комбинация появится выше или ниже на шинах фильтров подобно тому, как мажорное трезвучие может быть взято на фортепиано в разных тональностях. Решающее устройство реагирует на комбинацию выходов, а не на среднюю высоту тона. Поэтому одна и та же фонема, произнесенная различными голосами, будет одинаково зарегистрирована и превращена на выходе решающего устройства в сигнал данной фонемы, который может быть использован для приведения в действие исполнительного печатающего аппарата или же записан в устройстве памяти для дальнейшего различения слов и фраз. В практически осуществленном варианте такого устройства использовалось 20 фильтров с полосой пропускания около 7з октавы каждый в диапазоне от 125 герц до 8 килогерц. Это 17 Й. А. Полетаев 257
устройство хорошо различало звуки «т, к, м, н, с, ш, и, а, у» и не могло различать звуки «п, ф и р».
Однако такой метод различения фонем обладает по крайней мере двумя недостатками: во-первых, фонемы не всегда соответствуют правописанию, а во-вторых, некоторые фонемы в живой речи могут оказаться неразборчивыми и не будут зафиксированы. К исправлению этих недостатков есть пути. Грамматически правильное написание слова может быть восстановлено сравнением с образцами или выполнением некоторого набора стандартных правил. Для записи неразборчиво произнесенных фонем в одной из конструкций автомата этого назначения было предусмотрено специальное устройство. Оно состояло из набора потенциометров, которые заранее устанавливались в такие положения, которые соответствуют условным вероятностям появления различных фонем после данной. Таким образом, напряжение, соответствующее сигналу следующей фонемы, взвешивается по вероятности, и, если неразборчивая фонема плохо выявлена, оценка по вероятности в большинстве случаев позволяет избежать ошибки.
Проблемы грамматической коррекции записываемого текста принадлежат к кругу тех вопросов, которые решаются при автоматическом переводе текста с языка на язык. Успехи в этой области, достигнутые в последнее время, имеют 'большое принципиальное и прикладное значение. Правда, проблема литературного перевода любого текста еще не решена, но достигнутые успехи позволяют надеяться на разрешимость и этой проблемы.
Автоматический перевод
Перевод делается на электронной быстродействующей цифровой машине, управляемой специальной программой. Составление программы перевода производится один раз, и любая фраза переводится по одной и той же программе. Собственно, вся проблема автоматического перевода и сводится к составлению этой программы и словаря.
Прежде всего, текст должен быть введен в машину. Для этого он кодируется буква за буквой в двоичном алфавите, причем каждая буква изображается двухзначным десятичным числом (табл. 1), закодированным в двоичном алфавите.
Буквы, изображенные в двоичном алфавите, и слова, изображаемые этими буквами, пробиваются в виде перфо-258
Таблица 1
Кодирование букв латинского алфавита с помощью чисел (числа записаны в десятичной системе)
а 16 i 12 Я 23 у 04
b 06 j 18 r 07 z 25
с 22 k 19 s 05 • 31
d 30 I 27 t 21 . 03
е 08 m 11 и 20
f 14 n 15 V 29 пробел 00
g 10 0 28 w 13
h 26 P 24 X 09
раций на ленте, которую «читает» машина. Разумеется, пробивка производится специальным входным устройством с клавиатурой, на которой, как на пишущей машинке, оператор, могущий не знать языка, печатает, например, английскую фразу. Можно, по-видимому, использовать для этой цели и машину, читающую печатный текст.
Чтобы перевести фразу, прежде всего необходимо перевести слова. Для этой цели в устройство памяти электронной цифровой машины предварительно вводится специальный словарь. Словарь размещается в запоминающем устройстве машины и разбивается на английскую и русскую части. В ячейках памяти английской части словаря для каждого слова записываются следующие сведения (разумеется, кодом в двоичном алфавите): само слово (иногда только неизменяемая часть слова без флексии); грамматические сведения о слове, необходимые при переводе; адрес соответствующего русского слова. В русской части словаря в ячейках памяти, адрес которых указан в английской части словаря, записывается русский перевод
Таблица 2
Кодироиание букв русского алфавита с помощью чисел
(числа записаны в десятичной системе)
a 16 к 19 У 20 ю 01
6 06 л 27 Ф 14 я 03
в 13 м 11 X 26 й 18
г 10 н 15 Ц 22 ъ 00
д 30 О 28 я 23 ь 09
e 08 п 24 ut 09
ЛМ 29 р 07 Щ 2
Л1/
3 25 с 05 э 17
и 12 т 21 ы 04
17*
259
слова тоже кодом в двоичном алфавите, но для 0укз русского алфавита (табл. 2).
Слово, введенное в машину, после того как машина «прочла» это слово с -перфоленты и записала его в регистре, сравнивается поочередно со всеми словами словаря. Быстрота вычислений электронной машины позволяет проделать это за короткий срок. Слово текста, записанное кодом в двоичном алфавите, попросту вычитается поочереди из слов, записанных в словаре. Машиной управляет при этом специальная часть программы — пользование словарем. Как только разность равна нулю, т. е. слова совпали, из словаря считывается адрес русского слова, которое и может использоваться для перевода.