Научная литература
booksshare.net -> Добавить материал -> Электротехника -> Гвоздева В. А. -> "Основы построения автоматизированных информационных систем" -> 12

Основы построения автоматизированных информационных систем - Гвоздева В. А.

Гвоздева В. А., Лаврентьева И. Ю. Основы построения автоматизированных информационных систем — M.: ИНФРА-М, 2007. — 320 c.
ISBN 978-5-8199-0315-5
Скачать (прямая ссылка): osnovais2007.djvu
Предыдущая << 1 .. 6 7 8 9 10 11 < 12 > 13 14 15 16 17 18 .. 109 >> Следующая

Многозадачные операционные системы (ОС) типа Windows позволяют одновременно создавать и редактировать тексты, а компьютерные сети объединяют в автономные рабочие группы. Такая рабочая группа может обходиться без бумажных документов до полного завершения работы над системой (проектом). Только когда работа закончена, можно составить итоговый бумажный документ. Основным препятствием на пути создания безбумажной технологии стоит проблема ввода исходных данных в электронном виде. Эта проблема решается путем создания и внедрения специальных аппаратов и специальных средств перевода информации разного вида в электронную форму. Автоматизация ввода информации в компьютер, т. е. перевод бумажных документов в электронный вид, осуществляется путем сканирования.
Сканирование — это технологический процесс, в результате которого создается графический образ бумажного документа.
Существуют разные виды сканеров, но в основе их действия лежит один и тот же принцип: документ освещается светом от специального источника, а отраженный свет воспринимается светочувствительным элементом. Минимальный элемент интерпретируется сканером как цветная или серая точка. В результате сканирования документа создается графический файл, в котором хранится растровое изображение документа (состоит из пикселей). Количество точек определяется как размером изображения, так и разрешающей способностью сканера. Данные о сканерах см. в разд. 1.4.
Проблема автоматического распознавания текста созданного точечного графического изображения является сложной. Эта зада-
33
ча решается с помощью специальных программных средств, называемых средствами распознавания образов. Реально это стало возможно только в последние годы. Появились специальные программы, которые распознают разные шрифты и даже рукописный текст. В нашей стране наиболее распространены программы распознавания текста на русском языке Fine Reader и CuneiForm.
Например, программа Fine Reader 7.0 компании ABBYY Software предназначена для распознавания текстов на русском и многих других языках, а также и для распознавания смешанных двуязычных текстов. Программа позволяет сканировать, распознавать, редактировать распознанный текст, проверять его орфографию и сохранять документы. Fine Reader работает с разными моделями сканеров в среде Windows и поддерживает стандарт TWAIN. Для изменения настроек сканера служит кнопка «Опции» панели «Scan&Read». Когда сканер выбран, активизируются флажки в диалоговом окне. Если установить флажок TWAIN драйвера, то сканирование будет проходить через TWAIN интерфейс, если иначе — напрямую. Флажок «Показывать опции перед началом сканирования» нужно устанавливать только в том случае, когда бумажные страницы документа существенно отличаются друг от друга, и тогда перед сканированием каждой страницы будет открываться диалоговое окно настройки сканирования, чтобы регулировать качество процесса. Сам процесс сканирования проходит в автоматическом режиме. После сканирования следует приступить к распознаванию.
Окно программы Fine Reader 7.0 (рис. 1.4) содержит строку меню, панели инструментов и рабочую область. В левой части рабочей области расположено окно «Пакет». Здесь содержится список графических документов, которые нужно преобразовать в текст. В верхней части окна программы (под панелью стандартных инструментов) находятся панели для сканирования, распознавания, проверки и сохранения документов. Панель «Scan&Read» содержит все операции преобразования (через диалоговые окна) бумажного документа в электронный графический. Далее по горизонтали расположены панели «Открыть», «Распознать», «Проверить», «Сохранить». После операции сканирования (выполняемой подключенным сканером) программа отображает значки полученной страницы в панели «Пакет». При распознавании текста сначала в окне рабочей области содержится отсканированный
34
графический документ для распознавания, затем текстовый документ после распознавания с выделением фрагментов, распознанных неоднозначно. Дополнительные врезки и данные могут запутать естественный порядок распознавания текста, поэтому, прежде чем включить текст в документ, его разбивают на блоки (сегментируют), содержащие цельные фрагменты. Блоки распознают последовательно и нумеруют. Полученный блок вставляется в порядке нумерации в документ. Этап распознавания выполняется программой без вмешательства пользователя, за исключением случая, когда после распознавания идет процесс проверки и исправления ошибок. Распознанный текст представляется в окне в виде форматированного текстового документа. Он теряет связь с исходным изображением. Программа цветом выделяет символы, которые она распознала неоднозначно, и это упрощает поиск ошибок. Имеется возможность проверки грамматики. Полученный текст можно сохранить в виде форматированного или неформатированного документа. Есть возможность прямой передачи полученного текста программе Word, Excel или в буфер обмена.
;а -1, ^ ^ ч< jPyCCKO-АнГПИИОиа -jjj *Ь^ЙЙЧ.-»Ь" &»І Г :?::: :.ЛЛ:. : .
j ¦>-¦*] _Оанировдть ........Распинать ........ Пзстерить__Ссдра-ить
Предыдущая << 1 .. 6 7 8 9 10 11 < 12 > 13 14 15 16 17 18 .. 109 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed