Научная литература
booksshare.net -> Добавить материал -> Электротехника -> Гвоздева В. А. -> "Основы построения автоматизированных информационных систем" -> 3

Основы построения автоматизированных информационных систем - Гвоздева В. А.

Гвоздева В. А., Лаврентьева И. Ю. Основы построения автоматизированных информационных систем — M.: ИНФРА-М, 2007. — 320 c.
ISBN 978-5-8199-0315-5
Скачать (прямая ссылка): osnovais2007.djvu
Предыдущая << 1 .. 2 < 3 > 4 5 6 7 8 9 .. 109 >> Следующая

6
Работы по информационной супермагистрали, в частности связанные с созданием электронных библиотек, развернувшиеся во многих странах мира в середине 1990-х годов, в значительной мере оживили интерес к проблемам текстового поиска. Возникли такие совершенно новые направления как обнаружение информации в глобальной компьютерной сети Интернет, текстовый поиск, мультиязыковой поиск.
Отечественные разработки раннего периода. В нашей стране работы в области систем текстового поиска активно проводились в ряде научно-исследовательских институтов Академии наук и других ведомств еще на ранней стадии формирования технологий текстового поиска. Одним из лидеров в развитии этих работ являлся Всесоюзный институт научно-технической информации (ВИНИТИ), который до настоящего времени остается крупнейшим в мире центром научно-технической информации, обрабатывающим огромный поток информации в различных областях знаний, выпускающим многочисленные реферативные издания, тематические указатели и другие библиографические материалы. Поэтому не случайна его заинтересованность в создании и использовании эффективных современных технологий текстового поиска.
В связи с проводившимися в нашей стране в 50-60-е годы работами по машинному переводу исследовались подходы к моделированию естественных языков, принципы создания тезаурусов и другие проблемы. Разрабатывались методы построения больших машинных словарей с эффективной техникой поиска, поддержки пользовательских интерфейсов на основе естественного языка, а также общие принципы построения информационно-поисковых систем. Результаты этих исследований нашли применение в создании систем текстового поиска на основе русского и ряда иностранных языков.
Большой вклад в создание технологий и инструментария текстового поиска в нашей стране в последующие годы внес также Международный центр научно-технической информации (МЦНТИ, Москва), Институт научной информации по общественным наукам Академии наук (ИНИОН) и другие, ряд крупных библиотек страны, институты Сибирского отделения Академии наук, Институт математики Белоруссии, Институт кибернетики Украины и многие другие организации.
7
В 60-е годы был выполнен ряд новаторских исследовательских проектов, оказавших определяющее влияние на дальнейшее развитие технологий текстового поиска. Один из таких пионерских проектов, посвященный проблемам полнотекстового поиска на основе естественных языков, был выполнен в 1962-1965 г. под руководством Джерарда Сэлтона (Gerard Salton) в Гарвардском и Кор-нельском университетах. Идеи, положенные в основу экспериментальной системы SMART (Salton's Magical Automatic Retriever of Texts), стали ключевыми для многих дальнейших разработок. Одно из главных достоинств системы SMART состояло в том, что она позволяла исследовать различные автоматизированные методы анализа текстов и оценивать качество текстового поиска, сравнивать результаты обработки запросов при различных методах поиска.
В этот же период группой Кирилла Клевердона (Cyril W. Cleverdon) из колледжа по аэронавтике в Крэнфильде (Англия) была предложена методология сравнения средств индексирования документов в системах текстового поиска, основанная на использовании специально разработанных указанной группой тестов для поисковой системы. Проведенные эксперименты в научной литературе стали называться крэнфильдскими экспериментами. Выполненные их авторами исследования позволили установить, в частности, что автоматическое индексирование не уступает по качеству ручному индексированию. Этот вывод имел важное значение для развития функциональных возможностей систем текстового поиска.
Крэнфильдские эксперименты продемонстрировали также полезность тестовых коллекций текстовых документов и запросов для проведения сравнительной оценки систем текстового поиска. Одной из первых таких коллекций была созданная в Крэнфильде в конце 60-х годов коллекция из 1400 документов и 225 запросов. К сожалению, первоисточники, представляющие результаты исследований по сравнению систем индексирования и по анализу факторов, влияющих на производительность средств индексирования, труднодоступны.
Крэнфильдские тесты получили широкое признание и в течение длительного времени использовались при проведении экспериментов с системами текстового поиска. Впоследствии были созданы другие аналогичные тестовые коллекции.
8
Проводятся работы по сравнению возможностей различных систем текстового поиска, общему анализу состояния их разработок и определению перспективных направлений развития. Эта деятельность концентрируется в рамках работы авторитетной международной конференции по текстовому поиску TREC (Text Retrieval Conference), учрежденной в 1992 г. в США.
В 60-х годах практически одновременно были созданы гибкий испытательный стенд для проведения экспериментов с различными методами поиска и качественная методология оценки их результатов, что существенным образом способствовало быстрому прогрессу в области текстового поиска.
Теоретические достижения исследований 60-х годов стали в последующие два десятилетия основой многочисленных практических разработок систем текстового поиска с использованием различных моделей поиска и на основе различных естественных языков. Этот период характеризуется значительными продвижениями в развитии методов и организации систем текстового поиска. Начала формироваться индустрия коммерческого программного обеспечения для систем текстового поиска, чаще называемых в тот период, как уже отмечалось, информационно-поисковыми системами (Information Retrieval Systems — IRS).
Предыдущая << 1 .. 2 < 3 > 4 5 6 7 8 9 .. 109 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed