Поиск документов и информационно-поисковые системы

Главная       Учебники - Компьютеры      Электронная информатизация и электронные ресурсы

 поиск по сайту     

 

 

 

 

 

 

 

 

 

 

содержание   ..  50  51  52  53  54  55  56  57  58  59  60  ..

 

 

6.1. Поиск документов и информационно-поисковые системы

Электронных документов в мире насчитывается уже миллиарды и поиск необходимого среди этого множества — одна из важнейших задач библиотечных работников. Большинство систем поиска базируется на использовании вторичного документа. то есть его описания, как правило библиографического. Цель создания вторичного документа — провести структуризацию фонда по тематике (или по другим признакам), облегчить поиск оригинала, сэкономить время на ознакомлении с содержанием. Для текстовых документов вторичным документом является библиографическое описание, а также реферат, аннотация. предмет или системные рубрики и индексы. Для музыкальных библиотек, архивов или музеев используются другие описания.
Некоторые основы правильной организации поиска надо все же осветить. Отметим, что целью документного поиска является нахождение и выдача соответствующих запросу пользователя документов или их описаний.

Документы, отвечающие запросу пользователя, называются релевантными. Для организаций, как правило, тематического поиска в крупных библиотеках, научно-технических центрах, архивах применяются информационно-поисковые системы (ИПС). В настоящее время в связи с резким возрастанием объемов документной информации и проникновением компьютерных технологий во все сферы жизни общества стати широко использоваться автоматизированные ИПС или АИПС.

В учебном пособии В. Л. Захарова 1381 на очень доступном языке излагаются основы теории и практики информационного поиска, а для непосредственного знакомства с ИПС мы рекомендуем использовать работу А. И. Кудрявцева и О. Б. Назаренко [39|.

Подчеркнем основные понятия информационного поиска.

ИПС — упорядоченная совокупность документов и информационных технологий, предназначенных для хранения и обеспечения поиска документов или данных. Главное, что должны обеспечивать ИПС. — это поиск и хранение. Сейчас практически все И ПС автоматизируются, но можно встретить еще много неавтоматизированных ИПС.

Информационный поиск может быть документным (документальным) и фактографическим, и, соответственно. И ПС делятся на документальные и фактографические.

Документальные ИПС обеспечивают поиск по тематическим запросам в массиве документов с последующим предоставлением пользователю некоторого подмножества этих документов (копий). Фактографические ИПС обеспечивают хранение, поиск и выдачу непосредственно данных: технических характеристик, объектов и явлений, научных фактов, экономических показателей, адресов, названий, количественных параметров и т. д.

Главное отличие между документальным и фактографическим поиском заключается в подходе к семантике документов: в документальных системах описывается смысл документов с точки зрения их предметного содержания, а в фактографических системах фиксируются признаки и значения объектов; соответственно для каждого вида поиска существуют свои поисковые средства 1381.

Иногда выделяется и третий тип ИПС — информационно-логические системы, отвечающие на запросы, на которые в информационной базе нет явного ответа. Ответ формируется на основе алгоритмической генерации из имеющихся документальных или фактографических ИПС.

Запросы на поиск представляют собой информационные потребности пользователей, сформулированные на естественном языке. В результате перевода запроса на ИПЯ (информационно-поисковый язык) образуется поисковый образ запроса, или поисковое предписание. Далее ИПС формирует поисковый образ документа — текст, состоящий из лексических единиц ИПЯ. выражающий содержание документа или информационного запроса и предназначенный для реализации информационного поиска. Основная задача при создании поискового образа документа — как можно полнее и точнее отразить содержание документа, сохранив при этом предельную краткость описания. Затем в результате обработки И ПС выдает краткое описание (библиографию) документов или сами документы (полные тексты).

Оценка эффективности поиска является большой теоретической и практической проблемой. Главные функциональные показатели ИПС — это полнота и точность, которые основываются на разделении документов на релевантные и нерелевантные. а также на выданные и невыданные.

Под полнотой поиска понимается мера, вычисляемая как отношение количества выданных релевантных документов к общему числу релевантных документов, содержащихся в массиве информации.

Точность поиска — это соотношение количества выданных релевантных документов и общего числа документов в выдаче.

Традиционное понимание документального поиска состоит в том, что поиск проводится по всему тексту документа (или по его поисковому образу); при этом в качестве запросов чаще всего выступают ключевые термины (слова) или их логическая комбинация. Автоматизированный документальный поиск может быть организован на основе ряда технологий, в том числе

поиска по полному тексту документа или поиска по гипертекстовым ссылкам. Это особенно актуально при поиске в Интернете, что и составляет сегодня одну из важнейших проблемных областей в организации электронных информационных ресурсов в целом.