Теория и практика информационно-поисковых систем

  Главная      Учебники - Лингвистика     Введение в прикладную лингвистику (Баранов А.Н.) - 2001 год

 поиск по сайту

 

 

 

 

 

 

 

 

 

 

 

содержание   ..  30  31  32  33  34  35  36  37  38  39  40  ..

 

 

§4.

Теория и практика информационно-поисковых систем

Резкое возрастание объемов научно-технической информации в кон­це пятидесятых — начале шестидесятых годов XX столетия привело к бурному развитию информационных технологий и созданию автома­тизированных информационно-поисковых систем — ИПС или АИПС. Структура и организация информационно-поисковых систем определя­лись следующей проблемной ситуацией:

  1. имеется множество документов (текстов, фрагментов текстов);

  2. имеется коммуникативное задание, выраженное в запросе на инфор­мацию — информационная потребность;

  3. требуется найти в множестве документов тексты, соответствующие запросу и удовлетворяющие коммуникативную интенцию пользова­теля.

Особенно актуальной задача разработки информационно-поисковых систем оказалась для различных министерств и ведомств, заваленных грудами официальной и технической документации.

4.1. Основные понятия информационного поиска

Понятия запроса и документа стоят в центре информационной де­ятельности. В процессе поиска информации происходит сравнение со­держания запроса и документа. Степень соответствия документа запросу задается категорией релевантности. Каждый документ в ИПС получает определенный информационный код — кодируется с помощью инфор­мационно-поискового языка. Этот код называется поисковым образом до­кумента (ПОД). Аналогичное выражение на информационно-поисковом языке — поисковое предписание (ПП) — сопоставляется запросу. Соответ­ствие поискового образа документа поисковому предписания называет­ся формальной релевантностью. Действительное соответствие содержания выданного документа содержанию запроса называется смысловой реле­вантностью. Очевидно, что классификация характеристик информацион­ного поиска в значительной степени связана с возможными ошибками и сложностями, которые могут возникнуть в процессе информационной деятельности. Так, документ, релевантный запросу по смыслу, может оказаться не релевантным с формальной точки зрения и не будет выдан ИПС. С другой стороны, в процессе информационного поиска можно получить в выдаче значительный информационный шум — множество документов, формально релевантных, но не являющихся релевантны­ми по смыслу. Возможен и другой случай, когда пользователь не мо­жет адекватно выразить свою информационную потребность: степень соответствия информационного запроса реальной информационной по­требности называетсяпертинентностью. Для обеспечения пертинентности запросов разрабатываются специальные методики, включающие исполь­зование информационных словарей, которые позволяют пользователю более точно формулировать свою информационную потребность.

Результаты поиска могут характеризоваться с двух точек зрения: с точки зрения точности и с точки зрения полноты. Полнота поиска определяется соотношением между количеством выданных релевантных (по отношению к данному запросу) документов к общему числу реле­вантных документов, имеющихся в информационной системе. Точность поиска задается отношением между количеством выданных релевантных документов к общему количеству документов в выдаче:

В идеальном случае количественное выражение полного и точного поиска равно единице.

 

 

 

 

 

содержание   ..  30  31  32  33  34  35  36  37  38  39  40  ..