Типология коллекций. Базы данных

Главная       Учебники - Компьютеры      Электронная информатизация и электронные ресурсы

 поиск по сайту     

 

 

 

 

 

 

 

 

 

 

содержание   ..  60  61  62  63  64  65  66  67  68  69  70  ..

 

 

7.2. Типология коллекций. Базы данных

Свойства и типология коллекций для целей нашей книги во многом определяются видом продукции, доминирующим для данной компании, данного поставщика. С этой точки зрения можно классифицировать имеющиеся коллекции по типу основного продукта:

• полнотекстовые электронные журналы;

• полнотекстовая справочная литература:

• полнотекстовые официальные документы;

• патенты и стандарты;

• мультимедийные и полнотекстовые учебно-методические материалы;

• электронные книги разной направленности:

• базы данных различного рода.

В этом списке все ясно, как и ясна условность классификации. В предыдущих главах мы почти ничего не говорили о базах данных, поэтому остановимся на этом подробнее. Конечно, изучению баз данных посвящено большое число публикаций, есть ряд монографий и учебников, основополагающие моменты излагаются в курсах информатики. Тем не менее некоторая детализация нужна в рамках настоящей главы. Мы не будем изучать типологию баз данных, имея в виду реляционные, сетевые и иерархические типы; не будем рассматривать особенности механизмов СУБД (система управления базами данных) и целый ряд других специальных и узкопрофессиональных моментов. Наша задача — подчеркнуть, что базы данных являются своего рода электронной коллекцией (то есть можно говорить не только о документальных или музейных электронных коллекциях) и что базы данных — самостоятельный вид электронных ресурсов. исторически, может быть, самый первый.

Базы данных. Первыми видами электронных ресурсов, предназначенных для пользования широкой публики были библиографические, фактографические и реферативные базы данных. И в наше время использование баз данных составляет один из ключевых компонентов работы научных библиотек. К сожалению. в российских библиотеках обслуживание внешними базами данных ведется не очень активно по сравнению с зарубежными библиотеками; может, дело в том. что центры научно-технической информации, действующие в 69 регионах России, взяли на себя эту ношу. Однако сегодня и эта ниша практически закрывается.

Формальное определение базы данных представлено в ГОСТ 20886 «Организация данных в системах обработки данных. Термины и определения» и повторено в ГОСТ 7.70—96 «Описание баз данных и машиночитаемых информационных массивов. Состав и обозначение характеристик»: «База данных — совокупность данных, организованных по определенным правилам. предусматривающим общие принципы описания, хранения данных и манипулирования данными, независимо от прикладных программ». Там же «банк данных» определяется как автоматизированная информационная система, состоящая из одной или нескольких баз данных и системы хранения, обработки и поиска». Эти определения не раскрывают основные особенности баз данных. Мы предлагаем несколько иное определение: «База данных (БД) — структурированный тематический отобранный массив информации, состоящий из большого набора однотипных элементов».

Число элементов («записей») в БД от сотен до нескольких миллионов, хотя база данных может состоять и из нескольких записей. Каждый из элементов БД имеет одинаковую структуру (состоит из одинакового набора «полей» или «областей»). Число
полей — от 2 до сотни, в зависимости от характера использования базы данных заполнение некоторых полей может быть обязательным. а некоторых — факультативным; поля могут делиться на подполя. Размер отдельной записи может быть ограничен каким-то количеством знаков или слов. Основное свойство БД — возможность проводить поиск информации и другие действия по любым выбранным полям или по их произвольной комбинации, а также по некоторым заранее определенным под-полям (в английской литературе их называют иногда «access points» — «точки доступа») во всем массиве базы данных. Если сравнить с поиском данных, занесенных в таблицы, то есть на двумерном или многомерном пространстве, то наличие полей в базе данных позволяет проводить поиск необходимой информации намного точнее и быстрее. Если представить себе некие образы, то поиск данных идет в искусственно суженной и заранее заданной области параметров, «в коридоре», а не на «широкой поляне».

Нужно заметить, что все еше существует определенная несогласованность в понимании того, какие базы данных используются в библиотеках, каковы их объем и параметры. Из-за этого могут одинаково учитываться и крошечные, в десятки записей базы данных, и гигантские, состоящие из миллионов записей. Столь же существенно, идет ли речь о базах данных собственного производства либо это имеющиеся на серверах библиотеки чужие материалы или закупленные библиотекой материалы (на пользование которыми получена лицензия)? Или вообще упоминаются бесплатные базы данных, размешенные в Интернете, адреса которых были включены в библиотечный каталог или рекомендательные списки. Дело в том. что генерация баз данных — сложный процесс, требующий участия библиотекарей, библиографов, программистов и технологов; для предоставления доступа к созданной «на стороне» базе данных нужны другие специалисты. Каждая из поименованных позиций отражает возможности и одновременно амбиции библиотеки, и наведение минимального порядка в определениях поможет проводить обоснованные сравнения и анализ.

В контексте данной главы нам следует также обратить внимание читателя, что очень часто в профессиональной литературе (особенно в англоязычной по библиотечно-информацион-ным проблемам) фактически любая коллекция электронных документов, так или иначе связанная с поисковой системой, именуется базой данных. Например, обращение к коллекции текущих поступлений полнотекстового электронного журнала называется обращением к базе данных. Так же будет звучать и обращение к ретроспективной коллекции и т. д.

В конечном счете электронный каталог библиотеки — это тоже база данных, снабженная специальными поисковыми средствами для работы с библиографической информацией. Одной из первых в мире специализированных систем, условно скажем СУБД (хотя для данного случая это действительно условно), была известная разработка ЮНЕСКО CDS/ISIS, по которой, кстати, все еще работают сотни библиотек в Италии, Испании. Аргентине (включая национальную), странах бывшего СССР. Даже столь популярная в России и странах СНГ система автоматизации библиотек ИРБИС (разработка ГПНТБ России) во многом использовала идеи CDS/ISIS, и только последние, новые версии ИРБИС 64 уже полностью переписаны другими программными средствами. Огромным преимуществом CDS/ISIS было то, что система специально проектировалась как И ПС для библиотечно-информационных массивов и по скорости и результативности поиска превосходила многие коммерческие разработки СУБД универсального плана. CDS/ISIS всегда бесплатно поставлялась библиотекам всего мира и сыграла огромную роль в развитии и становлении библиотечной автоматизации и создании библиографических баз данных.

Систем управления базами данных (СУБД, DBMS — Data Base Management System) существует очень много, назовем лишь некоторые, самые популярные: ORACLE, SQLbase, Adabas, SYBASE и др.

В настоящее время трудно найти производителя любой массовой или многотиражной продукции, который не имел бы собственной базы данных — касается ли это описаний самой продукции, поставщиков материалов и услуг, потребителей и, конечно, каталогов всех видов и т. п. Как некий пример такого рода — базы данных книготорговых организаций, посредников, поставщиков. В этом случае содержание базы данных играет в
общем-то вспомогательную роль, помогая быстрее найти необходимый документ или услугу. Однако существует множество организаций, для которых основным поставляемым на рынок товаром является само содержание баз данных, и это в первую очередь — поставщики информационной и, естественно, библиографической продукции.