Основные типы электронных документов

Главная       Учебники - Компьютеры      Электронная информатизация и электронные ресурсы

 поиск по сайту     

 

 

 

 

 

 

 

 

 

 

содержание   ..  30  31  32  33  34  35  36  37  38  39  40  ..

 

 

 

4.2.3. Основные типы электронных документов

Рассмотрим сложившуюся сегодня типологию электронных документов.

1. Полнотекстовые документы с широкими возможностями форматирования текста в произвольном по размеру и по типу шрифте, включения каких-то дополнительных компонентов (иллюстрации, звук, видео и т. д.). возможностями поиска по всему тексту, наличием гиперсвязей (отсылок к сетевым документам), возможностью автоматического агрегирования, то есть составления персонально ориентированных подборок. Особое место в этом ряду занимают полнотекстовые электронные журналы, которые незаметно, понемногу идут на смену традиционным печатным журналам. Основа нелинейности электронных материалов — так называемые гиперсвязи (другие названия —гиперотсылки или гиперссылки). Сетевые ресурсы, как прави-ло, снабжены гипертекстовыми ссылками, но вы вольны их использовать или не использовать по своему усмотрению и желанию. Огромное значение имеет возможность быстро перейти от ссылки на цитируемую работу к ее полному тексту. Такого рода системы уже имеются, например CrossRef, о которой мы скажем подробнее в других главах настоящей книги.

2. Таблицы с расширенными функциями обработки данных и демонстрации результатов (спрэдшиты). Если даже говорить о сравнительно простых программах, таких, как Microsoft Excel, то имеется возможность для однажды введенных данных проводить довольно широкий функциональный набор статистических. арифметических и алгебраических действий, изменять конечный результат автоматически с изменением входных данных, а итоговый продукт представлять самым разнообразным способом — таблицами, линейными или столбчатыми многомерными и многоцветными графиками, гистограммами, кольцевыми и круговыми диаграммами и т. п. Особую роль в технологии цифровых документов играют встроенные в специальные программы вспомогательные таблицы кодировок и таблицы соответствия. Пожалуй, главнейшая из них — Таблица Американского стандарта кодирования обмена информацией (American Standard Codes of Information Interchange. ASCII), которая уста-навливает соответствие буквенных символов и цифр. Для российских библиотекарей и русскоязычных пользователей очень важными являются также таблицы соответствия (кодировок) кириллических знаков, которые работают в драйверах клавиатуры. монитора, передачи данных через Интернет и т. д.

3. Различные базы данных — фактографические, адресные, библиографические, реферативные, полнотекстовые с возможностями поиска по многим точкам доступа (введенным полям или областям) и по всему тексту или содержанию. В некоторых профессиональных публикациях слова «база данных» понимаются достаточно широко. Например, не структурированную формально коллекцию полнотекстовых документов с возможностями поиска также называют «база данных». Формальное определение базы данных дано в ГОСТ 20886—85 «Организация данных в системах обработки данных. Термины и определения» и повторено в ГОСТ 7.70—96 «Описание баз данных и машиночитаемых информационных массивов. Состав и обозначение характеристик»: «База данных — совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения данных и манипулирования данными, независимо от прикладных программ». Там же «банк данных» определяется как «автоматизированная информационная система, состоящая из одной или нескольких баз данных и системы хранения, обработки и поиска». Эти определения не раскрывают основных особенностей баз данных. Мы предлагаем несколько иное: «База данных (БД) — тематически собранный и структурированный массив информации, состоящий из большого набора однотипных элементов». Число элементов («записей», в английской литературе entries или records) — от сотен до нескольких миллионов, в принципе объем БД может быть сколь угодно большим. Каждый из элементов БД имеет одинаковую структуру (состоит из одинакового набора полей или областей). Число полей — от 2 до нескольких сотен, в зависимости от характера использования базы данных. Заполнение некоторых полей может быть обязательным, а некоторых — факультативным; поля могут делиться на подполя. Размер отдельной записи может быть ограничен каким-то количеством знаков или слов. Основное свойство БД — возможность проводить поиск информации и другие действия по любым выбранным полям или по их произвольной комбинации, а также по некоторым заранее определенным подполям (в английской литературе их называют иногда «точки доступа» — access points) во всем массиве базы данных. Если сравнить с поиском данных, занесенных в таблицы, то есть на двумерном или многомерном пространстве, то наличие полей в базе данных позволяет проводить поиск необходимой информации намного точнее и быстрее. Можно представить себе некие образы, в которых поиск данных идет в искусственно суженной и заранее заданной области параметров, «в коридоре», а не на «широкой поляне». Конечно, для нас существенно важными и интересными типами баз данных являются библиотечные электронные каталоги различного рода и библиографические указатели.

4. Электронные рисунки и изображения с возможностями обработки файлов по размерам, цвету, пространственным параметрам изображения и построения многомерных изображений.

 

По сути, в этих документах к координате пикселя (точки изображения) «привязываются» параметры цветности. В эту же группу можно включить и цифровые карты, и картографическую информацию, в которой оказывается привязанной к определенным координатам («к месту») информация не только географического характера, но и политическая, экономическая, культурологическая и т. д.

5. Аудиозаписи и музыка, видео, компьютерная анимация. Быстро растущим направлением в производстве такого рода электронных документов является цифровое телевидение и цифровые средства массовой информации. Характерный пример — перевод в цифровой формат всего архива новостей известной телевизионной компании CNN. Столь же быстро выросшим бизнесом оказалась практика заимствования из Интернета полюбившихся классических и популярных мелодий, мелодических образцов звонка на мобильном телефоне, картинок, поздравительных открыток и т. п. Выгрузка музыкальных произведений из сети становится в последние годы крупнейшим бизнесом. Например, лондонский магазин iTunes предлагает своим посетителям выбор из миллиона песен, из них некоторые доступны исключительно через Интернет. При стоимости одной выгрузки 79 центов, магазин продает в месяц более 200 тыс. произведений. Конкурирующей (или дополняющей) является система iPod, по сути, портативное карманное устройство с объемом памяти 40 Гб, обеспечивающим запись более 10 тыс. песен. iPod превращается в США и Европе в некоторый социальный инструмент, поклонники которого создают специальные клубы (MP3Jing) по коллективному прослушиванию особо популярных мелодий.

6. Компьютерные программы, в том числе программы и управляющие команды непосредственного исполнения.

7. Вирусы как особый тип компьютерных программ, способный к самостоятельному размножению и продвижению по Сети.

8. Мультимедийные материалы (совмещение разных видов ресурсов, например текста и звука; текста, изображения, звука; текста и анимации и т. д.). Выделение в особую группу мультимедийных материалов — это сегодня, возможно, и лишнее, дань прошлой ограниченности печатных документов и восхищение богатейшими иллюстративными возможностями данного типа электронных документов. Ясно, что вышеупомянутые цифровые коллекции СМИ фактически и есть мультимедиа.

9. Агрегированные подборки — новый вид электронных публикаций, которые пока изучены недостаточно. Фактически, это особый вид персональных тематических публикаций, подборка из электронных журналов и других электронных ресурсов, составленная по вашему вкусу и потребностям, которая рассылается на ваш адрес. Эти подборки ничем не отличаются по содержанию от полнотекстовых документов, с которых мы начинали классификацию документов в данном разделе, и от публикаций новостных СМИ. Для нас существенным классификационным признаком является автоматизированный характер формирования этой группы документов — «на лету».