СОЗДАНИЕ, ХРАНЕНИЕ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ И РАБОТА С НИМИ

Главная       Учебники - Компьютеры      Электронная информатизация и электронные ресурсы

 поиск по сайту     

 

 

 

 

 

 

 

 

 

 

содержание   ..  40  41  42  43  44  45  46  47  48  49  50  ..

 

 

ГЛАВА 5. СОЗДАНИЕ, ХРАНЕНИЕ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ И РАБОТА С НИМИ

 

 

Цель составления документа — пронести через пространство и время, от человека к человеку зафиксированную мысль, факт, сведения, эмоции, результаты творчества. В обеспечении этих процессов и состоит работа над документом. Между конечными этапами жизненного цикла документа реализуется несколько видов работы. Из них неизбежными и необходимыми являются: создание, раскрытие содержания и очень часто — хранение (временное или постоянное). Мы постараемся изложить эти этапы последовательно — от момента создания до обеспечения долговременной сохранности. Понятно, что содержание документа является определяющим фактором при выполнении всех видов обработки, именно ради сохранения, передачи или раскрытия содержания все и делается. При этом некоторые виды обработки оставляют содержание незатронутым (копирование, доставка, хранение), а в ряде случаев операции проводятся над самим содержанием (реферирование, цитирование). Можно выявить типологические различия и несколько иным способом, выделив в одну группу семантическую обработку документа — классификацию, индексирование, реферирование, селекцию, поиск, дробление на части, цитирование, составление рефератов, дайджестов и избранного, группирование тематических подборок (клиппингов) и тематических коллекций. В другую группу можно отнести те виды работы с документом, которые не связаны непосредственно с его содержанием: создание, раскрытие содержания (конечно, имеется в виду техническая, а не творческая сторона создания), доставка документов. Говоря о создании документа, то есть фиксации информации на машиночитаемом носителе, мы предельно коротко перечислим основные виды носителей и их свойства. При этом сканирование можно рассматривать как один из способов

создания, а также копирования документа. Косвенно, конечно, содержание учитывается при принятии решения о копировании или заказе на доставку и т. д. Еше одно замечание о сканировании: если дальнейшая технология предполагает проведение операции распознавания символов, то некое первичное проникновение в содержание, начальное обращение к тематике документа все же проводится — на уровне слова и контекста.

Особое место занимают проблемы авторского права при копировании (рукописное, ксерокопирование, фотокопирование, микрофотокопирование, сканирование), и мы также излагаем современное состояние дел в этой области.

Завершают наш анализ те виды работ, которые непосредственно связаны с содержанием документа: составление поискового образа, поиск (напомним, что поиск осуществляется, как правило, не по самому документу и его содержанию, а по его поисковому образу), реферирование, цитирование, агрегирование. обеспечение сохранности (мы в данном разделе излагаем мотивацию работ по сохранению, а она опирается на содержательную сторону документа).

Помимо комплектования электронными ресурсами, которые были созданы вне библиотеки, современные компьютерные информационные технологии открывают широкие возможности по производству электронного ресурса своими силами. Существенно то, что можно не только публиковать традиционные для библиотеки ресурсы (базы данных и электронные каталоги, указатели, электронные версии собственных публикаций, другие профессиональные издания), но и в массовом порядке создавать копии материалов из печатного фонда. Раскрытию документа для широких масс способствует его распределение — рассылка, доставка, публикация.

Нужно всемерно развивать разработку инструментов идентификации и поиска нового знания и соответствующих документов (как необычный пример из смежной области укажем, что в США издаваемая отдельно программа телевидения TV Guides приносит больше дохода, чем три ведущие программы, вместе взятые).

Библиотечные работники в практической деятельности с электронными ресурсами зачастую прибегают к нескольким наиболее простым способам обработки текстов и изображений.
Упомянем о кодировке кириллического и латинского алфавитов. которая ведется с использованием широко известного и распространенного стандарта ASCII (американских стандартных кодов для обмена информацией). Намного больше возможностей может открыть использование универсального, применимого практически к любым видам алфавитов и знаковых систем кода UNICODE.

Для стандартной транслитерации — представления в латинице знаков различных кириллических алфавитов (русского, украинского, сербского и т. п.) — чаще всего используются две схемы: таблицы ISO (Международной организации по стандартизации) и таблицы Библиотеки Конгресса США*. Особо стоит вопрос об использовании кодовых таблиц для передачи знаков русского алфавита в Интернете. К сожалению, их существует более 15, и конверсия бывает не совсем простым делом. Чаше других применяются такие таблицы, как Windows 1251, KOI 8-R. ISO 8859-5, CP 866. Разметка текстов (выделение курсивом или жирным шрифтом, выбор типа шрифта и его размера, обогащение текста встроенной графикой и т. п.) ведется с помощью языка разметки SGML (Standard Generalized Mark-up Language). Развитие гипертекстовых методов обработки (формирование гиперсвязей) и обогащение текста звуком и анимацией и т. п. базируются на языке разметки HTML (Hyper Text Mark-up Language). Дальнейшее развитие состоит в разработке методов семантического контроля текста или другого сетевого документа на базе языка разметки XML (eXtended Mark-up Language).