Оцифровка микрофильмов

Главная       Учебники - Компьютеры      Электронная информатизация и электронные ресурсы

 поиск по сайту     

 

 

 

 

 

 

 

 

 

 

содержание   ..  40  41  42  43  44  45  46  47  48  49  50  ..

 

 

5.2.1. Оцифровка микрофильмов

По поручению Немецкого научного общества (DFG) и при поддержке Европейской комиссии по сохранности и доступу

группа ведущих специалистов Германии исследовала проблему «Как защищать ветхие (нестабильные) книги и архивные материалы — оцифровкой или микрофильмированием?».

Конверсия поврежденных, ветхих книг или архивных материалов является эффективным и экономичным способом обеспечения сохранности. Более того, в противовес стремлению просто сохранить или восстановить оригиналы перенос информации с носителя, находящегося в опасности, на не знающий старения носитель означает также обеспечение более широкого и удобного доступа.

Наиболее распространенным носителем в мире, обеспечивающим страховые копии библиотечных и архивных документов, является микрофильм. Микрофильмы имеют то преимущество, что они не подвергаются фундаментальным технологическим преобразованиям и тем самым являются устойчивыми по отношению к будущим переменам. Информация, хранящаяся в аналоговой форме, непосредственно (или с весьма небольшими дополнительными устройствами) доступна человеческому глазу. Усиливающаяся в национальных и международном масштабах стандартизация систем микрофильмирования обеспечивает возможность их применения, невзирая на границы между странами. Создание, дублирование и распространение микроформы стоит недорого, и в то же время микрофильм можно эффективно оцифровать с помощью соответствующих сканеров. Возможность экономичной оцифровки микрофильма позволяет считать его носителем с принципиально растущей совместимостью с требованиями к качеству.

По указанным выше причинам немецкие специалисты предлагают вначале микрофильмировать ветхие материалы, а затем делать оцифровку с микрофильма. Этот подход оправдан и с финансовой точки зрения, даже в том случае, если единственной целью оцифровки является обеспечение более высокого уровня доступа и обслуживания. И при этих обстоятельствах микрофильм как носитель для долговременного хранения, совместимый с любой другой средой, будет в течение длительного срока оправдывать средства, затраченные на его изготовление и обслуживание. Тем самым удастся избежать очень серьезных затрат, связанных с миграцией данных и частыми технологическими и организационными мерами по сохранению читаемости на новых системных платформах.

Приступая к непосредственной оцифровке оригинала, необходимо помнить, что нельзя жертвовать качеством воспроизводства и нельзя допустить утрату данных. Второе может произойти после непродолжительного пользования данными, о сохранности которых не позаботились заранее, не продумали вопросы совместимости или достаточных гарантий надежности носителя информации или аппаратных средств.

Несколько рекомендаций по оцифровке микрофильмов. Если микрофильм высокого качества пригоден как носитель для долговременного хранения, то качество производства оцифрованной версии будет задаваться с учетом тех целей, для которых она делается. Другими словами, оцифровка микрофильма, как правило, не должна нацеливаться на максимально наилучший результат — в отличие от того случая, когда конверсия в цифровую форму ведется прямо с оригинала, находящегося в опасности.

Двухтоновая оцифровка вполне подходит для обработки печатного текста, включая чертежи и графики, другие документы, изготовленные безударными способами печати (пластиковая угольная лента, струйный или лазерный принтер) на панхроматической противоореольной микропленке.

Полутона серого цвета должны применяться для оцифровки следующих видов материалов: рукописей, рисунков карандашом и пером, текстов, напечатанных на пишущей машинке с шелковой лентой, цветных иллюстраций и рисунков, других материалов, где варьируются серые тона; черно-белых и цветных фото.

Серой шкалы с 16 градациями (для передачи которых необходимо 4 бита) вполне достаточно при оцифровке контрастной противоореольной пленки. При оцифровке фильма с полутонами требуется серая шкала со 126 градациями (16-битовая). Оцифровка с применением развернутой шкалы градаций серого цвета предъявляет серьезные требования к хранению и резко удорожает процесс на всех стадиях, поэтому применять эту технологию нужно только при необходимости.

При оцифровке с пленки разрешение определяется размером наименьшего элемента, который следует сделать ясно различимым. Для печатного текста это высота строчной буквы «е», для рукописи — двойная ширина этой же буквы. В соответствии с рекомендациями международного стандарта ISO 6199 введено понятие «индекс качества» (И К) с учетом численного параметра разрешения из «Образцовой таблицы стандарта», выраженного в числе пар линий на миллиметр в зависимости от характерного размера сканируемого изображения (текста). Системы, которые обеспечивают 120 пар линий на миллиметр в центре кадра и по краям, считаются вполне удовлетворительными.

Наивысший И К = 8. приемлемым считается и И К = 5. Дая 2-тоновой оцифровки при И К = 5 необходимое пространственное разрешение вычисляется по формуле: а = 384/И. Для оцифровки с градацией серого цвета а = 256/Л (здесь а — пространственная разрешающая способность в точках на дюйм (dpi), И — высота буквы «е» в миллиметрах).

Воспроизведение буквы «е» высотой I мм (буквы такого размера высотой около 7 пунктов (pi) часто используются в тексте примечаний) с высоким качеством (ИК = 8) потребует пространственного разрешения 615 dpi для 2-тоновой оцифровки и 410 dpi для 256-тоновой; с невысоким качеством (ИК = 3) — 277 dpi для 2-тоновой и 185 dpi для 256-тоновой оцифровки. Имея резерв достижения высокого качества, заложенный в микропленке, вполне достаточно (для огромного большинства возможных применений) проводить оцифровку под среднее качество воспроизведения.

Для ориентировки можно рекомендовать разрешение 350—400 dpi для 2-тоновой оцифровки и 250—300 dpi для полноценной шкалы серого цвета. Изображение должно располагаться нужным образом (т. е. чтобы считывание проводилось без поворотов) и соответствовать возможно большему числу будущих применений. Модельным форматом для данных изображения является обычно формат TIFF (Tagged Image File Format), преимущество которого в том, что он в отличие, например, от формата Windows Bitmap в значительной степени не зависит от платформы, считывается и в дальнейшем обрабатывается на произвольном оборудовании с различными системами и программами. Следует, однако, заметить, что, несмотря на тщательную стандартизацию, формат TIFF допускает некоторые вариации, которые могут оказаться несовместимыми с установленным у вас программным обеспечением. И в этом случае также рекомендуются детальное предварительное рассмотрение и проведение пробных оцифровок.

Требования к компьютеру и программному обеспечению при сканировании предъявляются достаточно высокие. В качестве иллюстрации возьмем предельно простой случай — сканирование листа белой бумаги формата А4 с нанесенной на него косой черной чертой, допустим, по диагонали из конца в конец. При заданном пространственном разрешении 300 dpi в каждой строке будет 2500 точек и 3536 точек по высоте, всего 8,9 млн точек на страницу; если в каждой точке фиксировать только ее координаты и самую простую информацию, то на одну страницу потребуется зарезервировать память в несколько мегабайтов. Конечно, такой простейший способ никогда не применяется, а широко используются системы сжатия (компрессии) данных. Для иллюстрации принципов сжатия можно, например, не фиксировать тупо каждый показатель, а фиксировать только их изменения; это уже сэкономит необходимую память в несколько тысяч раз. Если же для передачи все той же косой черты дать ее уравнение (в данном случае это линейная зависимость типа у = ах + b), то вместо нескольких мегабайтов можно обойтись десятком байтов.