Оптическое распознавание букв

Главная       Учебники - Компьютеры      Электронная информатизация и электронные ресурсы

 поиск по сайту     

 

 

 

 

 

 

 

 

 

 

содержание   ..  40  41  42  43  44  45  46  47  48  49  50  ..

 

 

5.2.3. Оптическое распознавание букв

Оптическое распознавание букв (символов) (Optical Characters Recognition — OCR) представляет собой компьютеризованный процесс превращения элементов изображения текста в буквенно-цифровые коды, соответствующие таблицам ASCII, и последующее формирование слов, отвечающее контексту. Программы распознавания опираются на встроенные

 

системы многоязычных словарей и списков замещений; пользователь может по желанию сохранять сегментирование страницы (колонки, блоки текста, графики) или сделать итоговый текст однородным и компактным. Для практических применений уровень надежности распознавания должен быть не ниже 99.5%. то есть не более 4—5 ошибок на 1000 знаковых единиц. В России широкое распространение получило семейство программ, поддерживающих сканирование и оптическое распознавание символов русского и английского языков Fine Reader (4.0 Professional и более высокие версии) компании ABBYY и др.
 

 

5.3. Носители информации

На первых порах достаточно существенным было деление возможных носителей цифровой информации на стационарные и портативные устройства (в данном случае правильнее бы использовать прямой перевод — переносимые). Для систем персональных компьютеров обоих типов — IBM PC или Macintosh основным стационарным носителем информации был и остается жесткий диск.

Портативные устройства очень быстро развивались и трансформировались. Первые по времени появления стандартные гибкие диски диаметром пять дюймов с четвертью и емкостью несколько сотен килобайтов (до 360) уже не используются, и довольно трудно будет найти оборудование для считывания информации, записанной в свое время на них. Пришедшие на смену стандартные диски три с половиной дюйма и емкостью 1.44 Мб также понемногу выходят из употребления. Новые компьютеры уже зачастую не имеют соответствующих приводов. Впоследствии пришли записываемые оптические компакт-диски — CD-R или CD-RW, DVD-R. DVD-RW, а также устройства, не содержащие вращающихся частей, — FlashJet и подобные, совместимые с универсальными портами USB. Нужно сказать, что на развитие компактных устройств памяти очень большое
влияние оказало внедрение музыкальных стандартов, цифровых видео- и фотокамер.

Однако же совершенно революционные перемены в соотношении стационарных и переносимых устройств принесло распространение Интернета. Необходимость брать с собой какие-то электронные документы отпадает, если в пункте назначения и у вас имеется возможность использовать Интернет. Несколько упрошая, можно спросить самого себя: «Зачем переносить, если можно переслать?»

С точки зрения типологии в дополнение к стационарным и портативным устройствам можно бы вводить и третий тип средств передачи данных, а именно: оборудование для связи через Интернет и по мобильной связи (мобильные телефоны второго и третьего поколений, смартфоны и т. п.). В то же время ограниченные скорости передачи данных могут перевернуть ваше предстаапение о возможностях Интернета. Например, если вам почему-либо понадобилось передать на значительное расстояние очень большой массив информации, скажем 500 Гб, то время передачи его по линии с пропускной способностью 1,5 Мбит/с составит более 30 дней непрерывной работы! Для такого случая будет намного проще и удобнее переписать весь массив на выносной жесткий диск и просто отвезти его на место.