Гипертекстовые технологии представления текста

  Главная      Учебники - Лингвистика     Введение в прикладную лингвистику (Баранов А.Н.) - 2001 год

 поиск по сайту

 

 

 

 

 

 

 

 

 

 

 

содержание   ..  1  2  3  4  5  6  7  8  9  10    ..

 

 

1.4.

Гипертекстовые технологии представления текста

 

Феномен гипертекста можно обсуждать с нескольких точек зрения. С одной стороны, это особый способ представления, организации текста, с другой — новый вид текста, противопоставленный по многим своим свойствам обычному тексту, сформированному в гутенберговской тради­ции книгопечатания. И, наконец, это новый способ, инструмент и новая технология понимания текста.

1.4.1 Историческое замечание. Идея гипертекста связывается с именем Ванневара Буша — советника президента Рузвельта по науке. В. Буш теоретически обосновал проект технической системы «Мемекс», которая позволяла пользователю связывать тексты и их фрагменты по различным типам связей, преимущественно по ассоциативным отношениям. Отсутствие компьютерной техники сделало проект трудно реализуемым, поскольку механическая система оказалась чрезмерно сложной для практического воплощения. Идея В. Буша в 60-е гг. получила второе рождение в системе «Ксанаду» Т. Нельсона, которая уже предполагала использование компьютерной техники. «Ксанаду» позволял пользователю прочитывать совокупность введенных в систему текстов различными способами, в различной последовательности, программное обеспечение давало возможность как запоминать последовательность просмотренных текстов, так и выбирать из них практически любой в произвольный момент времени. Множество текстов со связывающими их отношениями (системой переходов) было названо Т. Нельсоном гипертекстом.

1.4.2. Теоретические основания гипертекста. Многие исследователи рассматривают создание гипертекста как начало новой информационной эпохи, противопоставленной эре книгопечатания. Линейность письма, внешне отражающая линейность речи, оказывается фундаментальной категорией, ограничивающей мышление человека и понимание текста. Мир смысла нелинеен, поэтому сжатие смысловой информации в линейном речевом отрезке требует использования специальных «коммуникативных упаковок» — членение на тему и рему, разделение плана содержания высказывания на эксплицитные (утверждение, пропозиция, фокус) и имплицитные (пресуппозиция, следствие, импликатура дискурса) слои. Отказ от линейности текста и в процессе его представления читателю (чтения и понимания), и в процессе синтеза, по мнению теоретиков, способствовал бы «освобождению» мышления и даже возникновению его новых форм.

Прототипический текст — это монолог. Между тем многие лингвисты (и среди них М. Бахтин и Л. Якубинский) указывали на вторичность монолога по сравнению с диалогом. Гипертекст с этой точки зрения позволяет устранить искусственную монологичность текста.

Обычный текст, как правило, имеет автора. Гипертекст автора в тра­диционном понимании не имеет — у него множество авторов, причем для постоянно изменяющегося гипертекста авторский коллектив также постоянно меняется. Изменение статуса автора меняет и статус читателя: в гипертекстовой системе понимание часто сопровождается изменением компонентов гипертекста или, как минимум, выбором пути просмотра, что опять-таки акт творческий, авторский.

Множественность авторства имеет и еще одно следствие: в гипертек­сте представлено много точек зрения на проблему, а в обычном тексте — только одна. Именно поэтому гипертекст более объективен и более толе-рантен к читателю, чем классический текст.

Гипертекстовые технологии позволяют легко сочетать различные ви­ды информации — обычный текст, рисунок, график, таблицу, схему, звук и движущееся изображение. Как традиционный текст, так и ги­пертекст — феномены, порожденные новыми технологиями. В первом случае технология позволила легко тиражировать и распространять зна­ния самых различных типов, а во втором — компьютерные технологии дали возможность изменить сам внешний вид текста и его структу­ру. Разнородность гипертекста — это первое технологическое свойство гипертекста, технологическое в том смысле, что оно непосредственно следует из используемой компьютерной технологии. Второе технологи­ческое свойство гипертекста — его нелинейность. Гипертекст не имеет стандартной, обычной последовательности чтения. Прочие свойства ги­пертекста в той или иной степени являются следствиями из этих двух технологических свойств.

Суммировать различия текста и гипертекста можно следующим об­разом:

  • конечность, законченность традиционного текста vs. бесконечность, незаконченность, открытость гипертекста;

  • линейность текста vs. нелинейность гипертекста;

  • точное авторство текста vs. отсутствие авторства (в традиционном понимании) у гипертекста;

  • снятие противопоставления между автором и читателем;

  • субъективность, односторонность обычного текста vs. объективность, многосторонность гипертекста;

  • однородность обычного текста vs. неоднородность гипертекста.

1.4.3. Компоненты гипертекста. Структурно гипертекст может быть пред­ставлен как граф, в узлах которого находятся традиционные тексты или их фрагменты, изображения, таблицы, видеоролики и т.д. Узлы связаны разнообразными отношениями, типы которых задаются разработчиками программного обеспечения гипертекста или самим читателем. Отноше­ния задают потенциальные возможности передвижения илинавигации по гипертексту. Отношения могут быть однонаправленными или дву­направленными. Соответственно, двунаправленные стрелки позволяют двигаться пользователю в обе стороны, а однонаправленные — только в одну. Цепочка узлов, через которые проходит читатель при просмотре компонентов текста, образует путь или маршрут.

A

{текст}

B

{фотография}

C

{текст}

D

{видеоролик}

E

{фонограмма}

F

{текст}

R

{фотография}

T

{текст}

U

{видеоролик}

O

{картина}

P

{текст}

L

{текст}

K

{текст}

J

{фонограмма}

H

{текст}

I

{текст }

Маршруты через узлы В, U, L и Е, О, I соответствуют различным прочтениям гипертекста. Тип чтения гипертекста определяется не только маршрутом, но и качественными характеристиками, связанными с по­ниманием информации, содержащейся в узлах. Медленное чтение пред­полагает внимательное знакомство с информацией каждого узла. Часто медленное чтение сопровождается заметками, которые читатель может привязывать к узлам гипертекста. Быстрое чтение — браузинг — наиболее часто используется в информационных системах, основанных на гипер­текстовой технологии. При поиске конкретной информации пользователь быстро передвигается по узлам сети, маркируя нужные фрагменты. Для браузинга создается специальная программная поддержка.

Совокупность смежных узлов образует окрестность данного узла. По­нятно, что окрестность узла образуют те узлы, в которых содержится информация, близкая по семантике к содержанию данного узла. Узлы сети, в которые входит и выходит много стрелок-отношений, образу­ют центральную часть гипертекста, а те, которые почти изолированы от других узлов — его периферию.

1.4.4. Элементы типологии гипертекста. Первое противопоставление от­носится к структуре гипертекста. Гипертекст может быть иерархическим или сетевым. Иерархическое — древовидное — строение гипертекста существенно ограничивает возможности перехода между его компонен­тами. В таком гипертексте отношения между компонентами напоминают структуру тезауруса, основанного на родо-видовых связях. Иерархический гипертекст не реализует всех возможностей технологии гипертекста. В среде разработчиков гипертекстовых систем он не пользуется попу­лярностью (хотя и довольно часто реализуется в работающих системах). Т. Нельсон по поводу иерархического гипертекста писал: «На мой взгляд, иерархии ложны. Они представляют собой слишком сильные упрощения действительности»8). Сетевой гипертекст позволяет использовать различ­ные типы отношений между компонентами, не ограничиваясь отноше­ниями «род—вид».

Второе противопоставление характеризует не саму структуру гипер­текста, а возможности программного обеспечения. Здесь различаются простые и сложные гипертексты. Примером простого программного обес­печения гипертекста может служить электронное оглавление документа, которое позволяет перейти к любой части оглавления, минуя этап просмо­тра всего текста. К простому гипертексту относится и система, которая дает возможность просматривать отсылки к литературе, содержащиеся в тексте, не обращаясь непосредственно к списку литературы. Сложные гипертексты обладают богатой системой переходов между компонентами гипертекста, в них отсутствует представление о базовом тексте, с кото­рым связаны второстепенные по значимости тексты. В некотором смысле нормальный, обычный гипертекст и является сложным гипертекстом.

По способу существования гипертекста выделяются статические и ди­намические гипертексты. Статический гипертекст не меняется в процессе эксплуатации; в нем пользователь может фиксировать свои коммента­рии, однако они не меняют существо дела. Для динамического гипер­текста изменение является нормальной формой существования. Обычно динамические гипертексты функционируют там, где необходимо посто­янно анализировать поток информации, то есть в информационных службах различного рода. Гипертекстовой является, например, Аризон-ская информационная система (AAIS), которая ежемесячно пополняется на 300-500 рефератов в месяц.

Отношения между элементами гипертекста могут изначально фикси­роваться создателями, а могут порождаться всякий раз, когда происходит обращение пользователя к гипертексту. В первом случае речь идет огипер­текстах жесткой структуры, а во втором — о гипертекстах мягкой структуры. Жесткая структура технологически вполне понятна. Технология органи­зации мягкой структуры должна основываться на семантическом анализе близости документов (или других источников информации) друг к другу. Это нетривиальная задача компьютерной лингвистики. В настоящее вре­мя широко распространено использование технологий мягкой структуры на ключевых словах. Переход от одного узла к другому в сети гипер­текста осуществляется в результате поиска ключевых слов. Поскольку набор ключевых слов каждый раз может различаться, каждый раз ме­няется и структура гипертекста. Жесткость или мягкость архитектуры

8)Цитируется по [Субботин 1994, с. 51].

гипертекста зависит и от количества информации, которая в нем со­держится. Если узлов в сети гипертекста порядка одной—трех тысяч, то чаще всего используется жесткая архитектура, если же количество узлов достигает нескольких десятков тысяч или даже миллионов единиц, то мягкая структура оказывается более предпочтительной, поскольку ко­дировка жестких связей отнимает слишком много времени. Заметим, что структура Интернета часто функционирует как гипертекст мягкой

архитектуры.

Технология построения гипертекстовых систем не делает различий между текстовой и нетекстовой информацией. Между тем включение визуальной и звуковой информации (видеороликов, картин, фотогра­фий, звукозаписей и т. п.) требует существенного изменения интерфейса с пользователем и более мощной программной и компьютерной под­держки. Такие системы получили название гипермедиа или мультиме­диа. Наглядность мультимедийных систем предопределила их широкое использование в обучении, в создании компьютерных вариантов эн­циклопедий. Известны, например, прекрасно выполненные CD-ромы с мультимедийными системами по детским энциклопедиям издательства «Дорлинг Киндерсли».

1.4.5. Некоторые гипертекстовые системы. Технологически в основе ги­пертекста лежат компьютерные программы, которые поддерживают сле­дующие базовые функции:

  • обеспечение быстрого просмотра информационного массива (браузинг);

  • обработка ссылочных отношений (обращение и вызов фрагмента текста или другой информации, на которую производится отсылка);

  • навигация по гипертексту, запоминание маршрута движения; представление пути движения в легко воспринимаемой форме;

  • возможность формирования обычного линейного текста как результата движения по гипертексту;

  • дополнение гипертекста новой информацией;

  • введение новых отношений в структуру гипертекста (для систем с жесткой структурой).

Программные оболочки гипертекста, как правило, универсальны. Они могут использоваться в различных областях для создания темати­чески разных гипертекстов. Таковы, например, оболочка ZOG и раз­работанная на ее основе промышленная гипертекстовая система KMS (университет Карнеги-Меллон, США). Сферы применения этих гипер­текстовых систем необычайно разнообразны — от работы с документа­цией и поддержки электронной почты до гипертекстов, предназначенных для экспертов, работающих над бюджетом. Имеются и специализирован­ные системы. Так, система NoteCards (продукт компании «Xerox PARC») предназначена для аналитической работы, а система WE, моделирующая особенности получения нового знания — для помощи в авторской работе. Наиболее популярны в настоящее время программные пакеты HyperCard компании «Apple». Они относительно просты в использовании. Гипер­текст в оболочке HyperCard представляется в виде каталожных карто­чек. Пользователь с помощью довольно простого интерфейса организует структуру карточки и устанавливает связи между карточками. Пакеты HyperCard позволяют сочетать различные типы информации, в частности карточки могут включать графическую, звуковую и др. информацию. Следует отметить, что современные базы данных также включают поля для визуальной и звуковой формы данных (ср., например, базу данных ACCESS 7, работающую в среде Windows). Близка к HyperCard по своим свойствам и программа SuperCard фирмы «Silicon Beach». Некоторые системы гипертекста содержат специальные средства ориентации пользо­вателя в гиперпространстве — карты или закладки, отмечающие наиболее посещаемые узлы гипертекста. Комплексом средств ориентации обладает система Hypergate Writer фирмы «Eastgate Systems Inc».

* * *

Место лингвистов в проектах по созданию гипертекстовых систем не определено еще достаточно четко, но лингвистическая поддержка ги­пертекстовой технологии необходима. Для гипертекстов с мягкой структу­рой требуется разработка семантических процессоров, устанавливающих отношения семантической близости между документами в автоматиче­ском режиме. Гипертексты с жесткой структурой требуют установле­ния системы смысловых отношений между компонентами гипертекста, что является одной из важнейших задач лингвистической семантики и лингвистики текста. Особая задача, которая не получила достаточного освещения в литературе по данной проблематике — отбор информации в узлы сети гипертекста. Эта сфера относится как к инженерии знаний, так и к работе лингвиста-прикладника, определяющего какие смысло­вые связи должны быть оставлены во фрагменте текста, помещаемого в узел системы гипертекста, а какие могут быть «обрублены», элими­нированы. Принципы отбора семантических отношений определяются практическими задачами гипертекстовой системы.

Задание 1. Известно, что обычный текст содержит некоторые компоненты, которые в большей степени характеризуют гипертекст. Например, оглавление, аппарат сносок и примечаний — все это инструменты создания нелинейности текста, обеспечения системы нелинейных переходов. Какие элементы гипертекста обнаруживаются в следующих текстах:

  • в тексте библии и евангелий;

  • в газетной, журнальной и щитовой рекламе;

  • в словарях и энциклопедиях;

  • в деловых и информационных справочниках типа «Москва — золотые
    страницы», «Досуг в Москве и Петербурге».

Задание 2. Многие хорошо известные программные продукты включают элементы гипертекста. Выявите и опишите элементы гипертекста в следующих программах:

  • в текстовом редакторе WinWord;

  • в операционной среде Windows-95.

Основная литература

  1. Баранов А. Н. Категории искусственного интеллекта в лингвистической семантике. Фреймы и сценарии. М., 1987.

  2. Городецкий Б. Ю. Компьютерная лингвистика: моделирование языкового общения // Новое в зарубежной лингвистике. Вып. XXIV. Компьютерная лингвистика. М., 1989. С. 5-31.

  3. Войскунский А. Е. Моделирование мышления // Речевое общение: проблемы и перспективы. М., 1983. С. 16-60.

  4. Олкер X. Р. Волшебные сказки, трагедии и способы изложение мировой истории // Язык и моделирование социального взаимодействия. М., 1987. С. 408-440.

  5. Поспелов Д. А. Ситуационное управление. Теория и практика. М., 1986. С. 71-83; 99-106.

  6. Субботин М. М. Гипертекст. Новая форма письменной коммуникации // ВИНИТИ. Сер. Информатика. Т. 18. М., 1994.

Дополнительная литература

  1. Баранов А. Н., Паршин П. Б. Варианты и инварианты текстовых макроструктур (к формированию когнитивной теории текста) // Проблемы языковой вариативности. М., 1990. С. 135-168.

  2. Цимбурский В. Л. Макроструктура повествования и механизмы его социального воздействия // Когнитивные исследования за рубежом. Методы искусственного интеллекта в моделировании политического мышления. М., 1990. С. 34-61.

 

 

 

 

 

 

 

содержание   ..  1  2  3  4  5  6  7  8  9  10    ..