Главная              Рефераты - Иностранные языки

Обобщенная грамматика непосредственных составляющих - топик

Îáîáùåííàÿ ãðàììàòèêà íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ .

Îáîáùåííàÿ ãðàììàòèêà íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ (ÎÃÍÑ) â íàñòîÿùåå âðåìÿ øèðîêî èñïîëüçóåòñÿ â ïðèêëàäíîé ëèíãâèñòèêå. Åñëè ðàññóæäàòü ìàòåìàòè÷åñêè, ÎÃÍÑ - ýòî âàðèàíò êîíòåêñòíî-ñâîáîäíîé ãðàììàòèêè íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ. Èñòîðè÷åñêè ÎÃÍÑ ðàçâèâàëàñü èç ãðàììàòèêè Ìîíòåãþ (Montague). Ãðàììàòèêîé íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ ïðåíåáðåãàëè â òå÷åíèå äâóõ äåñÿòèëåòèé. Çàòåì îêàçàëîñü, ÷òî âñå äîâîäû ïðîòèâ åå îïèñàòåëüíîé íåàäåêâàòíîñòè äëÿ åñòåñòâåííûõ ÿçûêîâ îêàçàëèñü íåâåðíûìè èëè îñíîâàííûìè íà ëîæíûõ ïðåäïîñûëêàõ. Äàííàÿ ãðàììàòèêà î÷åíü õîðîøî âîñïðèíèìàåòñÿ ïðèêëàäíûìè ëèíãâèñòàìè è ïðîãðàììèñòàìè.  Îáîáùåííîé ãðàììàòèêå ÍÑ êîíòåêñòíî-ñâîáîäíàÿ ãðàììàòèêà ÍÑ âûðàæàåòñÿ íå â ÿâíîì âèäå, à ïîñðåäñòâîì ðàçëè÷íûõ ïðèåìîâ, êîòîðûå ïîçâîëÿþò îïðåäåëèòü ëèíãâèñòè÷åñêè çíà÷èìûå îáîáùåíèÿ è ïðåäëàãàþò ïðàâèëà óìíîæåíèÿ, áîëåå êîìïàêòíûå, ÷åì ïðîñòîå ïåðå÷èñëåíèå ïðàâèë.

Òåîðåòè÷åñêîå ïðåäñòàâëåíèå

ÎÃÍÑ îïðåäåëÿåò ñèíòàêñè÷åñêèå êàòåãîðèè êàê íàáîð ñèíòàêñè÷åñêèõ ïðèçíàêîâ. Ñèíòàêñ÷åñêèé ïðèçíàê - ýòî îïðåäåëåíèå, ñîñòîÿùåå èç äâóõ ñèìâîëîâ, îïðåäåëÿþùèõ ñàì ïðèçíàê (íàïðèìåð, ïàäåæ) è åãî çíà÷åíèå (ðîäèòåëüíûé), ëèáî ýòî ìîæåò áûòü ñèíòàêñè÷åñêàÿ êàòåãîðèÿ (ò.å. ïðèçíàêè ìîãóò ïðèíèìàòü êàòåãîðèè â êà÷åñòâå èõ çíà÷åíèé).Ñèíòàêñè÷åñêàÿ êàòåãîðèÿ, òàêèì îáðàçîì, ÿâëÿåòñÿ ÷àñòè÷íî ôóíêöèåé ïåðåõîäà îò ïðèçíàêà ê åãî çíà÷åíèþ. Âíóòðåííåå ñîñòàâëåíèå êàòåãîðèé îãðàíè÷èâàåòñÿ âîçìîæíûìè êîìáèíàöèÿìè ïðèçíàêîâ (Áóëåâû óñëîâèÿ). ñèíòàêñè÷åñêèå ñòðóêòóðû - ýòî äåðåâüÿ íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ, êîòîðûå îðãàíèçóþòñÿ ïî âûøåóïîìÿíóòîìó ïðèíöèïó. Ïîñòðîåíèå äåðåâà îñóùåñòâëÿåòñÿ ïî îïðåäåëåííûì ïðàâèëàì: ïðàâèëà çàâèñèìîñòè, ïðàâèëà ëèíåéíîãî ïðåäøåñòâîâàíèÿ, ïðèíöèïû èëëþñòðàöèè ïðèçíàêîâ è ïðàâèëà îïðåäåëåíèÿ îñíîâíûõ ïðèçíàêîâ.

Ïðàâèëà çàâèñèìîñòè ïîçâîëÿþò îäíîìó ñëîâó çàâèñåòü îò äðóãîãî. Íàïðèìåð, S -> NP,VP. Ïðàâèëà çàâèñèìîñòè ëèáî ïåðå÷èñëåíû, ëèáî âûâîäÿòñÿ èç äðóãèõ ìåòàïðàâèëàìè. Ïðàâèëà ëèíåéíîãî ïðåäøåñòâîâàíèÿ îïðåäåëÿþò ïîðÿäîê ïîÿâëåíèÿ êàòåãîðèé. ïðèíöèïû èëëþñòðàöèè ïðèçíàêîâ îñíîâàíû íà äóáëèðîâàíèè ïðèçíàêîâ (ò.å. ñîãëàñîâàíèå ïðèëàãàòåëüíîãî è ñóùåñòâèòåëüíîãî, ãëàãîëà è ñóùåñòâèòåëüíîãî). ïðàâèëà îïðåäåëåíèÿ îñíîâíûõ ïðèçíàêîâ ðàáîòàþò òîãäà, êîãäà êàòåãîðèÿ ìîæåò âñòðåòèòüñÿ, òîëüêî åñëè â ïðåäëîæåíèè íå âñòðåòèëàñü îòðèöàþùàÿ åå êàòåãîðèÿ.

Ïðèìåíåíèå â ïðèêëàäíûõ öåëÿõ

Ðàáîòà ãðàììàòèêè íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ ïîêðûâàåò òàêèå êàòåãîðèè, êàê ñèñòåìó âñïîìîãàòåëüíûõ ãëàãîëîâ àíãëèéñêîãî ÿçûêà, ñîãëàñîâàíèå, âîïðîñû, îòíîñèòåëüíûå ïðåäëîæåíèÿ, ïàññèâíûå êîíñòðóêöèè, ñî÷åòàíèÿ ñ ñóùåñòâèòåëüíûì è ò.ä. Ýòà ãðàììàòèêà áûëà ðàçðàáîòàíà íå òîëüêî äëÿ àíãëèéñêîãî ÿçûêà, íî òàêæå äëÿ àðàáñêîãî, êàòàëàíñêîãî, êèòàéñêîãî, ãîëëàíäñêîãî, ôðàíöóçñêîãî, íåìåöêîãî, ãðå÷åñêîãî, õèíäè, èðëàíäñêîãî, ÿïîíñêîãî, êîðåéñêîãî, ëàòèíñêîãî, ïîëüñêîãî, èñïàíñêîãî, øâåäñêîãî è óýëüññêîãî.

Ìíîãèå ñîâðåìåííûå ñèñòåìû èñïîëüçóþò ãðàììàòèêó íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ. Ñàìûé áîëüøîé êîììåð÷åñêèé ïðîåêò ñ èñïîëüçîâàíèåì àíàëèçàòîðà íà îñíîâå ãðàììàòèêè ÍÑ ïðèíàäëåæèò ôèðìå Hewlett Packard è íàçûâàåòñÿ “HPSG”.

Äåðåâî íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ

Äåðåâüÿ ÍÑ ïðåäñòàâëÿþò ñòðóêòóðíîå îïèñàíèå äëÿ ïðåäëîæåíèé. Â äàëüíåéøåì ñòðóêòóðíîå îïèñàíèå ïðåäëîæåíèÿ ìîæåò èñïîëüçîâàòüñÿ â ñèñòåìàõ, àíàëèçèðóþùèõ èëè ñèíòåçèðóþùèõ åñòåñòâåííûé ÿçûê.

Ïðèìåð äåðåâà ÍÑ äëÿ ïðåäëîæåíèÿ:

John wanted to publish the paper.

S

NP VP

VP

NPR V P V NP

DET N

John wanted to publish the paper

Ñîîòâåòñòâóþùàÿ ñòðóêòóðà ñêîáîê:

[S [NP [NPR John]][VP [V wanted][VP [P to][V publish][NP [DET the][N paper]]]]]

Äåðåâüÿ ÍÑ è ñòðóêòóðû ñî ñêîáêàìè ÿâëÿþòñÿ òåìè ñòðóêòóðàìè, êîòîðûå ïîðîæäàþòñÿ àíàëèçàòîðîì ñèñòåì, îáðàáàòûâàþùèõ åñòåñòâåííûé ÿçûê.

Ãðàììàòèêè íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ

Ãðàììàòèêè ÍÑ ñîñòîÿò èç íàáîðà íåêîíå÷íûõ ñèìâîëîâ (íàïðèìåð, òàêèå êàòåãîðèè, êàê N, V, DET, P, NP, S è ò.ä.), íàáîðà êîíå÷íûõ ñèìâîëîâ (ëåêñè÷åñêèå åäèíèöû òèïà “Äæîí”, “êóïèòü”, “ãàçåòà” è ò.ä.) è íàáîð ïðàâèë, êîòîðûå ïðåîáðàçóþò íåêîíå÷íûå ñèìâîëû â öåïî÷êó êîíåíûõ è íåêîíå÷íûõ ñèìâîëîâ. Åñëè äàííûå ïðàâèëà íå çàâèñÿò îò êîíòåêñòà íåêîíå÷íîãî ñèìâîëà, òî òàêàÿ ãðàììàòèêà íàçûâàåòñÿ êîíòåêñòíî-ñâîáîäíîé; â ïðîòèâíîì ñëó÷àå ãðàììàòèêà íàçûâàåòñÿ êîíòåêñòíî-çàâèñèìîé.

Ãðàììàòèêà ÍÑ â Òðàíñôîðìàöèîííîé ãðàììàòèêå . Ãðàììàòèêà ÍÑ èãðàåò î÷åíü áîëüøóþ ðîëü â òðàíñôîðìàöèîííîé ãðàììàòèêå. Îñíîâíàÿ èäåÿ Òà çàêëþ÷àåòñÿ â òîì, ÷òî äëÿ ñòðóêòóðíîãî îïèñàíèÿ ñóùåñòâóåò áàçîâûé êîìïîíåíò è, ñîîòâåòñòâåííî, áàçîâûå ïðàâèëà. Âñå îñòàëüíûå ïðàâèëà âûâîäÿòñÿ èç áàçîâûõ ïóòåì òðàíñôîðìàöèîííûõ ïðàâèë. Äåðåâüÿ, ïîðîæäåííûå òðàíñôîðìàöèîííûìè ïðàâèëàìè, òàêæå ÿâëÿþòñÿ äåðåâüÿìè íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ. Äàííîå ïðåäñòàâëåíèå Òà ÿâëÿåòñÿ ñèëüíî óïðîùåííûì, íî äëÿ äàííîé ðàáîòû åãî âïîëíå äîñòàòî÷íî.

Âîçðîæäåíèå ãðàììàòèêè ÍÑ è äåðåâüåâ ÍÑ

Íà÷èíàÿ ïðèìåðíî ñ 1975 ãîäà â ãðàììàòèêó ÍÑ áûëè âíåñåíû íåêîòîðûå äîïîëíåíèÿ è îáíîâëåíèÿ. Íå âûõîäÿ çà ðàìêè êîíòåêñòíî-ñâîáîäíîé ãðàììàòèêè, îáðàçîâàëàñü Îáîáùåííàÿ ãðàììàòèêà íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ (ÎÃÍÑ). Ãðàììàòèêà Ñëîæåíèÿ Äåðåâüåâ (ÃÑÄ) - Tree-Adjoining Grammar - îáðàçîâàëàñü íà îñíîâå ïîñòðîåíèÿ äåðåâüåâ áåç èñïîëüçîâàíèÿ ïðàâèë ïåðåõîäà. Ðàññìîòðèì ýòè äâå ãðàììàòèêè.

Îáîáùåííàÿ ãðàììàòèêà íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ (ÎÃÍÑ) . Êðîìå âñåõ âûøåóïîìÿíóòûõ ñâîéñòâ ãðàììàòèê ÍÑ Ãàçäàð (Gazdar) ââåë â ÎÃÍÑ äâà íîâûõ ïîíÿòèÿ: “ïóñòûå” êàòåãîðèè (ýëèïñèñ?) è ñâÿçàííûå ïðàâèëà, à òàêæå ìåòàïðàâèëà äëÿ âûâîäà îäíèõ ïðàâèë èç äðóãèõ. Ýëèïñèñ è ñâÿçàííûå ïðàâèëà íå óâåëè÷èâàþò ïîðîæäàþùóþ ñïîñîáíîñòü çà ïðåäåëû êîíòåêòñíî-ñâîáîäíîé ãðàììàòèêè. Ìåòàïðàâèëà, åñëè îíè íå îãðàíè÷åíû êàêèìè-ëèáî óñëîâèÿìè, óâåëè÷èâàþò ïîðîæäàþùóþ ñïîñîáíîñòü çà ïðåäåëû êîíòåêñòíî-ñâîáîäíîé ãðàììàòèêè, ïîòîìó ÷òî ìåòàïðàâèëî ìîæåò ïîðîæäàòü áåñêîíå÷íûé íàáîð êîíòåêñòíî-ñâîáîäíûõ ïðàâèë, êîòîðûå â ñâîþ î÷åðåäü ïîðîæäàþò êîíòåêñòíî-çàâèñèìûé ÿçûê. Ìåòàïðàâèëà â ðåàëüíûõ ãðàììàòèêàõ, îïèñàííûõ ïî ïðàâèëàì îáîáùåííîé ãðàììàòèêè ÍÑ, äîñòàòî÷íî îãðàíè÷åíû è ïîýòîìó íå óâåëè÷èâàþò ïîðîæäàþùóþ ñïîñîáíîñòü.

Ýëèïñèñ è ñâÿçàííûå ïðàâèëà (íóæíû) ïðåäñòàâëåíû äëÿ áàçîâîãî ïîðîæäåíèÿ “íåñâÿçàííûõ” çàâèñèìîñòåé, êîòîðûå äîëæíû áûòü ó÷òåíû â ïðåäëîæåíèè.

Ïðèìåð ñâÿçàííîãî ïðàâèëà - ýòî ïðàâèëî, êîòîðîå ïðåäñòàâëÿåò ýëèïñèñ äëÿ òîïèêàëèçàöèè, ò.å. íàõîæäåíèÿ òîïèêà â ïðåäëîæåíèè.

Ïîíÿòèå ýëèïñèñà íå íîâîå ïîíÿòèå. Åãî òàêæå óïîìèíàëè Harris, Kuno è Sager. Â êîíòåêñòíî-ñâîáîäíîé ãðàììàòèêå Kuno ñóùåñòâóþò èìåíà óçëîâ ñ ñîîòâåòñòâóþùèìè îïèñàíèÿìè, êîòîðûå îòðàæàþò ïðîïóùåííóþ ñîñòàâëÿþùóþ.

Sager ñîçäàë î÷åíü ïîëíûé àíàëèçàòîð. Åãî èäåè ïåðåïëåòàáòñÿ ñ èäåÿìè Ãàçäàðà. Íî Ãàçäàð áûë ïåðâûé, êòî âíåäðèë ïîíÿòèå ýëèïñèñà è ñâÿçàííûõ ïðàâèë â ôîðìàëüíóþ ðàìêó ñèíòàêñè÷åñêîé òåîðèè è èñïîëüçîâàë ýòî ïîíÿòèå ñèñòåìàòè÷åñêè äëÿ îáúÿñíåíèÿ ñòðóêòóðû äåðåâüåâ.

Ãðàììàòèêà Ñëîæåíèÿ Äåðåâüåâ (ÃÑÄ). Â îáîáùåííóþ ãðàììàòèêó íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ áûëè âíåñåíû íåêîòîðûå èçìåíåíèÿ, à èìåííî: ýòè èçìåíåíèÿ ïîçâîëÿþò ñîçäàâàòü ñòðóêòóðíûå îïèñàíèÿ ïî ïðèíöèïó òðàíñôîðìàöèîííîé ãðàììàòèêè, íî áåç èñïîëüçîâàíèÿ òðàíñôîðìàöèîííûõ ïðàâèë. Ãðàììàòèêà Ñëîæåíèÿ Äåðåâüåâ çàèìñòâîâàëà ó òðàíñôîðìàöèîííîé ãðàììàòèêè òåõíîëîãèþ ïîñòðîåíèÿ äåðåâüåâ íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ ïî îïðåäåëåííûì ïðàâèëàì ïîñòðîåíèÿ äåðåâüåâ.

ÃÑÄ ñîñòîèò èç íàáîðà “íà÷àëüíûõ” äåðåâüåâ è íàáîðà äîïîëíèòåëüíûõ äåðåâüåâ, à òàêæå îïåðàöèè Ñëîæåíèÿ. Íà÷àëüíûå è äîïîëíèòåëüíûå äåðåâüÿ âìåñòå íàçûâàþòñÿ áàçîâûìè äåðåâüÿìè.

Äåðåâî À íàçûâàåòñÿ “íà÷àëüíûì äåðåâîì”, åñëè îíî èìååò ôîðìó:

S

A =


Êîíå÷íûå ñèìâîëû

Êîðíåâîé óçåë îòìå÷åí ñèìâîëîì S, ïîãðàíè÷íûå óçëû ÿâëÿþòñÿ êîíå÷íûìè ñèìâîëàìè. Âíóòðåííèå óçëû - íåêîíå÷íûå ñèìâîëû.

Äåðåâî Â íàçûâàåòñÿ “äîïîëíèòåëüíûì”, åñëè îíî èìååò ôîðìó:

Õ

 =

Õ

Êîíå÷íûå Êîíå÷íûå

Îïåðàöèÿ Ñëîæåíèÿ ñîñòîèò â òîì, ÷òî “íà÷àëüíîå” äåðåâî êàê áû íàêëàäûâàåòñÿ íà “äîïîëíèòåëüíîå” äåðåâî ïî êîðíåâîìó óçëó.

ÃÑÄ áîëåå ìîùíàÿ, ÷åì êîíòåêñòíî-ñâîáîäíàÿ ãðàììàòèêà. Ñóùåñòâóþò ÿçûêè, êîòîðûå ìîãóò áûòü ïîðîæäåíû ÃÑÄ, íî íå ÊÑà (íàïðèìåð, êîíòåêñòíî-çàâèñèìûå ÿçûêè).

ÃÑÄ èëëþñòðèðóåò, êàê äåðåâüÿ íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ ìîãóò áûòü ïîëó÷åíû èç áàçîâûõ äåðåâüåâ.  îòëè÷èå îò òðàíñôîðìàöèîííîé ãðàììàòèêè ýòî äîñòèãàåòñÿ íå ñ ïîìîùüþ òðàíñôîðìàöèîííûõ ïðàâèë, à ñ ïîìîùüþ îïåðàöèè Ñëîæåíèÿ. ÃÑÄ ìîæåò ïîðîæäàòü äåðåâüÿ ñ ïåðåñåêàþùèìèñÿ çàâèñèìîñòÿìè.

Ðåçþìå

Äåðåâüÿ íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ îáåñïå÷èâàþò âîçìîæíîñòü ñòðóêòóðíîãî îïèñàíèÿ ïðåäëîæåíèé. Äåðåâüÿ ÍÑ ìîãóò áûòü ïîðîæäåíû ãðàììàòèêàìè ÍÑ. Äåðåâüÿ ÍÑ ìîãóò èñïîëüçîâàòüñÿ äëÿ õàðàêòåðèñòèêè ñòðóêòóðíîãî îïèñàíèÿ ïðåäëîæåíèé, âêëþ÷àÿ òå àñïåêòû, êîòîðûå îáû÷íî õàðàêòåðèçîâàëèñü òðàíñôîðìàöèîííûìè ãðàììàòèêàìè. Ýòè õàðàêòåðèñòèêè ïðåäïîëàãàþò âíåñåíèå èçìåíåíèé â êîíòåêñòíî-ñâîáîäíóþ ãðàììàòèêó, íå óâåëè÷èâàÿ åå ïîðîæäàþùóþ ñïîñîáíîñòü, èëè ïîðîæäåíèå ïðåäëîæåíèé èç àçîâûõ äåðåâüåâ ñ ïîìîùüþ îïåðàöèè Ñëîæåíèÿ, ÷òî âñå æå íåñêîëüêî óâåëè÷èâàåò ïîðîæäàþùóþ ñïîñîáíîñòü. Ñòðóêòóðíûå îïèñàíèÿ, ñäåëàííûå ñ ïîìîùüþ äåðåâüåâ ÍÑ, èñïîëüçóþòñÿ íåïîñðåäñòâåííî èëè â íåÿâíîì âèäå â ñèñòåìàõ, îïèñûâàþùèõ åñòåñòâåííûé ÿçûê.