Norwegian word order in head-driven phrase structure grammar : phenomena, analysis and implementation

Abstract

Hovedfagsoppgaven min, Norwegian Word Order in Head-Driven Phrase Structure Grammar, består formelt sett av fire hoveddeler: 1) en formell deskriptiv redegjørelse for de ordstillingsfenomener i norsk som omfattes av oppgaven, 2) en analyse av disse fenomenene innenfor grammatikkformalismen HPSG, 3) en implementasjon av denne analysen ved hjelp av grammatikkutviklingsverktøyet LKB og 4) et omfattende testsett av setninger som inkluderer de interessante fenomenene. Utgangspunktet for oppgaven er ordstillingsfenomener i norsk som skiller seg fra ordstillingen i andre germanske språk, med særlig vekt på engelsk. For norske deklarative hovedsetninger betyr dette at jeg har lagt vekt på V2-regelen, topikalisering og den mulige inverterte subjektsposisjonen i setningen. Dette står i kontrast til den normale strukturen i leddsetninger, der topikalisering ikke er tillatt, subjektet kun har en mulig posisjon i setningen (før det finitte verbet) og V2-reglen ikke gjelder (dvs. at mer enn et ledd kan plasseres før det finitte verbet). I tillegg har jeg sett på setningsadverbialenes mulige plassering, med vekt på de forskjellene som foreligger både mellom de to ulike setningstypene og mellom ulike typer av adverb innenfor samme type setning. Jeg har brukt grammatikkformalismen Head-Driven Phrase Structure Grammar (HPSG) til å bygge opp en analyse for fenomenene nevnt ovenfor. HPSG er en føringsbasert, leksikalsk og ikke-transformasjonell formalisme, der de lingvistiske objektene blir representert ved hjelp av attributt-verdi-matriser. Formalismen benytter seg av typehierarki med multippel arv for a uttrykke generaliseringer over disse objektene. For å implementere analysen min har jeg tatt i bruk grammatikkutviklingsverktøyet Lexical Knowledge Builder (LKB). Dette verktøyet letter arbeidet med å bygge opp alle de nødvendige delene av grammatikken (særlig nødvendig for det omfattende typehierarkiet), og det gir også muligheter for å teste grammatikken på ulike måter når den er ferdig, for eksempel ved parsing og generering. Grammatikken har jeg bygget opp på grammatikkfundamentet Matrix, et basistypehierarki som er trukket ut fra den engelske HPSG-grammatikken LinGO ERG, og som har som mål å utvikle seg til en språkuavhengig startpakke for grammatikkutviklere som ønsker å skrive HPSG-grammatikker for sine egne språk. Matrix er foreløpig på forsøksstadiet, så det er interessant å se i hvilken grad typene kan overføres direkte til en norsk grammatikk og i hvilke tilfeller de må modifiseres før de kan tas i bruk. Analysen jeg har laget, og den fungerende implementasjonen av den, er inspierert av setningsskjema-analyser som er laget for skandinaviske språk, med utgangspunkt i Diderichsens setningsskjema for dansk. Jeg deler således konstruksjonene inn i to basismønstre, ett for hovedsetninger og ett for leddsetninger. Ofte kan det avgjøres hvilken struktur setningene har, og dermed hvilket mønster de tilhører, allerede fra første regelapplikasjon. I de to basismønstrene går jeg blant annet ut fra forskjellig kanonisk subjektsposisjon i hoved- og leddsetninger (etter finitt verb i hovedsetninger og før finitt verb i leddsetninger), med den følge at subjektet må ekstraheres fra sin opprinnelige plass og frontes på samme måte som objekter og adverbialer dersom det skal plasseres i setningens første posisjon i en deklarativ hovedsetning. Setningsadverbialene klassifiserer jeg ut fra den plasseringen de kan ha i en setning. Denne klassifikasjonen implementerer jeg så i et typehierarki, der typer som er underspesifisert og dermed kan plasseres i flere forskjellige posisjoner i setningen har subtyper som er nærmere spesifisert og kun kan plasseres i enkelte av disse posisjonene. Hvert adverbial blir så definert til å være av den passende typen. Reglene som kombinerer adverbialene med den frasen de modifiserer har ytterligere føringer lagt på seg for å sikre at adverbialene blir plassert på korrekt plass i den riktige typen struktur. Tilsammen utgjør dette en analyse og en implementasjon som dekker de fenomen og data som jeg beskrev i andre avsnitt. For en mer utfyllende forklaring og tekniske detaljer kan oppgaven oppspores ved hjelp av BIBSYS

    Similar works

    Full text

    thumbnail-image