Denne hovedfagsoppgaven tar for seg to forskjellige emner, begge relatert til dokumentproduksjonssystemet LATEX. Del I tar for seg virtuelle fonter, og del II tar for seg norsk orddeling.
LATEX,som er et påbygg på TEX, benytter normalt en samling med egne
skrifttyper, fonter. Disse er kodet i henhold til ASCII-standarden, men med enkelte unntak. Problemet med slike fonter er bruk av særnorske bokstaver og andre symboler som benyttes ofte. Jeg har derfor ønsket å kode disse fontene i henhold til ISO 8859/1, Latin-1, ved hjelp av virtuelle fonter.
I del I kartlegger jeg hvilken informasjon som er tilgjengelig før en konvertering, klassifisering av bokstaver og tegn, og konstruksjonsmetoder for bokstaver og tegn som ikke finnes i den opprinnelige fonten. Videre har jeg implementert et program som er i stand til å konvertere en gitt font til ISO 8859/1-koding. Denne oppgaven er satt med fonter laget med dette programmet.
I del II tar jeg for meg norsk orddeling til bruk i LATEX. LATEX
benytter seg av en mønsterbasert orddelingsalgoritme til deling av ord. En liste med mønstre gjenspeiler språket, slik at en engelsk liste ikke vil duge for norsk språk. Til bruk for norsk har vi tidligere hatt en omarbeidet dansk mønsterliste, men denne gjenspeiler
ikke dagens orddelingsregler.
Å lage nye norske mønstre krever kjennskap til gjeldende regler som langt fra er entydige og fullstendige. Videre er jeg avhengig av en liste med ferdig delte ord. Utarbeidelsen av en slik ordliste, på basis av en egen frekvensordliste, er sentralt. Tilslutt skal mønstre lages på basis av orddelingslisten ved hjelp av programmet patgen. Orddelinger ved linjeskift er i denne oppgaven gjort automatisk av LATEX på basis av mønstre laget i del II