research

Intranet indexing using semantic document clustering

Abstract

Denna uppsats presenterar ett system baserat på automatiska indexerings-tekniker avsett för stora, dynamiska och nätverksbaserade informations-samlingar, tillämpat på ett företags intranet. Syftet är att beskriva dess struktur, baserat på dokumentens innehåll och semantik, för att möjliggöra en överblick av innehållet. Ett användningsområde är att underlätta navigering i intranet. Vi föreslår ett system som skapar ett hierarkiskt index som är möjliggör âsurfningâ i strukturen. Större delen av uppsatsen inriktas på indexeringstekniker, varav de flesta härstammar från forskning inom Information Retrieval. Vi har utvecklat en prototyp varvid vi använt oss av en iterativ utvecklingsmetod. Slutligen drar vi slutsatsen att de föreslagna teknikerna är användbara för automatisk indexering och kan nyttjas för att få den överblick som söks

    Similar works