Location of Repository

System bezkontekstowej ekstrakcji jednosegmentowych nazw własnych z tekstu polskiego : rozprawa doktorska /

By Paweł Pietras

Abstract

Recenzenci pracy: Ryszard Tadeusiewicz, Marek Skomorowski.Praca doktorska. Akademia Górniczo-Hutnicza im. Stanisława Staszica (Kraków), 2005.Bibliogr. k. 142-143.Ogólny opis systemu automatycznej ekstrakcji nazw, korpus tekstów, uogólniony, system automatycznego rozpoznawania typu fleksyjnego nazw na podstawie dowolnej formy tekstowej, dane treningowe, Baza Fleksyjna Nazw Własnych, Słownik Fleksyjny Języka Polskiego, identyfikacja paradygmatu, etykiety fleksyjne, analiza własności danych, alternacje, homografie, warianty, konwencje ortograficzne, konstrukcja, postać danych, rozpoznawanie paradygmatu, generowanie hipotez, redundancja, system bezkontekstowej kategoryzacji semantycznej nazw jednosegmentowych, kategorie semantyczne w leksykonie nazw, analiza własności danych, wybór kategorii semantycznych nazw, otwartość kategorii semantycznych, kategorie semantyczne a struktura morfologiczna, fleksja, statystyka form tekstowych, kategoryzacja, granice stosowalności, konstrukcja systemu reguł, reguły strukturalne, strukturalno-fleksyjne, miary systemu reguł, algorytm, system automatycznej generacji reguł klasyfikacji semantycznej, funkcje pomocnicze, grupowanie, wyznaczanie, obliczanie miar dla reguł, wagi prawych segmentów, system bezkontekstowej ekstrakcji jednosegmentowych nazw własnych z tekstu polskiego, analiza danych surowego korpusu tekstowego, zjawiska statystyczne w tekście, strukturalne, struktura, przygotowanie danych, leksykonu, form tekstowych do ekstrakcji, weryfikacji, implementacja algorytmów, tokenizer, filtrowanie form wejściowych, generacja hipotez fleksyjnych, kategoryzacja semantyczna, ograniczanie redundancji, testy, przygotowanie testów, czyszczenie danych testowych, segmenty obcych nazw wielosegmentowych, błędy w korpusie testowym, opracowanie wyników testów, kategorie semantyczne w testach, sposób zapisu wielu odpowiedzi, analiza porównawcza wyników testów, miary podobieństwa w przestrzeni wyników testów, porównanie skuteczności systemu i algorytmu naturalnego, analiza błędów w wynikach systemu, brak kategorii w systemie, błędnie rozpoznana kategoria, poprawna hipoteza na dalszej pozycji, kategorie semantyczne nazw w leksykonie treningowym, wzorce podziału na sylaby stosowane w algorytmie wyznaczania reguł kategoryzacji, formy z leksykonu, dla których nie udało się wyznaczyć prawego segmentu, wyniki testów, nazwy rodzime o cząstkowej mierze podobieństwa do wzorca poniżej 100%, obce, instrukcja użytkownik

Topics: Językoznawstwo, informatyka, Język polski, informatyka
Publisher: Kraków : Akademia Górniczo-Hutnicza im. Stanisława Staszica,
Year: 2005
OAI identifier: oai:abc.krakow.pl:dd2005304056
Download PDF:
Sorry, we are unable to provide the full text but you may find it at the following location(s):
  • http://vtls.cyf-kr.edu.pl/cgi-... (external link)
  • http://winntbg.bg.agh.edu.pl/r... (external link)
  • Suggested articles


    To submit an update or takedown request for this paper, please submit an Update/Correction/Removal Request.