research

Słownik Lindego jako korpus

Abstract

Słownik Lindego był niezależnie dygitalizowany i udostępniany przez różne instytucje na różne sposoby, m.in przez Kujawsko-Pomorską Bibliotekę Cyfrową, Polską Bibliotekę Internetową i Google. Z reguły do tekstu słownika stosowano automatyczne rozpoznawanie znaków, ale nie przeprowadzano korekty wyników - jest to tzw. brudny OCR (Optical Character Recognition). Dygitalizacja drugiego wydania słownika wykonana w Katedrze Lingwistyki Formalnej UW i udostępniona pod adresem http://poliqarp.klf.uw.edu.pl/slownik-lindego wprawdzie się pod tym względem nie różni, jednakże dostępna tam wyszukiwarka leksykograficzna ma pewne pożyteczne funkcje niedostępne gdzie indziej, które zostaną przedstawione w referacie

    Similar works