Overview and Future of Czech Wordnet

Abstract

Czech Wordnet represents one of the national wordnets created during the EuroWordNet and Balkanet projects. However, the data contains various issues that affects the use of Czech Wordnet in NLP applications. Due to lack of resources, it was not possible to update Czech Wordnet thoroughly since the publication of the first version. In 2017, we have started a project to evaluate and update Czech Wordnet, followed by the connection to Collaborative Interlingual Index. This paper provides overview of various updates and extensions of the Czech Wordnet data, and presents the roadmap to publish revised version of Czech Wordnet under open license.Český Wordnet je jeden z národních wordnetů, vytvořených během projektů EuroWordnet a Balkanet. Údaje ve wordnetu bohužel obsahují různé chyby, které ovlivňují použití českého wordnetu v NLP aplikacích. Vzhledem k nedostatečným zdrojům nebylo možno od vydání první verze český wordnet výrazně aktualizovat. V roce 2017 jsme začali pracovat na vyhodnocení a aktualizac českého wordnetu, následované napojením na Collaborative Interlingual Index. Tento článek shrnuje existující verze a rozšíření českého wordnetu a představuje plán na vydání aktualizované verze s otevřenou licencí

    Similar works