24 research outputs found
emToken : Unicode-képes tokenizáló magyar nyelvre
CikkĂĽnkben az emToken tokenizálĂł programot mutatjuk be. Ennek fĹ‘bb tulajdonságai között emlĂthetĹ‘, a szĂ©leskörű UTF-8 támogatás, a konfigurálhatĂłság, az automatikus tesztkörnyezet Ă©s a programkönytár által nyĂşjtott API. Az előállĂtott - XML vagy JSON formátumĂş - kimenet detokenizálhatĂł. A program forráskĂłdja szabadon elĂ©rhetĹ‘ GPLv3 licenc alatt. Az emToken az e-magyar eszközlánc tokenizálásĂ©rt felelĹ‘s modulja
Tudásalapú ajánlórendszer adatszegény környezetben
Az ajánlĂłrendszerek általában a felhasználĂłi tranzakciĂłkbĂłl Ă©s a termĂ©kekrĹ‘l rendelkezĂ©sre állĂł adatokbĂłl kinyert informáciĂłkra támaszkodnak. AdatszegĂ©ny környezetben azonban más informáciĂłforrások felhasználására van szĂĽksĂ©g. A tanulmány olyan megoldás prototĂpusát mutatja be, ahol a felhasználĂł tevĂ©kenysĂ©gĂ©t jellemzĹ‘ szöveges adatok automatikus feldolgozása Ă©s egy rĂ©szletes ontolĂłgiában tárolt tudásbázis felhasználása segĂtsĂ©gĂ©vel válik lehetĹ‘vĂ© a releváns termĂ©kek (szolgáltatások) kiválasztása