29 research outputs found
Mélyesetek a 4lang fogalmi szótárban
A predikátumok (főleg igék) argumentumhelyeit mélyesetekbe soroljuk, amelyek a szemantikai és szintaktikai tulajdonságok között teremtenek összeköttetést. A 4lang esetében a mélyesetek nyelvfüggetlen általánosításokat igyekszenek megragadni, melyek segítségével egy mondat jelentésreprezentációja elkészíthető
Three-order normalized PMI and other lessons in tensor analysis of verbal selectional preferences
We investigate several questions in transitive verb structure representation by decomposing tensors populated with different subject-verb-object association measures, including a novel generalization of normalized pointwise mutual information to the higher-order (>2) case. Which association measure works the best in modeling verb structures? Should we include occurrences with unfilled arguments in our statistics? We also investigate qualitatively the latent dimensions, and the difference between each noun as a subject versus an object
Tárgyas szerkezetek elemzése tenzorfelbontással - áttekintő cikk
Áttekintjük a tenzorfelbontás számítógépes nyelvészeti alkalmazásait, különösen az igei argumentumstruktúrára vonatkozókat, és olyan asszociációs mértékekre hívjuk fel a figyelmet, amelyeket eddig nem használtak erre a feladatra
Comparison of distributed language models on medium-resourced languages
word2vec and GloVe are the two most successful open-source tools that compute distributed language models from gigaword corpora. word2vec implements the neural network style architectures skip-gram and cbow, learning parameters using each word as a training sample, while GloVe factorizes the cooccurrence-matrix (or more precisely a matrix of conditional probabilities) as a whole. In the present work, we compare the two systems on two tasks: a Hungarian equivalent of a popular word analogy task and word translation between European languages including medium-resourced ones e.g. Hungarian, Lithuanian and Slovenian
Mélyesetek a 4lang fogalmi szótárban
A predikátumok (főleg igék) argumentumhelyeit mélyesetekbe soroljuk, amelyek a szemantikai és szintaktikai tulajdonságok között teremtenek összeköttetést. A 4lang esetében a mélyesetek nyelvfüggetlen általánosításokat igyekszenek megragadni, melyek segítségével egy mondat jelentésreprezentációja elkészíthető