29 research outputs found

    Filtering Wiktionary Triangles by Linear Mbetween Distributed Word Models

    Get PDF

    Mélyesetek a 4lang fogalmi szótárban

    Get PDF
    A predikátumok (főleg igék) argumentumhelyeit mélyesetekbe soroljuk, amelyek a szemantikai és szintaktikai tulajdonságok között teremtenek összeköttetést. A 4lang esetében a mélyesetek nyelvfüggetlen általánosításokat igyekszenek megragadni, melyek segítségével egy mondat jelentésreprezentációja elkészíthető

    Three-order normalized PMI and other lessons in tensor analysis of verbal selectional preferences

    Get PDF
    We investigate several questions in transitive verb structure representation by decomposing tensors populated with different subject-verb-object association measures, including a novel generalization of normalized pointwise mutual information to the higher-order (>2) case. Which association measure works the best in modeling verb structures? Should we include occurrences with unfilled arguments in our statistics? We also investigate qualitatively the latent dimensions, and the difference between each noun as a subject versus an object

    A 4lang fogalmi szótár

    Get PDF

    Do multi-sense word embeddings learn more senses?

    Get PDF

    Tárgyas szerkezetek elemzése tenzorfelbontással - áttekintő cikk

    Get PDF
    Áttekintjük a tenzorfelbontás számítógépes nyelvészeti alkalmazásait, különösen az igei argumentumstruktúrára vonatkozókat, és olyan asszociációs mértékekre hívjuk fel a figyelmet, amelyeket eddig nem használtak erre a feladatra

    Az EFNILEX és egy fiatal kutató. Hat év magyar szóbeágyazásokkal

    Get PDF

    Comparison of distributed language models on medium-resourced languages

    Get PDF
    word2vec and GloVe are the two most successful open-source tools that compute distributed language models from gigaword corpora. word2vec implements the neural network style architectures skip-gram and cbow, learning parameters using each word as a training sample, while GloVe factorizes the cooccurrence-matrix (or more precisely a matrix of conditional probabilities) as a whole. In the present work, we compare the two systems on two tasks: a Hungarian equivalent of a popular word analogy task and word translation between European languages including medium-resourced ones e.g. Hungarian, Lithuanian and Slovenian

    Deep cases in the 4lang concept lexicon

    Get PDF

    Mélyesetek a 4lang fogalmi szótárban

    Get PDF
    A predikátumok (főleg igék) argumentumhelyeit mélyesetekbe soroljuk, amelyek a szemantikai és szintaktikai tulajdonságok között teremtenek összeköttetést. A 4lang esetében a mélyesetek nyelvfüggetlen általánosításokat igyekszenek megragadni, melyek segítségével egy mondat jelentésreprezentációja elkészíthető
    corecore