1 research outputs found

    Learning semantic representations through multimodal graph neural networks

    Get PDF
    Proyecto de Graduaci贸n (Licenciatura en Ingenier铆a Mecatr贸nica) Instituto Tecnol贸gico de Costa Rica. 脕rea Acad茅mica de Ingenier铆a Mecatr贸nica, 2021Para proporcionar del conocimiento sem谩ntico sobre los objetos con los que van a interactuar los sistemas rob贸ticos, se debe abordar el problema del aprendizaje de las representaciones sem谩nticas a partir de las modalidades del lenguaje y la visi贸n. El conocimiento sem谩ntico se refiere a la informaci贸n conceptual, incluida la informaci贸n sem谩ntica (significado) y l茅xica (palabra), y que proporciona la base para muchos de nuestros comportamientos no verbales cotidianos. Por lo tanto, es necesario desarrollar m茅todos que permitan a los robots procesar oraciones en un entorno del mundo real, por lo que este proyecto presenta un enfoque novedoso que utiliza Redes Convolucionales Gr谩ficas para aprender representaciones de palabras basadas en el significado. El modelo propuesto consta de una primera capa que codifica representaciones unimodales y una segunda capa que integra estas representaciones unimodales en una para aprender una representaci贸n desde ambas modalidades. Los resultados experimentales muestran que el modelo propuesto supera al estado del arte en similitud sem谩ntica y que tiene la capacidad de simular juicios de similitud humana. Hasta donde sabemos, este enfoque es novedoso en el uso de Redes Convolucionales Gr谩ficas para mejorar la calidad de las representaciones de palabras.To provide semantic knowledge about the objects that robotic systems are going to interact with, you must address the problem of learning semantic representations from modalities of language and vision. Semantic knowledge refers to conceptual information, including semantic (meaning) and lexical (word) information, and that provides the basis for many of our everyday non-verbal behaviors. Therefore, it is necessary to develop methods that enable robots to process sentences in a real-world environment, so this project introduces a novel approach that uses Graph Convolutional Networks to learn grounded meaning representations of words. The proposed model consists of a first layer that encodes unimodal representations, and a second layer that integrates these unimodal representations into one to learn a representation from both modalities. Experimental results show that the proposed model outperforms that state-of-the-art in semantic similarity and that can simulate human similarity judgments. To the best of our knowledge, this approach is novel in its use of Graph Convolutional Networks to enhance the quality of word representations
    corecore