    Automatic domain-specific learning: towards a methodology for ontology enrichment

    [EN] At the current rate of technological development, in a world where enormous amount of data are constantly created and in which the Internet is used as the primary means for information exchange, there exists a need for tools that help processing, analyzing and using that information. However, while the growth of information poses many opportunities for social and scientific advance, it has also highlighted the difficulties of extracting meaningful patterns from massive data. Ontologies have been claimed to play a major role in the processing of large-scale data, as they serve as universal models of knowledge representation, and are being studied as possible solutions to this. This paper presents a method for the automatic expansion of ontologies based on corpus and terminological data exploitation. The proposed ¿ontology enrichment method¿ (OEM) consists of a sequence of tasks aimed at classifying an input keyword automatically under its corresponding node within a target ontology. Results prove that the method can be successfully applied for the automatic classification of specialized units into a reference ontology.

    Introducción a FunGramKB

    Los vínculos entre el procesamiento del lenguaje natural y la lingüística teórica no han sido ni tan numerosos ni tan productivos como podríamos esperar. En los últimos veinte años, ha aumentado progresivamente la tendencia a utilizar enfoques estadísticos, los cuales resultan más económicos y rápidos de implementar. No obstante, con el fin de realizar algún avance en el procesamiento semántico y pragmático, se requiere un nuevo paradigma en los sistemas de comprensión del lenguaje, en el cual se conjuguen los resultados investigadores de disciplinas como la ciencia cognitiva, la lingüística y la inteligencia artificial. Con este objetivo, se diseñó e implementó computacionalmente la base de conocimiento FunGramKB. Este artículo presenta brevemente los diversos módulos que configuran los niveles léxico, gramatical y conceptual en esta base de conocimiento, destaca aquellas investigaciones que han influido de manera más determinante en nuestro modelo teórico y además describe el papel de este recurso en un sistema del procesamiento del lenguaje natural

    Enhancing a role and reference grammar approach to English motion constructions in a Natural Language Processing environment

    This paper puts forward a finer-grained computational treatment of the English caused-motion construction (e.g. He kicked the ball into the net) within a knowledge base for natural language processing systems called FunGramKB. This computational project is largely based on Role and Reference Grammar (RRG), which is a functional projectionist theory of language. We argue that the RRG-based characterization of the caused-motion construction in FunGramKB is insufficient to account for the semantic and syntactic complexity of realizations such as He walked the dog to the park, I will show you out, or Mac flew Continental to Bush International Airport. Thus, drawing on insights from Constructions Grammars, three minimally distinct transitive motion sub-constructions are formalized within FunGramKB. It is through the inclusion of additional constructional schemas that the machine will be able to capture the various ways in which verbs and constructions interact to yield different input textsEste artículo presenta un tratamiento computacional más fino de la construcción de movimiento causado en inglés (por ejemplo, He kicked the ball into the net, "metió de una patada la pelota en la red") en una base de conocimientos para sistemas de Procesamiento de Lenguaje Natural llamada FunGramKB. Este proyecto computacional se basa en gran medida en la Gramática del Papel y la Referencia (RRG), que es una teoría funcionalista del lenguaje. Argumentamos que la caracterización basada en la RRG de la construcción de movimiento causado en FunGramKB es insuficiente para explicar la complejidad semántica y sintáctica de realizaciones tales como He walked the dog to the park, I will show you out, or Mac flew Continental to Bush International Airport , "Sacó a pasear al perro al parque, Te enseño la salida, Mac voló Continental al Aeropuerto Internacional Bush". Así, basándose en las propuestas de las Gramáticas de Construcciones, se formalizan dentro de FunGramKB tres sub-construcciones de movimiento transitivas ligeramente distintas. A través de la de esquemas constructivos adicionales la máquina será capaz de dar cuenta de las diversas formas en que interactúan los verbos y las construcciones para producir diferentes textos de entrada

    Introducción a FunGramKB

    Conceptualization of entities in a criminal law subontology: analysing the superordinate concept +DRUG_00 in FunGramKb

    [ES] Este artículo describe las fases de construcción de una ontología terminológica dentro de la arquitectura de FunGramKB, una base de conocimiento léxico-conceptual para el procesamiento computacional del lenguaje natural. La descomposición semántica de la terminología compleja se realiza siguiendo el proceso COHERENT, esto es, una metodología gradual para la formalización de conceptos especializados. Para tratar de ilustrar este proceso hemos seleccionado el concepto +DRUG_00, así como otros conceptos subordinados, tales como METHAMPHETAMINE00,METHAMPHETAMINE_00, CANNABIS_00 y COCAINE_00 pertenecientes al dominio de las sustancias estupefacientes (drogas). Las definiciones de los conceptos seleccionados se basan en COREL, un metalenguaje de interfaz inspirado en algunos principios generales de la Gramática del Rol y la Referencia (GRR). Como resultado del proceso de modelado, subsunción y jerarquización, la ruta conceptual superior de la ontología se representa en la Ontología Satélite dentro de FunGramKB según el siguiente esquema: #ENTITY > #PHYSICAL > #OBJECT > #SELF_CONNECTED_OBJECT > +ARTIFICIAL_OBJECT_00 > +SUBSTANCE_00 > +SOLID_00 > +DRUG_00. [EN] This article describes some phases in the process of constructing a term-based Satellite Ontology within the architecture of the Core Ontology integrated in FunGramKB (a lexico-conceptual knowledge base for the computational processing of natural language). The semantic decomposition of complex terminology is implemented following the COHERENT methodology (a stepwise method for formalizing specialized concepts). For that purpose, we have selected the superordinate concept +DRUG_00 as well as other subordinate concepts in the domain of drugs such as METHAMPHETAMINE_00, CANNABIS00,andCANNABIS_00, and COCAINE_00. The definitions of the concepts selected for the study are based on COREL, an interface metalanguage inspired on some general principles of Role and Reference Grammar (RRG). As a result of the modeling, subsumption and hierarchization process the top conceptual path is represented in the Satellite Ontology as follows: #ENTITY > #PHYSICAL > #OBJECT > SELF_CONNECTED_OBJECT > +ARTIFICIAL_OBJECT_00 > +SUBSTANCE_00 > +SOLID_00> +DRUG_00.     The COREL grammar: a conceptual representation language

    [ES] Los sistemas informáticos de comprensión del lenguaje natural requieren una base de conocimiento provista de representaciones conceptuales que reflejen la estructura del sistema cognitivo de los seres humanos. Aunque la semántica superficial puede ser suficiente en algunas otras aplicaciones computacionales, la construcción de una base de conocimiento robusta garantiza su reutilización en la mayoría de las tareas de procesamiento del lenguaje natural. En este escenario, FunGramKB se presenta como una base de conocimiento multipropósito cuyo modelo ha sido diseñado de manera específica para tareas de comprensión del lenguaje natural. Precisamente, uno de los elementos que han contribuido en forma notable al éxito de esta base de conocimiento ha sido el poder expresivo de su sistema notacional. El propósito de este artículo es describir la gramática, junto con su fundamentación teórica, del lenguaje de representación conceptual utilizado en FunGramKB.[EN] Natural language understanding systems require a knowledge base provided with conceptual representations reflecting the structure of human beings' cognitive system. Although surface semantics can be sufficient in some other systems, the construction of a robust knowledge base guarantees its reuse in most natural language processing applications. In this scenario, FunGramKB is presented as a multipurpose knowledge base whose model has been particularly designed for natural language understanding tasks. Indeed, one of the features which has remarkably contributed to the success of this knowledge base is the expressive power of its notational system. The aim of this paper is to describe the grammar, together with its theoretical foundation, of the conceptual representation language used in FunGramKB.