8 research outputs found

    Automatic domain-specific learning: towards a methodology for ontology enrichment

    Get PDF
    [EN] At the current rate of technological development, in a world where enormous amount of data are constantly created and in which the Internet is used as the primary means for information exchange, there exists a need for tools that help processing, analyzing and using that information. However, while the growth of information poses many opportunities for social and scientific advance, it has also highlighted the difficulties of extracting meaningful patterns from massive data. Ontologies have been claimed to play a major role in the processing of large-scale data, as they serve as universal models of knowledge representation, and are being studied as possible solutions to this. This paper presents a method for the automatic expansion of ontologies based on corpus and terminological data exploitation. The proposed ¿ontology enrichment method¿ (OEM) consists of a sequence of tasks aimed at classifying an input keyword automatically under its corresponding node within a target ontology. Results prove that the method can be successfully applied for the automatic classification of specialized units into a reference ontology.Financial support for this research has been provided by the DGI, Spanish Ministry of Education and Science, grant FFI2011-29798-C0201.Ureña Gómez-Moreno, P.; Mestre-Mestre, EM. (2017). Automatic domain-specific learning: towards a methodology for ontology enrichment. LFE. Revista de Lenguas para Fines Específicos. 23(2):63-85. http://hdl.handle.net/10251/148357S638523

    Introducción a FunGramKB

    Get PDF
    Los vínculos entre el procesamiento del lenguaje natural y la lingüística teórica no han sido ni tan numerosos ni tan productivos como podríamos esperar. En los últimos veinte años, ha aumentado progresivamente la tendencia a utilizar enfoques estadísticos, los cuales resultan más económicos y rápidos de implementar. No obstante, con el fin de realizar algún avance en el procesamiento semántico y pragmático, se requiere un nuevo paradigma en los sistemas de comprensión del lenguaje, en el cual se conjuguen los resultados investigadores de disciplinas como la ciencia cognitiva, la lingüística y la inteligencia artificial. Con este objetivo, se diseñó e implementó computacionalmente la base de conocimiento FunGramKB. Este artículo presenta brevemente los diversos módulos que configuran los niveles léxico, gramatical y conceptual en esta base de conocimiento, destaca aquellas investigaciones que han influido de manera más determinante en nuestro modelo teórico y además describe el papel de este recurso en un sistema del procesamiento del lenguaje natural

    Enhancing a role and reference grammar approach to English motion constructions in a Natural Language Processing environment

    Full text link
    This paper puts forward a finer-grained computational treatment of the English caused-motion construction (e.g. He kicked the ball into the net) within a knowledge base for natural language processing systems called FunGramKB. This computational project is largely based on Role and Reference Grammar (RRG), which is a functional projectionist theory of language. We argue that the RRG-based characterization of the caused-motion construction in FunGramKB is insufficient to account for the semantic and syntactic complexity of realizations such as He walked the dog to the park, I will show you out, or Mac flew Continental to Bush International Airport. Thus, drawing on insights from Constructions Grammars, three minimally distinct transitive motion sub-constructions are formalized within FunGramKB. It is through the inclusion of additional constructional schemas that the machine will be able to capture the various ways in which verbs and constructions interact to yield different input textsEste artículo presenta un tratamiento computacional más fino de la construcción de movimiento causado en inglés (por ejemplo, He kicked the ball into the net, “metió de una patada la pelota en la red”) en una base de conocimientos para sistemas de Procesamiento de Lenguaje Natural llamada FunGramKB. Este proyecto computacional se basa en gran medida en la Gramática del Papel y la Referencia (RRG), que es una teoría funcionalista del lenguaje. Argumentamos que la caracterización basada en la RRG de la construcción de movimiento causado en FunGramKB es insuficiente para explicar la complejidad semántica y sintáctica de realizaciones tales como He walked the dog to the park, I will show you out, or Mac flew Continental to Bush International Airport , “Sacó a pasear al perro al parque, Te enseño la salida, Mac voló Continental al Aeropuerto Internacional Bush”. Así, basándose en las propuestas de las Gramáticas de Construcciones, se formalizan dentro de FunGramKB tres sub-construcciones de movimiento transitivas ligeramente distintas. A través de la de esquemas constructivos adicionales la máquina será capaz de dar cuenta de las diversas formas en que interactúan los verbos y las construcciones para producir diferentes textos de entradaThe research projects on which this paper is based have received financial support from the Spanish Ministry of Economy and Competitiveness, grants no. FFI2013- 43593-P and FFI2014-53788-C3-1-

    Introducción a FunGramKB

    Full text link
    [ES] Los vínculos entre el procesamiento del lenguaje natural y la lingüística teórica no han sido ni tan numerosos ni tan productivos como podríamos esperar. En los últimos veinte años, ha aumentado progresivamente la tendencia a utilizar enfoques estadísticos, los cuales resultan más económicos y rápidos de implementar. No obstante, con el fin de realizar algún avance en el procesamiento semántico y pragmático, se requiere un nuevo paradigma en los sistemas de comprensión del lenguaje, en el cual se conjuguen los resultados investigadores de disciplinas como la ciencia cognitiva, la lingüística y la inteligencia artificial. Con este objetivo, se diseñó e implementó computacionalmente la base de conocimiento FunGramKB. Este artículo presenta brevemente los diversos módulos que configuran los niveles léxico, gramatical y conceptual en esta base de conocimiento, destaca aquellas investigaciones que han influido de manera más determinante en nuestro modelo teórico y además describe el papel de este recurso en un sistema del procesamiento del lenguaje natural.Este trabajo forma parte de varios proyectos de investigación financiados por el Ministerio de Ciencia y Tecnología, códigos FFI2008-05035-C02-01, FFI2010-15983 y FFI2010-17610.Periñán Pascual, JC.; Arcas Túnez, F. (2011). Introducción a FunGramKB. Anglogermánica Online. (8):1-15. http://hdl.handle.net/10251/30979S115

    Conceptualization of entities in a criminal law subontology: analysing the superordinate concept +DRUG_00 in FunGramKb

    Get PDF
    [ES] Este artículo describe las fases de construcción de una ontología terminológica dentro de la arquitectura de FunGramKB, una base de conocimiento léxico-conceptual para el procesamiento computacional del lenguaje natural. La descomposición semántica de la terminología compleja se realiza siguiendo el proceso COHERENT, esto es, una metodología gradual para la formalización de conceptos especializados. Para tratar de ilustrar este proceso hemos seleccionado el concepto +DRUG_00, así como otros conceptos subordinados, tales como METHAMPHETAMINE00,METHAMPHETAMINE_00, CANNABIS_00 y COCAINE_00 pertenecientes al dominio de las sustancias estupefacientes (drogas). Las definiciones de los conceptos seleccionados se basan en COREL, un metalenguaje de interfaz inspirado en algunos principios generales de la Gramática del Rol y la Referencia (GRR). Como resultado del proceso de modelado, subsunción y jerarquización, la ruta conceptual superior de la ontología se representa en la Ontología Satélite dentro de FunGramKB según el siguiente esquema: #ENTITY > #PHYSICAL > #OBJECT > #SELF_CONNECTED_OBJECT > +ARTIFICIAL_OBJECT_00 > +SUBSTANCE_00 > +SOLID_00 > +DRUG_00. [EN] This article describes some phases in the process of constructing a term-based Satellite Ontology within the architecture of the Core Ontology integrated in FunGramKB (a lexico-conceptual knowledge base for the computational processing of natural language). The semantic decomposition of complex terminology is implemented following the COHERENT methodology (a stepwise method for formalizing specialized concepts). For that purpose, we have selected the superordinate concept +DRUG_00 as well as other subordinate concepts in the domain of drugs such as METHAMPHETAMINE_00, CANNABIS00,andCANNABIS_00, and COCAINE_00. The definitions of the concepts selected for the study are based on COREL, an interface metalanguage inspired on some general principles of Role and Reference Grammar (RRG). As a result of the modeling, subsumption and hierarchization process the top conceptual path is represented in the Satellite Ontology as follows: #ENTITY > #PHYSICAL > #OBJECT > SELF_CONNECTED_OBJECT > +ARTIFICIAL_OBJECT_00 > +SUBSTANCE_00 > +SOLID_00> +DRUG_00.Este artículo forma parte del proyecto de investigación I+D+i titulado “Representación formal de una ontología sobre derecho penal y su integración en una base de conocimiento para la comprensión del lenguaje natural”, financiado en el marco del Programa Operativo FEDER Andalucía 2014-2020 (Junta de Andalucía). Código: B-HUM-177-UGR18Felices Lago, ÁM.; Ureña Gómez-Moreno, P. (2020). Conceptualización de entidades terminológicas en una subontología de derecho penal: análisis del concepto superordinado +DRUG_00 en FunGramKb. Revista de Lingüística y Lenguas Aplicadas. 15(1):15-25. https://doi.org/10.4995/rlyla.2020.12772OJS1525151Asaro, C., Biasiotti, M.A., Guidotti, P., Papini, M., Sagri, M.T., Tiscornia, D. (2003). "A Domain Ontology: Italian Crime Ontology". ICAIL 2003 Workshop on Legal Ontologies & Web based legal information management, 1-7.Bak, J., Jedrzejek, C., Falkowski, M. (2010). "Application of an Ontology-Based and Rule-Based Model to Selected Economic Crimes: Fraudulent Disbursement and Money Laundering", en M. Dean, J. Hall, A. Rotolo, S. & S. Tabet (eds.) RuleML 2010. LNCS, vol. 6403. Heidelberg: Springer, 210-22. https://doi.org/10.1007/978-3-642-16289-3_18Bezzazi, E. H. (2007). "Building an Ontology That Helps Identify Criminal Law Articles That Apply to a Cybercrime Case", en ICSOFT (PL/DPS/KE/MUSE), 179-185.Bowker, L., Pearson, J. (2002). Working with Specialized Language. A Practical Guide to Using Corpora. Londres, Nueva York: Routledge. https://doi.org/10.4324/9780203469255Breuker, J., Winkels, R. (2003). "Use and reuse of legal ontologies in Knowledge Engineering and Information Management". ICAIL03 Wks on Legal Ontologies and Web-based Information Management, Edimburgo, http://lri.jur.uva.nl/~winkels/legontICAIL2003.htmlBreuker J., Casanovas, P., Klein, M.A.C., Francesconi, E. (eds.) (2008). Law, Ontologies and the Semantic Web. Amsterdam: IOS Press.Carrión, M.G. (2012). "Extracción y análisis de unidades léxico-conceptuales del dominio jurídico: un acercamiento metodológico desde FunGramKB", RaeL, 11, 25-39.Cortés, F., Mairal, R. (2016). "Building an RRG computational grammar", Onomázein, 34, 86-117. https://doi.org/10.7764/onomazein.34.22Felices, A. (2015). "Foundational considerations for the development of the Globalcrimeterm subontology: A research project based on FunGramKB", Onomázein, 31, 127-144. https://doi.org/10.7764/onomazein.31.9Felices, A. (2016). "The Process of Constructing Ontological Meaning Based on Criminal Law Verbs", Círculo de Lingüística Aplicada a la Comunicación, 65, 109-148. https://doi.org/10.5209/rev_CLAC.2016.v65.51983Felices, A., Ureña, P. (2012). "Fundamentos metodológicos de la creación subontológica en FunGramKB", Onomázein, 26, 49-67.Felices, A., Ureña, P. (2014). "FunGramKB Term Extractor: a key instrument for building a satellite ontology based on a specialized corpus". En B. Nolan & C. Periñán (eds.) Language processing and grammars: The role of functionally oriented computational models. Amsterdam: John Benjamins, 251-269. https://doi.org/10.1075/slcs.150.10felFelices, A., Alameda, A. (2017). "The process of building the upper-level hierarchy for the aircraft structure ontology to be integrated in FunGramKB", Revista de Lenguas para Fines Específicos, 23(2), 86-110.Gangemi A., Sagri MT., Tiscornia D. (2005) A Constructive Framework for Legal Ontologies. In: Benjamins V.R., Casanovas P., Breuker J., Gangemi A. (eds) Law and the Semantic Web. Lecture Notes in Computer Science, vol 3369. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-540-32253-5_7Gruber, T.R. (1993). "A translation approach to portable ontologies". Knowledge Acquisition, 5(2), 199-220. https://doi.org/10.1006/knac.1993.1008Jiménez, R., Luzondo, A. (2011). "Building Ontological Meaning in a Lexico-conceptual Knowledge Base", Onomázein, 23, 11-40.Koester, A. (2010). "Building small specialised corpora". En A. O' Keeffe & M. McCarthy (eds.) The Routledge Handbook of Corpus Linguistics. Londres: Routledge, 66-79. https://doi.org/10.4324/9780203856949.ch6Lenci, A., Bel, N., Busa, F., Calzolari, N., Gola, E., Monachini, M., Ogonowski, A. Peters, I., Peters, W., Ruimy, N., Villegas, M., Zampolli, A. (2000). "SIMPLE: A general framework for the development of multilingual lexicon", International Journal of Lexicography, 13/4, 249-263. https://doi.org/10.1093/ijl/13.4.249Martín-Mingorance, L. (1994). "La lexicografía onomasiológica". En Hernández Hernández, H. (ed.) Aspectos de lexicografía contemporánea. Barcelona: Biglograf, 15-28.Musen, M.A. (1992). "Dimensions of knowledge sharing and reuse". Computers and Biomedical Research 25, 435- 467. https://doi.org/10.1016/0010-4809(92)90003-SNiles, I., Pease, A. (2001). "Towards a standard Upper Ontology". En Proceedings of the Second International Conference on Formal Ontology in Information Systems. Ogunquit. https://doi.org/10.1145/505168.505170.Osathitporn, P., Soonthornphisaj, N., Vatanawood, W. (2017). "A scheme of criminal law knowledge acquisition using ontology". En 2017 18th IEEE/ACIS International Conference on Software Engineering, Artificial Intelligence, Networking and Parallel/Distributed Computing (SNPD). IEEE. 29-34. https://doi.org/10.1109/SNPD.2017.8022696Periñán, C. (2012). "En defensa del procesamiento del lenguaje natural fundamentado en la lingüística teórica", Onomázein, 26, 13-48.Periñán, C. (2013). "A knowledge-engineering approach to the cognitive categorization of lexical meaning", VIAL-Vigo International Journal of Applied Linguistics, 10, 85-104.Periñán, C. (2015). "The underpinnings of a composite measure for automatic term extraction: the case of SRC", Terminology, 21/2, 151-179. https://doi.org/10.1075/term.21.2.02perPeriñán, C. (2017). "Bridging the gap within text-data analytics: a computer environment for data analysis in linguistic research", Revista de Lenguas para Fines Específicos, 23/2, 111-132.Periñán, C. (2018). "DEXTER: a workbench for automatic term extraction with specialized corpora", Natural Language Engineering, 24/2, 163-198. https://doi.org/10.1017/S1351324917000365Periñán, C., Arcas, F. (2004). "Meaning postulates in a lexico-conceptual knowledge base". En 15th International Workshop on Databases and Expert Systems Applications, IEEE, Los Alamitos (California), 38-42.Periñán, C., Arcas, F. (2010a). The architecture of FunGramKB. Proceedings of the 7th International Conference on Language Resources and Evaluation, European Language Resources Association (ELRA), 2667-2674.Periñán, C., Arcas, F. (2010b). "Ontological commitments in FunGramKB", Procesamiento del Lenguaje Natural, 44, 27-34.Periñán, C., Mairal, R. (2010). "La gramática de COREL: un lenguaje de representación conceptual", Onomázein, 21, 11-45.Periñán, C., Arcas, F. (2014). "The implementation of the FunGramKB CLS Constructor". En B. Nolan y C. Periñán (eds.), Language Processing and Grammars: The Role of Functionally Oriented Computational Models. Amsterdam: John Benjamins, 165-169. https://doi.org/10.1075/slcs.150.07perPeriñán, C., Arcas, F. (2019). "Detecting environmentally-related problems on Twitter", Biosystems Engineering, 177, 31-48. https://doi.org/10.1016/j.biosystemseng.2018.10.001Periñán, C., Mairal, R. (2010). "Enhancing UniArab with FunGramKB", Procesamiento del Lenguaje Natural, 44, 19-26.Periñán, C., Mairal, R. (2011). "The COHERENT Methodology in FunGramKB", Onomázein, 24, 13-33.Procter, P. (Ed.) (1978). Longman Dictionary of Contemporary English. Harlow: Longman.Ruiz de Mendoza, F., Mairal, R. (2008). "Levels of description and constraining factors in meaning construction: an Introduction to the Lexical Constructional Model", Folia Linguistica, 42/2, 355-400. https://doi.org/10.1515/FLIN.2008.355San Martín, A., Faber, P. (2014). "Deep semantic representation in a domain-specific ontology: Linking EcoLexicon to FunGramKB". En B. Nolan & C. Periñán (eds.) Language Processing and Grammars: The Role of Functionally Oriented Computational Models. Amsterdam/Filadelfia: John Benjamins, 271-296. https://doi.org/10.1075/slcs.150.11marSartor, G., Casanovas, P., Biasiotti, M.A., Fernández-Barrera, M. (eds.) (2011) Approaches to Legal Ontologies, Theories, Domains, Methodologies. Berlín: Springer. https://doi.org/10.1007/978-94-007-0120-5Soh, C., Lim, S., Hong, K., Rhim, Y.Y. (2018). Ontology Modeling for Criminal Law. En U. Pagallo, M. Palmirani, P. Casanovas, G. Sartor, S. Villata (eds.) AI Approaches to the Complexity of Legal Systems AICOL 2015, AICOL 2016, AICOL 2017. Lecture Notes in Computer Science, vol 10791. Cham: Springer, 365-379. https://doi.org/10.1007/978-3-030-00178-0_25Valente, A., Breuker, J. (1994). "A functional view of law", en G. Bargellini & S. Binazzi (eds.) Towards a Global Expert System in Law. Padua: CEDAM Publishers.Valente, A. (2005). "Types and Roles of Legal Ontologies". En V.R. Benjamins, Casanovas, P., Breuker, j., Gangemi, A. (eds.), Law and the Semantic Web. Berlín: Springer, 65-76. https://doi.org/10.1007/978-3-540-32253-5_5Van Valin, R.D. (2005). The Syntax-Semantics-Pragmatics Interface: An Introduction to Role and Reference Grammar, Cambridge: Cambridge University Press. https://doi.org/10.1017/CBO9780511610578.002Van Valin, R.D., LaPolla, R.J. (1997). Syntax: Structure, Meaning, and Function. Cambridge: Cambridge University Press. https://doi.org/10.1017/CBO9781139166799Velardi, P., Pazienza, M.T., Fasolo, M. (1991). "How to encode semantic Knowledge: a method for meaning representation and computer-aided acquisition", Computational Linguistics, 17/2, 153-170

    The COREL grammar: a conceptual representation language

    Full text link
    [ES] Los sistemas informáticos de comprensión del lenguaje natural requieren una base de conocimiento provista de representaciones conceptuales que reflejen la estructura del sistema cognitivo de los seres humanos. Aunque la semántica superficial puede ser suficiente en algunas otras aplicaciones computacionales, la construcción de una base de conocimiento robusta garantiza su reutilización en la mayoría de las tareas de procesamiento del lenguaje natural. En este escenario, FunGramKB se presenta como una base de conocimiento multipropósito cuyo modelo ha sido diseñado de manera específica para tareas de comprensión del lenguaje natural. Precisamente, uno de los elementos que han contribuido en forma notable al éxito de esta base de conocimiento ha sido el poder expresivo de su sistema notacional. El propósito de este artículo es describir la gramática, junto con su fundamentación teórica, del lenguaje de representación conceptual utilizado en FunGramKB.[EN] Natural language understanding systems require a knowledge base provided with conceptual representations reflecting the structure of human beings’ cognitive system. Although surface semantics can be sufficient in some other systems, the construction of a robust knowledge base guarantees its reuse in most natural language processing applications. In this scenario, FunGramKB is presented as a multipurpose knowledge base whose model has been particularly designed for natural language understanding tasks. Indeed, one of the features which has remarkably contributed to the success of this knowledge base is the expressive power of its notational system. The aim of this paper is to describe the grammar, together with its theoretical foundation, of the conceptual representation language used in FunGramKB.Este trabajo forma parte del proyecto de investigación financiado por el Ministerio de Ciencia y Tecnología, código FFI2008-05035-C02-01Periñán Pascual, JC.; Mairal Usón, R. (2010). La gramática de COREL: un lenguaje de representación conceptual. Onomázein : Revista de Lingüística, Filología y Traducción. (21):11-45. http://hdl.handle.net/10251/60655S11452
    corecore