22 research outputs found

    La lucha contra el terrorismo y la delincuencia organizada: Una visión desde la lingüística y la ingeniería del conocimiento

    Get PDF
    The aim of Natural Language Processing is to create computational systems for the production and comprehension of language by machines. In this regard, symbolic approaches to language put forth conceptual models which represent both common and specialised knowledge. This paper describes the ontological modelling of the “collective criminal agent” and its implementation in FunGramKB, a knowledge base for language processing and artificial reasoning. More specifically, the study focuses on the conceptual definition of three terminological units from the domains of terrorism and organised crime: cartel, oriented cluster, and terrorist cell. The main assumption is that ontological modelling applied to language technologies can play a major role in combating a variety of security threats to today’s society.El objetivo del procesamiento del lenguaje natural es la creación sistemas computacionales de producción y comprensión lingüística. Un aspecto prioritario de este enfoque consiste en elaborar modelos conceptuales que permitan formalizar el conocimiento humano. Este artículo aborda la elaboración de modelos que, conteniendo unidades léxicas propias de los ámbitos del terrorismo y ladelincuencia organizada, puedan utilizarse con la base de conocimiento FunGramKB para llevar a cabo tareas de procesamiento lingüístico y de razonamiento artificial.El artículo parte del concepto “agente criminal colectivo” e ilustra la formalización conceptual de las unidades cartel (“cártel”), oriented cluster (“grupo con fines propios”) y terrorist cell (“célula terrorista”). La conceptualización de unidades léxicas constituye un paso fundamental hacia el desarrollo de aplicaciones que ofrezcan soluciones a los distintos problemas que se plantean en el ámbito profesional, así como en el conjunto de la sociedad

    Automatic domain-specific learning: towards a methodology for ontology enrichment

    Get PDF
    [EN] At the current rate of technological development, in a world where enormous amount of data are constantly created and in which the Internet is used as the primary means for information exchange, there exists a need for tools that help processing, analyzing and using that information. However, while the growth of information poses many opportunities for social and scientific advance, it has also highlighted the difficulties of extracting meaningful patterns from massive data. Ontologies have been claimed to play a major role in the processing of large-scale data, as they serve as universal models of knowledge representation, and are being studied as possible solutions to this. This paper presents a method for the automatic expansion of ontologies based on corpus and terminological data exploitation. The proposed ¿ontology enrichment method¿ (OEM) consists of a sequence of tasks aimed at classifying an input keyword automatically under its corresponding node within a target ontology. Results prove that the method can be successfully applied for the automatic classification of specialized units into a reference ontology.Financial support for this research has been provided by the DGI, Spanish Ministry of Education and Science, grant FFI2011-29798-C0201.Ureña Gómez-Moreno, P.; Mestre-Mestre, EM. (2017). Automatic domain-specific learning: towards a methodology for ontology enrichment. LFE. Revista de Lenguas para Fines Específicos. 23(2):63-85. http://hdl.handle.net/10251/148357S638523

    Conceptualization of entities in a criminal law subontology: analysing the superordinate concept +DRUG_00 in FunGramKb

    Get PDF
    [ES] Este artículo describe las fases de construcción de una ontología terminológica dentro de la arquitectura de FunGramKB, una base de conocimiento léxico-conceptual para el procesamiento computacional del lenguaje natural. La descomposición semántica de la terminología compleja se realiza siguiendo el proceso COHERENT, esto es, una metodología gradual para la formalización de conceptos especializados. Para tratar de ilustrar este proceso hemos seleccionado el concepto +DRUG_00, así como otros conceptos subordinados, tales como METHAMPHETAMINE00,METHAMPHETAMINE_00, CANNABIS_00 y COCAINE_00 pertenecientes al dominio de las sustancias estupefacientes (drogas). Las definiciones de los conceptos seleccionados se basan en COREL, un metalenguaje de interfaz inspirado en algunos principios generales de la Gramática del Rol y la Referencia (GRR). Como resultado del proceso de modelado, subsunción y jerarquización, la ruta conceptual superior de la ontología se representa en la Ontología Satélite dentro de FunGramKB según el siguiente esquema: #ENTITY > #PHYSICAL > #OBJECT > #SELF_CONNECTED_OBJECT > +ARTIFICIAL_OBJECT_00 > +SUBSTANCE_00 > +SOLID_00 > +DRUG_00. [EN] This article describes some phases in the process of constructing a term-based Satellite Ontology within the architecture of the Core Ontology integrated in FunGramKB (a lexico-conceptual knowledge base for the computational processing of natural language). The semantic decomposition of complex terminology is implemented following the COHERENT methodology (a stepwise method for formalizing specialized concepts). For that purpose, we have selected the superordinate concept +DRUG_00 as well as other subordinate concepts in the domain of drugs such as METHAMPHETAMINE_00, CANNABIS00,andCANNABIS_00, and COCAINE_00. The definitions of the concepts selected for the study are based on COREL, an interface metalanguage inspired on some general principles of Role and Reference Grammar (RRG). As a result of the modeling, subsumption and hierarchization process the top conceptual path is represented in the Satellite Ontology as follows: #ENTITY > #PHYSICAL > #OBJECT > SELF_CONNECTED_OBJECT > +ARTIFICIAL_OBJECT_00 > +SUBSTANCE_00 > +SOLID_00> +DRUG_00.Este artículo forma parte del proyecto de investigación I+D+i titulado “Representación formal de una ontología sobre derecho penal y su integración en una base de conocimiento para la comprensión del lenguaje natural”, financiado en el marco del Programa Operativo FEDER Andalucía 2014-2020 (Junta de Andalucía). Código: B-HUM-177-UGR18Felices Lago, ÁM.; Ureña Gómez-Moreno, P. (2020). Conceptualización de entidades terminológicas en una subontología de derecho penal: análisis del concepto superordinado +DRUG_00 en FunGramKb. Revista de Lingüística y Lenguas Aplicadas. 15(1):15-25. https://doi.org/10.4995/rlyla.2020.12772OJS1525151Asaro, C., Biasiotti, M.A., Guidotti, P., Papini, M., Sagri, M.T., Tiscornia, D. (2003). "A Domain Ontology: Italian Crime Ontology". ICAIL 2003 Workshop on Legal Ontologies & Web based legal information management, 1-7.Bak, J., Jedrzejek, C., Falkowski, M. (2010). "Application of an Ontology-Based and Rule-Based Model to Selected Economic Crimes: Fraudulent Disbursement and Money Laundering", en M. Dean, J. Hall, A. Rotolo, S. & S. Tabet (eds.) RuleML 2010. LNCS, vol. 6403. Heidelberg: Springer, 210-22. https://doi.org/10.1007/978-3-642-16289-3_18Bezzazi, E. H. (2007). "Building an Ontology That Helps Identify Criminal Law Articles That Apply to a Cybercrime Case", en ICSOFT (PL/DPS/KE/MUSE), 179-185.Bowker, L., Pearson, J. (2002). Working with Specialized Language. A Practical Guide to Using Corpora. Londres, Nueva York: Routledge. https://doi.org/10.4324/9780203469255Breuker, J., Winkels, R. (2003). "Use and reuse of legal ontologies in Knowledge Engineering and Information Management". ICAIL03 Wks on Legal Ontologies and Web-based Information Management, Edimburgo, http://lri.jur.uva.nl/~winkels/legontICAIL2003.htmlBreuker J., Casanovas, P., Klein, M.A.C., Francesconi, E. (eds.) (2008). Law, Ontologies and the Semantic Web. Amsterdam: IOS Press.Carrión, M.G. (2012). "Extracción y análisis de unidades léxico-conceptuales del dominio jurídico: un acercamiento metodológico desde FunGramKB", RaeL, 11, 25-39.Cortés, F., Mairal, R. (2016). "Building an RRG computational grammar", Onomázein, 34, 86-117. https://doi.org/10.7764/onomazein.34.22Felices, A. (2015). "Foundational considerations for the development of the Globalcrimeterm subontology: A research project based on FunGramKB", Onomázein, 31, 127-144. https://doi.org/10.7764/onomazein.31.9Felices, A. (2016). "The Process of Constructing Ontological Meaning Based on Criminal Law Verbs", Círculo de Lingüística Aplicada a la Comunicación, 65, 109-148. https://doi.org/10.5209/rev_CLAC.2016.v65.51983Felices, A., Ureña, P. (2012). "Fundamentos metodológicos de la creación subontológica en FunGramKB", Onomázein, 26, 49-67.Felices, A., Ureña, P. (2014). "FunGramKB Term Extractor: a key instrument for building a satellite ontology based on a specialized corpus". En B. Nolan & C. Periñán (eds.) Language processing and grammars: The role of functionally oriented computational models. Amsterdam: John Benjamins, 251-269. https://doi.org/10.1075/slcs.150.10felFelices, A., Alameda, A. (2017). "The process of building the upper-level hierarchy for the aircraft structure ontology to be integrated in FunGramKB", Revista de Lenguas para Fines Específicos, 23(2), 86-110.Gangemi A., Sagri MT., Tiscornia D. (2005) A Constructive Framework for Legal Ontologies. In: Benjamins V.R., Casanovas P., Breuker J., Gangemi A. (eds) Law and the Semantic Web. Lecture Notes in Computer Science, vol 3369. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-540-32253-5_7Gruber, T.R. (1993). "A translation approach to portable ontologies". Knowledge Acquisition, 5(2), 199-220. https://doi.org/10.1006/knac.1993.1008Jiménez, R., Luzondo, A. (2011). "Building Ontological Meaning in a Lexico-conceptual Knowledge Base", Onomázein, 23, 11-40.Koester, A. (2010). "Building small specialised corpora". En A. O' Keeffe & M. McCarthy (eds.) The Routledge Handbook of Corpus Linguistics. Londres: Routledge, 66-79. https://doi.org/10.4324/9780203856949.ch6Lenci, A., Bel, N., Busa, F., Calzolari, N., Gola, E., Monachini, M., Ogonowski, A. Peters, I., Peters, W., Ruimy, N., Villegas, M., Zampolli, A. (2000). "SIMPLE: A general framework for the development of multilingual lexicon", International Journal of Lexicography, 13/4, 249-263. https://doi.org/10.1093/ijl/13.4.249Martín-Mingorance, L. (1994). "La lexicografía onomasiológica". En Hernández Hernández, H. (ed.) Aspectos de lexicografía contemporánea. Barcelona: Biglograf, 15-28.Musen, M.A. (1992). "Dimensions of knowledge sharing and reuse". Computers and Biomedical Research 25, 435- 467. https://doi.org/10.1016/0010-4809(92)90003-SNiles, I., Pease, A. (2001). "Towards a standard Upper Ontology". En Proceedings of the Second International Conference on Formal Ontology in Information Systems. Ogunquit. https://doi.org/10.1145/505168.505170.Osathitporn, P., Soonthornphisaj, N., Vatanawood, W. (2017). "A scheme of criminal law knowledge acquisition using ontology". En 2017 18th IEEE/ACIS International Conference on Software Engineering, Artificial Intelligence, Networking and Parallel/Distributed Computing (SNPD). IEEE. 29-34. https://doi.org/10.1109/SNPD.2017.8022696Periñán, C. (2012). "En defensa del procesamiento del lenguaje natural fundamentado en la lingüística teórica", Onomázein, 26, 13-48.Periñán, C. (2013). "A knowledge-engineering approach to the cognitive categorization of lexical meaning", VIAL-Vigo International Journal of Applied Linguistics, 10, 85-104.Periñán, C. (2015). "The underpinnings of a composite measure for automatic term extraction: the case of SRC", Terminology, 21/2, 151-179. https://doi.org/10.1075/term.21.2.02perPeriñán, C. (2017). "Bridging the gap within text-data analytics: a computer environment for data analysis in linguistic research", Revista de Lenguas para Fines Específicos, 23/2, 111-132.Periñán, C. (2018). "DEXTER: a workbench for automatic term extraction with specialized corpora", Natural Language Engineering, 24/2, 163-198. https://doi.org/10.1017/S1351324917000365Periñán, C., Arcas, F. (2004). "Meaning postulates in a lexico-conceptual knowledge base". En 15th International Workshop on Databases and Expert Systems Applications, IEEE, Los Alamitos (California), 38-42.Periñán, C., Arcas, F. (2010a). The architecture of FunGramKB. Proceedings of the 7th International Conference on Language Resources and Evaluation, European Language Resources Association (ELRA), 2667-2674.Periñán, C., Arcas, F. (2010b). "Ontological commitments in FunGramKB", Procesamiento del Lenguaje Natural, 44, 27-34.Periñán, C., Mairal, R. (2010). "La gramática de COREL: un lenguaje de representación conceptual", Onomázein, 21, 11-45.Periñán, C., Arcas, F. (2014). "The implementation of the FunGramKB CLS Constructor". En B. Nolan y C. Periñán (eds.), Language Processing and Grammars: The Role of Functionally Oriented Computational Models. Amsterdam: John Benjamins, 165-169. https://doi.org/10.1075/slcs.150.07perPeriñán, C., Arcas, F. (2019). "Detecting environmentally-related problems on Twitter", Biosystems Engineering, 177, 31-48. https://doi.org/10.1016/j.biosystemseng.2018.10.001Periñán, C., Mairal, R. (2010). "Enhancing UniArab with FunGramKB", Procesamiento del Lenguaje Natural, 44, 19-26.Periñán, C., Mairal, R. (2011). "The COHERENT Methodology in FunGramKB", Onomázein, 24, 13-33.Procter, P. (Ed.) (1978). Longman Dictionary of Contemporary English. Harlow: Longman.Ruiz de Mendoza, F., Mairal, R. (2008). "Levels of description and constraining factors in meaning construction: an Introduction to the Lexical Constructional Model", Folia Linguistica, 42/2, 355-400. https://doi.org/10.1515/FLIN.2008.355San Martín, A., Faber, P. (2014). "Deep semantic representation in a domain-specific ontology: Linking EcoLexicon to FunGramKB". En B. Nolan & C. Periñán (eds.) Language Processing and Grammars: The Role of Functionally Oriented Computational Models. Amsterdam/Filadelfia: John Benjamins, 271-296. https://doi.org/10.1075/slcs.150.11marSartor, G., Casanovas, P., Biasiotti, M.A., Fernández-Barrera, M. (eds.) (2011) Approaches to Legal Ontologies, Theories, Domains, Methodologies. Berlín: Springer. https://doi.org/10.1007/978-94-007-0120-5Soh, C., Lim, S., Hong, K., Rhim, Y.Y. (2018). Ontology Modeling for Criminal Law. En U. Pagallo, M. Palmirani, P. Casanovas, G. Sartor, S. Villata (eds.) AI Approaches to the Complexity of Legal Systems AICOL 2015, AICOL 2016, AICOL 2017. Lecture Notes in Computer Science, vol 10791. Cham: Springer, 365-379. https://doi.org/10.1007/978-3-030-00178-0_25Valente, A., Breuker, J. (1994). "A functional view of law", en G. Bargellini & S. Binazzi (eds.) Towards a Global Expert System in Law. Padua: CEDAM Publishers.Valente, A. (2005). "Types and Roles of Legal Ontologies". En V.R. Benjamins, Casanovas, P., Breuker, j., Gangemi, A. (eds.), Law and the Semantic Web. Berlín: Springer, 65-76. https://doi.org/10.1007/978-3-540-32253-5_5Van Valin, R.D. (2005). The Syntax-Semantics-Pragmatics Interface: An Introduction to Role and Reference Grammar, Cambridge: Cambridge University Press. https://doi.org/10.1017/CBO9780511610578.002Van Valin, R.D., LaPolla, R.J. (1997). Syntax: Structure, Meaning, and Function. Cambridge: Cambridge University Press. https://doi.org/10.1017/CBO9781139166799Velardi, P., Pazienza, M.T., Fasolo, M. (1991). "How to encode semantic Knowledge: a method for meaning representation and computer-aided acquisition", Computational Linguistics, 17/2, 153-170

    FunGramKB y la Adquisición Terminológica

    Get PDF
    Este artículo presenta de una manera práctica el proceso de recopilación y adquisición terminológica mediante la herramienta FunGramKB Term Extractor. Analizaremos paso a paso cómo, partiendo de un corpus de textos, obtenemos y definimos un conjunto de términos especializados representativos de un área temática concreta. La importancia de la adquisición terminológica es doble: por un lado, los términos especializados servirán como sustrato lingüístico, tanto para la definición de conceptos como para la creación de subontologías vinculadas a la Ontología Nuclear de la base de conocimiento FunGramKB; en segundo lugar, el trabajo terminológico permitirá no sólo el poblamiento conceptual de un dominio terminológico, sino también la creación de glosarios y diccionarios especializados para labores traductológicas o didácticas

    Gestión del conocimiento. Perspectiva multidisciplinaria. Volumen 17

    Get PDF
    El libro “Gestión del Conocimiento. Perspectiva Multidisciplinaria”, Volumen 17 de la Colección Unión Global, es resultado de investigaciones. Los capítulos del libro, son resultados de investigaciones desarrolladas por sus autores. El libro es una publicación internacional, seriada, continua, arbitrada, de acceso abierto a todas las áreas del conocimiento, orientada a contribuir con procesos de gestión del conocimiento científico, tecnológico y humanístico. Con esta colección, se aspira contribuir con el cultivo, la comprensión, la recopilación y la apropiación social del conocimiento en cuanto a patrimonio intangible de la humanidad, con el propósito de hacer aportes con la transformación de las relaciones socioculturales que sustentan la construcción social de los saberes y su reconocimiento como bien público

    The have-it-that construction: A corpus-based analysis

    Get PDF
    Financial support for this research has been provided by the DGI, Spanish Ministry of Science and Innovation, grant FFI2010-15983.Speakers do not always attribute agency straightforwardly when they communicate. While complying with the maxims of explicitness and relevance, they may depict states of affairs headed by an identifiable source. More often than not, however, it seems they leave out this source for a number of reasons and through different mechanisms. This paper is a corpus-based study of one such non-identifying structures, namely the extrapositional have-it-that construction, in examples such as Several hypotheses have it that land-use changes. Drawing on data from the BNC, this paper investigates the use, distribution and functioning of the have-it-that construction. The paper also highlights the usefulness of simple collexeme analysis in revealing systematic co-selection relationships within the construction.Spanish Ministry of Science and Innovation FFI2010-1598

    La enseñanza y aprendizaje de terminologías en la eduación secundaria: hacia la especialización a través de la lengua

    Get PDF
    Teaching a second language involves the elicitation and acquisition of the general expressions that may be useful for students in everyday situations in which the target language is spoken. However, in the present context of strong scientific de-velopment, many learners are also faced with the need to become acquainted with terminology (i.e. technical and/or specialised vocabulary) representing complex and abstract concepts. This holds especially true for immersion programmes, in which stu-dents must gain an understanding of curricular subjects such as mathematics or history entirely in a second language. A methodology is proposed in this paper for retriev-ing domain lexicons from texts which can contribute to the acquisition of specialised knowledge at later stages of pre-tertiary education. The paper first discusses the im-plementation of a five-phase learning strategy for students with no prior experience in terminology extraction and management, and then presents DEXTER, a tool suitable both for autonomous and in-class work. As it will be shown, the tool provides relevant results even with a relatively small amount of data, thus allowing a fast learning curve.El aprendizaje de una segunda lengua consiste en identificar y adquirir las expresiones que se utilizan a diario en dicha lengua. Sin embargo, en el contexto actual de rápido desarrollo científico, muchos estudiantes se enfrentan a la necesidad de fami-liarizarse, no sólo con las expresiones generales, sino también con un gran número de unidades terminológicas presentes en la lengua meta. Por “terminología” se entiende el vocabulario técnico que se emplea para aludir a conceptos complejos y abstractos pro-venientes de las diversas ramas del conocimiento. Esta necesidad de especialización se observa especialmente en los programas de inmersión, donde los estudiantes aprenden materias como las matemáticas o la historia únicamente en una segunda lengua. Por todo ello, en este artículo se propone una metodología para la recuperación automática de léxico especializado que puede mejorar la adquisición de conocimiento curricular en una segunda lengua en etapas preuniversitarias. El artículo analiza, en primer lugar, una estrategia en cinco fases dirigida a estudiantes sin experiencia previa en la extracción y gestión terminológicas. En segundo lugar, se presenta DEXTER, una herramienta dise-ñada tanto para el trabajo autónomo del alumno como para su uso en clase. Tal y como se muestra, la herramienta proporciona resultados significativos incluso con un número relativamente pequeño de datos, lo que favorece un aprendizaje más rápido

    La enseñanza y aprendizaje de terminologías en la eduación secundaria: hacia la especialización a través de la lengua

    Get PDF
    Teaching a second language involves the elicitation and acquisition of the general expressions that may be useful for students in everyday situations in which the target language is spoken. However, in the present context of strong scientific development, many learners are also faced with the need to become acquainted with terminology (i.e. technical and/or specialised vocabulary) representing complex and abstract concepts. This holds especially true for immersion programmes, in which students must gain an understanding of curricular subjects such as mathematics or history entirely in a second language. A methodology is proposed in this paper for retrieving domain lexicons from texts which can contribute to the acquisition of specialised knowledge at later stages of pre-tertiary education. The paper first discusses the implementation of a five-phase learning strategy for students with no prior experience in terminology extraction and management, and then presents DEXTER, a tool suitable both for autonomous and in-class work. As it will be shown, the tool provides relevant results even with a relatively small amount of data, thus allowing a fast learning curve.El aprendizaje de una segunda lengua consiste en identificar y adquirir las expresiones que se utilizan a diario en dicha lengua. Sin embargo, en el contexto actual de rápido desarrollo científico, muchos estudiantes se enfrentan a la necesidad de familiarizarse, no sólo con las expresiones generales, sino también con un gran número de unidades terminológicas presentes en la lengua meta. Por “terminología” se entiende el vocabulario técnico que se emplea para aludir a conceptos complejos y abstractos provenientes de las diversas ramas del conocimiento. Esta necesidad de especialización se observa especialmente en los programas de inmersión, donde los estudiantes aprenden materias como las matemáticas o la historia únicamente en una segunda lengua. Por todo ello, en este artículo se propone una metodología para la recuperación automática de léxico especializado que puede mejorar la adquisición de conocimiento curricular en una segunda lengua en etapas preuniversitarias. El artículo analiza, en primer lugar, una estrategia en cinco fases dirigida a estudiantes sin experiencia previa en la extracción y gestión terminológicas. En segundo lugar, se presenta DEXTER, una herramienta diseñada tanto para el trabajo autónomo del alumno como para su uso en clase. Tal y como se muestra, la herramienta proporciona resultados significativos incluso con un número relativamente pequeño de datos, lo que favorece un aprendizaje más rápido
    corecore