872 research outputs found

    Un corpus para la investigación en la extracción de términos y contextos definitorios: hacia un diccionario de las sexualidades desde México

    Get PDF
    Neste trabalho, faz-se uma descrição da metodologia utilizada na extração terminológica a partir de um corpus sobre o tema da sexualidade no México. Descreve-se o processo de compilação do corpus, assim como a fase de pré-processamento e a etiquetagem em XML. Especificamente, este corpus serve para a extração de termos e seus contextos definitórios. Neste cenário, examinamos o sistema Ecode, uma ferramenta de extração de contextos definitórios. A idéia é utilizar esses recursos para a geração automática de dicionários, isto é, de listas de termos e contextos definitórios que possam servir de base para a construção de dicionários especializados. a integração proposta dos métodos descritos constitui um recurso valioso aplicável a diversas variantes do espanhol,  no caso aqui, dos registros específicos: 1) da linguagem de especialidade sobre o tema da sexualidade e 2) da linguagem familiar dos falantes do espanhol falado no México

    Reconocimiento de patrones lingüísticos para la generación de ontologías aplicadas en la medición del conocimiento

    Get PDF
    This article analyzes the main thematic areas related to the recognition of linguistic patterns for the generation of ontologies. It begins with an introduction to cognitive science as a scientific area that groups knowledge domains included in a proposed measurement model. Then, from the amplitude of the ontology concept, definitions are exposed according to the project’s theoretical framework as well as examples applied in current linguistic resources. It also describes the common characteristics and main concepts of pattern recognition systems (SRP) and their application in computational linguistics to finally conclude in the main aspects to be considered in the development of a recognition system of linguistic patterns. The article contributes to the exploration of new methodologies supported by ICT as a support to knowledge management in organizations with limited resources such as the micro, small, and medium-size enterprises.El presente artículo analiza las principales áreas temáticas relacionadas al reconocimiento de patrones lingüísticos para la generación de ontologías. Comienza con una introducción a la ciencia cognitiva, como área científica que agrupa dominios de conocimiento incluidos en un modelo de medición propuesto. Luego, a partir de la amplitud del concepto ontología se exponen definiciones acotadas al marco teórico, así como ejemplos aplicados en recursos lingüísticos vigentes. Se describen también las características generales y principales de conceptos de los sistemas de reconocimiento de patrones (SRP) y su aplicación en el procesamiento del lenguaje natural, para finalmente concluir en los principales aspectos a considerar en el desarrollo de un sistema de reconocimiento de patrones lingüísticos. El artículo contribuye a la exploración de nuevas metodologías sustentadas en TIC como apoyo a la gestión del conocimiento en organizaciones

    Systematised measurement of organisational capital in knowledge-based firms

    Get PDF
    Indexación: Scopus.Este artículo plantea la necesidad de medir el capital intelectual en las micro, pequeñas y medianas empresas para gestionar su capital organizativo con el objetivo de alcanzar niveles de productividad más competitivos. Se utiliza literatura de medición de capital intelectual y literatura sobre reconocimiento de patrones, contribuyendo específicamente a la medición de capital organizativo. Se emplea un paradigma de investigación cuantitativo y el estudio es de tipo explicativo empleando fuentes primarias y secundarias de datos e información.This article raises the need to measure intellectual capital in micro, small and medium-sized firms in order to manage their organizational capital with the aim of achieving more competitive productivity levels. The article uses intellectual capital measurement literature and literature on pattern recognition contributing specifically the measurement of organisational capital. A quantitative research paradigm is employed and the study is of an explanatory type using primary and secondary sources of data and information.http://revistaespacios.com/a18v39n39/18393904.htm

    Traducción de textos biomédicos: creación de recursos a partir de un corpus sobre enfermedades neuromusculares pediátricas (francés-español)

    Get PDF
    This paper deals with the creation of terminology resources to assist in the translation of biomedical texts. First of all, we describe the criteria used to design and compile the ENEUPECOR corpus, a French-Spanish bilingual specialised corpus constituted by scientific papers on neuromuscular diseases in paediatrics. Afterwards, we describe the methodology and steps involved in corpus exploitation in order to create a French-Spanish bilingual glossary including the main concepts of the sub-domain selected.This study is part of our current research on text translation within the field of rare diseases, domain to which belong neuromuscular diseases in paediatrics. Both the thematic sub-domain selected as well as the choice of languages constitute a novel line of research. Furthermore, the fact that rare diseases are now beginning to be seen as a priority in European Public Health Policies confers more relevance to our work from a social point of view. Thus, academic-scientific interests and social interests go hand-in-hand

    Framework para el procesamiento lingüístico de artículos científicos : Caso de estudio: Universidad Nacional de Chilecito

    Get PDF
    El crecimiento de los datos producto del Acceso Abierto a las publicaciones académicas y científicas han generado estudios que posibilitan la interrelación de áreas como la lingüística y la computación en, por ejemplo, la extracción automática de datos para la creación de modelos teóricos, reconocimiento de estructuras para validación, etc. Este trabajo tiene como objetivo describir un framework elaborado a partir de la Rhetorical Structure Theory (RST) con el lenguaje Python a un corpus de 42 artículos científicos en español de la Universidad Nacional de Chilecito. El análisis se hizo sobre la base de un diseño modular informático y el trabajo manual de un lingüista experto, proceso que sirve para calibrar la propuesta y, luego, ser aplicada a un corpus mayor. Las variables que se consideraron fueron el título, resumen y palabras clave de los 42 artículos y la estructura canónica de un resumen científico (introducción, método, resultados y discusión -IMRD). Los resultados muestran que existen discrepancias en la frecuencia de ciertos elementos en los textos, pero a su vez, denotan coincidencias interesantes para este tipo de análisis textuales.XIV Workshop Bases de Datos y Minería de Datos (WBDDM).Red de Universidades con Carreras en Informática (RedUNCI

    Patterns for marking ingredients and order of processes in Costa Rican gastronomic texts

    Get PDF
    En este artículo, se presentará una síntesis de los procedimientos y resultados relativos a la primera etapa, o etapa precomputacional, del proyecto “Análisis de contextos definicionales en corpus de gastronomía tradicional en Costa Rica (CODEGAT)”, en el que se estudian los recursos de marcación de informaciones gastronómicas presentes en corpus textuales en español en Costa Rica. Concretamente, se expondrán las tareas para la identificación de patrones asociados con dos tipos de rasgos necesarios para la configuración de una receta, que son “ingredientes” y “orden de procesos”, para, finalmente, ofrecer una propuesta de categorización de los marcadores que aparecen en tales patrones, con ejemplos típicos de cada clase y de sus posibles contextos de aparición.In this paper, a synthesis of the procedures and results related to the first stage or pre-computational stage of the research project “Análisis de contextos definicionales en corpus de gastronomía tradicional en Costa Rica (CODEGAT)” [“Analysis of definitional contexts in corpora of traditional gastronomy in Costa Rica (CODEGAT)”] will be presented; in that stage, the linguistic resources for marking conceptual relations in gastronomic textual corpora in Costa Rican Spanish are studied. Specifically, the tasks for the identification of patterns associated with two types of features that were found as necessary in the formulation of a recipe (“ingredients” and “processes order”) will be explained, to finally propose a categorization of the markers that appear in such patterns, with typical examples of each class and of its possible contexts of appearance.UCR::Vicerrectoría de Docencia::Artes y Letras::Facultad de Letras::Escuela de Filología, Lingüística y LiteraturaUCR::Vicerrectoría de Docencia::Ingeniería::Facultad de Ingeniería::Escuela de Ciencias de la Computación e InformáticaUCR::Vicerrectoría de Investigación::Unidades de Investigación::Artes y Letras::Instituto de Investigaciones Lingüísticas (INIL

    Análisis de las definiciones y elaboración de un patrón definitorio del grupo de términos ‘defectos del producto cerámico’

    Get PDF
    Tretzenes Jornades de Foment de la Investigació de la FCHS (Any 2007-2008

    Los marcadores lingüísticos en las definiciones del grupo conceptual “procesos de fabricación cerámica”

    Get PDF
    Catorzenes Jornades de Foment de la Investigació de la FCHS (Any 2008-2009

    Identificación de términos a partir de enumeraciones sintagmáticas nominales: una aplicación al dominio médico

    Get PDF
    Partiendo de la hipótesis de que las enumeraciones sintagmáticas nominales (ESN) que se encuentran en los textos médicos se componen de términos específicos del dominio, presentamos un método de reconocimiento de dichas enumeraciones con el objetivo de contribuir a la extracción automática. La metodología se conforma de tres etapas: (i) reconocimiento de enumeraciones sintagmáticas nominales, aquí se utiliza exclusivamente información lingüística, a partir de la cual se elaboran reglas de análisis sintáctico; (ii) extracción automática de los candidatos a términos que se correspondían con unigramas y bigramas, y (iii) evaluación de los candidatos extraídos con el asesoramiento de expertos del área médica. Los experimentos fueron realizados en el corpus IULA, conformado por textos médicos en español. Los resultados obtenidos fueron alentadores, ya que se logró un 67% y 68% de precisión en las enumeraciones detectadas para unigramas y bigramas respectivamente.Sociedad Argentina de Informática e Investigación Operativ
    corecore