14 research outputs found

    Anotación semántica de los sustantivos del corpus SenSem

    Get PDF
    El objetivo principal del proyecto es la anotación semántica de los sustantivos argumentales del corpus SenSem con los sentidos de WordNet. El objetivo último de la investigación es la adquisición de preferencias semántica

    Semantic annotation of nouns in Sensem corpus

    Get PDF
    El objetivo principal del proyecto es la anotación semántica de los sustantivos argumentales del corpus SenSem con los sentidos de WordNet. El objetivo último de la investigación es la adquisición de preferencias semánticas.The main goal of this project is the semantic annotation of argument nouns of SenSem corpus with synsets of WordNet. The final objective of research is the acquisition of semantic preferences.Esta investigación se ha llevado a cabo gracias a los proyectos FFI2008-02579-E/FILO y TIN2009-14715-C04 del Ministerio de Ciencia e Innovación

    Desambiguación Verbal Automática. Un estudio sobre el rendimiento de la información semántica argumental

    Get PDF
    Treballs Finals de Grau de Lingüística. Facultat de Filologia. Universitat de Barcelona, Curs: 2015-2016, Tutor: Carme Junyent Figueras. Director: Irene Castellón MasallesUna de las tareas fundamentales todavía hoy pendientes de resolución en el ámbito del Procesamiento del Lenguaje Natural es la Desambiguación Semántica Automática (DSA); especialmente la tarea específica de Desambiguación Verbal Automática (DVA). En la presente investigación se aborda esta cuestión del modo siguiente: en primer lugar, se realiza una descripción del panorama actual en DSA, las aproximaciones posibles a esta tarea y los retos que plantea el desarrollo de la DVA. En segundo lugar, se lleva a cabo una tarea experimental con la finalidad de comprobar la viabilidad de una aproximación a la DVA basada en la información semántica de los argumentos verbales. Los buenos resultados obtenidos indicarían la necesidad de tener en cuenta este tipo de información en futuras propuestas de DVA. Palabras clave: Semántica; Procesamiento del Lenguaje Natural; Desambiguación Verbal Automática; Aprendizaje AutomáticoOne of the key tasks still pending in the field of Natural Language Processing is Word Sense Disambiguation (WSD); especially the specific task of Verb Sense Disambiguation (VSD). In the present study this issue is addressed as follows: in the first place, a description of the current situation in WSD, the possible approaches to this task and the challenges posed by the development of VSD is provided. In the second place, an experimental task is performed in order to test the feasibility of an approach to VSD based on semantic information about verbal arguments. The good results obtained indicate the need to take into account this information in future proposals for VSD. Keywords: Semantics; Natural Language Processing; Verb Sense Disambiguation; Machine Learnin

    Lingüística de corpus

    Get PDF
    Este artículo es una presentación general de la lingüística de corpus en el que se expone qué es un corpus lingüístico, qué relación tiene con otros tipos de datos, por qué es necesario anotarlo y cómo es el proceso de anotación. También se pasa revista a algunas de las tareas más comunes en la investigación lingüística basada en corpus, tales como la obtención de listados de frecuencias, la exploración de concordancias o la búsqueda de coapariciones (colocaciones) y otros tipos de información contextual. A lo largo del texto se intenta mostrar la relevancia de este tipo de datos para la teoría lingüística, en particular, para los modelos basados en el uso, como los cognitivos y funcionales.Este artículo es una presentación general de la lingüística de corpus en el que se exponequé es un corpus lingüístico, qué relación tiene con otros tipos de datos, por qué esnecesario anotarlo y cómo es el proceso de anotación. También se pasa revista a algunasde las tareas más comunes en la investigación lingüística basada en corpus, tales como laobtención de listados de frecuencias, la exploración de concordancias o la búsqueda decoapariciones (colocaciones) y otros tipos de información contextual. A lo largo del textose intenta mostrar la relevancia de este tipo de datos para la teoría lingüística, enparticular, para los modelos basados en el uso, como los cognitivos y funcionales.In this paper a general presentation of Corpus Linguistics is provided by explaining whata linguistic corpus is, how it is related to other types of data, why it is necessary toannotate it, and what the annotation process is like. Some of the more common tasks incorpus-based linguistic research are also reviewed, such as obtaining frequency lists,exploring concordances, or finding co-occurrences (collocations) and other types ofcontextual information. Throughout the text, an attempt is made to show the relevance ofthis type of data for linguistic theory, in particular for use-based models, such as thecognitive and functional ones

    Lingüística de corpus: de los datos textuales a la teoría lingüística

    Get PDF
    In this paper a general presentation of Corpus Linguistics is provided by explaining what a linguistic corpus is, how it is related to other types of data, why it is necessary to annotate it, and what the annotation process is like. Some of the more common tasks in corpus-based linguistic research are also reviewed, such as obtaining frequency lists, exploring concordances, or finding co-occurrences (collocations) and other types of contextual information. Throughout the text, an attempt is made to show the relevance of this type of data for linguistic theory, in particular for use-based models, such as the cognitive and functional ones.Este artículo es una presentación general de la lingüística de corpus en el que se expone qué es un corpus lingüístico, qué relación tiene con otros tipos de datos, por qué es necesario anotarlo y cómo es el proceso de anotación. También se pasa revista a algunas de las tareas más comunes en la investigación lingüística basada en corpus, tales como la obtención de listados de frecuencias, la exploración de concordancias o la búsqueda de coapariciones (colocaciones) y otros tipos de información contextual. A lo largo del texto se intenta mostrar la relevancia de este tipo de datos para la teoría lingüística, en particular, para los modelos basados en el uso, como los cognitivos y funcionales

    Agente conversacional inteligente como herramienta de ayuda al proceso de atención al aspirante de las carreras de la Facultad de Tecnología y Ciencias Aplicadas (FTyCA) de la Universidad Nacional de Catamarca (UNCa)

    Get PDF
    La Inteligencia Artificial (IA) es la simulación de la inteligencia humana por parte de una máquina que le permite solucionar problemas similares a como lo realiza un ser humano. Una de las principales áreas en donde se aplica la IA es en el desarrollo de bots conversacionales o chatbots, los cuales son sistemas inteligentes que se utilizan para simular una conversación con una persona utilizando un lenguaje natural ya sea hablado o escrito. Los bots conversacionales tienen la capacidad de retener información para ser utilizada en otro momento de la conversación. Un bot conversacional es un software que puede imitar una conversación con una persona utilizando un lenguaje natural. Una de las principales dudas de todo interesado a iniciar el cursado de una carrera es conocer los requisitos para inscribirse. Obtener esta información puede consumirle un tiempo significativo al interesado como a los encargados de la atención al público de proporcionarle esta información. Este proyecto, tiene por finalidad desarrollar un prototipo de agente conversacional inteligente como herramienta de ayuda al proceso de atención al aspirante de las carreras de la Facultad de Tecnología y Ciencias Aplicadas (FTyCA) de la Universidad Nacional de Catamarca (UNCa).Eje: Agentes y Sistemas Inteligentes.Red de Universidades con Carreras en Informátic

    Estudio de métodos semisupervisados para la desambiguación de sentidos verbales del español

    Get PDF
    Esta tesis explora el uso de técnicas semisupervisadas para la desambigación de sentidos verbales del español. El objetivo es el estudio de como la información de datos no etiquetados, que son mayores en tamaño, puede ayudar a un clasificador entrenado desde un conjunto de datos etiquetados pequeño. La tesis comienza desde la tarea completamente supervisada de desambiguación de sentidos verbales y estudia las siguientes técnicas semisupervisadas comparando su impacto en la tarea original: uso de vectores de palabras (o word embeddings), autoaprendizaje, aprendizaje activo y redes neuronales en escalera

    Las alternancias de diátesis en los verbos de sentimiento en español como un problema entre el léxico y la sintaxis

    Get PDF
    [Abstract] This investigation focuses on the relation between lexical units and the syntactic constructions they can accept. The objective is to evaluate if the different syntactic constructions a word can bear are a strong enough criterion to distinguish lexical units. This problem is especially relevant when dealing with the different senses of a verb. This analysis can be focused from, at least, two different points of view. On the one hand, the Construction Grammar approach (Fillmore et al. 1988, Goldberg 1995, 1996) assumes as its basic proposal that syntactic constructions bear independent meanings, so it transfers the problem from the delimitation of different verb senses to the description of the relation between constructions and lexical units. On the other hand, the so-called projectionist approach maintains that the semantic properties of predicates, especially verbs, establish the core semantic representations of a clause or a sentence. This theoretical perspective constitutes the bases of very different theories, such as the ones developed by Levin (1993), Van Voorst (1988) or a lexicographic approach as the Meaning Text Theory (MTT). In this work we concentrate on how the relation between syntactic context and lexical units is treated from both points of view. More specifically, we examine the analysis these two models offer, to describe the variety of syntactic possibilities Spanish verbs of feeling show in the following examples: a. A tu madre le preocupa que llegues tarde b. La noticia preocupó a sus padres c. Sus padres se preocuparon In this examples, a generally intransitive verb, in this case, preocupar, adopts transitive (b) and middle (c) realizations. The use of these syntactic constructions is associated to different verbal meanings. One theoretical possibility could be to establish three different lexical units, so that they both have their own lexicographic entry. Another possibility would be assigning the change of meaning to the syntactic constructions, as it is suggested by Construction Grammar (Goldberg 1995). As we will try to show, these two explanations are not mutually exclusive.[Resumo] Esta investigación céntrase na relación entre significado léxico e estructura sintáctica. O seu obxectivo é evaluar se as diferentes construccións que pode asumir unha palabra constitúen un criterio suficiententemente sólido para establecer unidades léxicas. Este problema adquire especial relevancia cando se trata con diferentes significados verbais. Este análise pode enfocarse, cando menos, dende dous punts de vista. Por unnha banda, o enfoque construccionista, sostido porla Gramática de Construcciones. (Fillmore et al. 1988, Goldberg 1995, 1996), que asume como premisa básica que as construccións sintácticas son portadoras de significado, e considera por tanto que o problema non é tanto a delimitación de diferentes sentidos verbais como a descripción da relación entre construccións e unidades léxicas. Por outra banda, o denominado enfoque proxeccionista¸ que considera que as propiedades semánticas dos predicados, especialmente as dos verbos, establecen o núcleo da organización semántica clausal. Esta perspectiva teórica está na base de modelos tan diferentes como os desarrollados por Levin (1993), Van Voorst (1988) ou modelos de corte lexicográfico como a Teoría Sentido Texto (TST). Ó longo deste trabajo examinaremos como se trata a relación entre contexto sintáctico y unidades léxicas dende ambas perspectivas. Máis especificamente, examinaremos a análise que estes dous puntos de vista propoñen para describir a variedade de posibilidades sintácticas dos verbos de sentimiento tipo preocupar en español, centrándonos nas construccións recollidas nos exemplos siguientes: a. A tu madre le preocupa que llegues tarde b. La noticia preocupó a sus padres c. Sus padres se preocuparon Nestes exemplos, un verbo xeralmente intransitivo como preocupar adoita un uso transitivo (b) e un uso en voz media (c). Como describiremos, o empleo destas estructuras sintácticas conleva diferencias formais e semánticas. Intentaremos establecer se estas diferencias requiren a diferenciación de distintas unidades léxicas ou é posible asignar as variaciones semánticas ás construcciones sintácticas.[Resumen] Esta investigación se centra en la relación entre significado léxico y estructura sintáctica. Su objetivo es evaluar si las diferentes construcciones que puede asumir una palabra constituyen un criterio suficientemente sólido para establecer unidades léxicas. Este problema adquiere especial relevancia si se trata con diferentes significados verbales. Este análisis puede enfocarse desde, al menos, dos puntos de vista diferentes. Por un lado, el enfoque construccionista, o sostenido por la Gramática de Construcciones. (Fillmore et al. 1988, Goldberg 1995, 1996), que asume como premisa básica que las construcciones sintácticas son portadoras de significado, y considera por tanto que el problema no es tanto la delimitación de diferentes sentidos verbales como la descripción de la relación entre construcciones y unidades léxicas. Por otro lado, el denominado enfoque proyeccionista¿ que considera que las propiedades semánticas de los predicados, especialmente de los verbos, establecen el núcleo de la organización semántica clausal. Esta perspectiva teórica se encuentra en la base de modelos tan diferentes como los desarrollados por Levin (1993), Van Voorst (1988) o modelos de corte lexicográfico como la Teoría Sentido Texto (TST). A lo largo de este trabajo examinaremos cómo se trata la relación entre contexto sintáctico y unidades léxicas desde ambas perspectivas. Más específicamente, examinaremos el análisis que estos dos puntos de vista proponen para describir la variedad de posibilidades sintácticas de los verbos de sentimiento tipo preocupar en español, centrándonos en las construcciones recogidas en los ejemplos siguientes: a. A tu madre le preocupa que llegues tarde b. La noticia preocupó a sus padres c. Sus padres se preocuparon En estos ejemplos, un verbo generalmente intransitivo como preocupar adopta un uso transitivo (b) y un uso en voz media (c). Como describiremos, el empleo de estas construcciones sintácticas conlleva diferencias formales y semánticas. Intentaremos establecer si estas diferencias requieren la diferenciación de distintas unidades léxicas o es posible asignar las variaciones semánticas a las construcciones sintácticas

    Visualización del lenguaje a través de corpus

    Get PDF
    Digital version of the print publication, published in A Coruña: Universidade da Coruña, Servizo de Publicacións, 2010 (ISBN 978-84-9749-401-4)This book contains the papers presented at the Second International Conference on Corpus Linguistics held at the University of A Coruña in 2010 and organised by the MuStE group. The essays deal with different aspects of corpus linguistics both as a methodology and as a branch of Linguistics.[Abstract] The collection of essays we are presenting here are just a mere sample of the interest the topics relating to Corpus Linguistics have arisen everywhere. Such different topics as those related to Computational Linguistics found in “Obtaining computational resources for languages with scarce resources from closely related computationally-developed languages. The Galician and Portuguese case“ or “Corpus-Based Modelling of Lexical Changes in Manic Depression Disorders: The Case of Edgar Allan Poe” belonging to the field of Corpus and Literary Studies can be found in the ensuing pages. Almost all research areas can nowadays be investigated using Corpus Linguistics as a valid methodology. This is reason why Language Windowing through Corpora gathers papers dealing with discourse, variation and change, grammatical studies, lexicology and lexicography, corpus design, contrastive analyses, language acquisition and learning or translation. This work’s title aims at reflecting not only the great variety of topics gathered in it but also the worldwide interest awaken by the computer processing of language. In fact, researchers from many different institutions all over the world have contributed to this book. Apart from the twenty-two Spanish Universities, people from other Higher Education Institutions have authored and co-authored the essays contained here, namely, Russia, Venezuela, Brazil, UK, Finland, Portugal, Poland, Austria, Mexico, Thailand, Iran, the Netherlands, Belgium, Japan, Turkey, China, Italy, Malaysia, Romania and Sweden. All these essays have been alphabetically arranged, by the names of their authors, in two parts. Part 1 contains the papers by authors from A to K and Part 2, those of authors from L to Z
    corecore