14 research outputs found

    A text generation system that uses simple rhetorical figures

    Get PDF
    Este artículo describe el enriquecimiento de la calidad estilística de los textos generados por el sistema PRINCE, una aplicación de generación de lenguaje natural diseñada para construir textos de cuentos fantásticos. Para ello se explota el potencial de un recurso léxico (WordNet) y algoritmos de mapeamiento estructural para enriquecer los textos de salida con figuras retóricas simples como metáfora y analogía. El sistema enriquecido sigue la arquitectura para sistemas multi-agente OAA, con varios agentes cooperando para conseguir los textos finales. Los resultados de la versión enriquecida son presentados y discutidos. Finalmente, se describen algunos problemas y posibles extensiones.This paper describes the improvement of the stylistic quality of the texts generated by the PRINCE system, a natural language generation application designed for building texts for simple fairy tales. This is done by exploiting the potential of a lexical resource - such as WordNet - and structure mapping algorithms to enhance the output texts with simple rhetorical tropes such as metaphor and analogy. The enhanced system follows the OAA multi-agent system architecture, with various agents cooperating to achieve the final texts. The results of the enhanced version are presented and discussed. Finally, some problems and possible extensions are described.Partially supported by the Spanish Ministry of Education and Science, Acción Integrada Hispano-Portuguesa (HP2003-0068

    BigMark: análisis y predicción de calificaciones mediante Big Data

    Get PDF
    Proyecto de innovación docente en el que apliquemos estas técnicas de análisis de datos inteligentes para extraer información a partir de las calificaciones obtenidas por los alumnos durante el curso. El proyecto consiste en el desarrollo de una aplicación inteligente, disponible a través del navegador web o del móvil, para que tanto los profesores como los alumnos puedan ver las calificaciones del curso, compararlas e incluso predecirlas. La predicción se consigue mediante el análisis de datos y la aplicación de técnicas de regresión estadística a partir de los datos del curso actual y de los cursos anteriores, tanto del alumno que busca información como (de forma anonimizada) de sus compañeros

    Implementación inicial del sistema de información docente de la Facultad de Informática

    Get PDF
    Memoria del proyecto Innova-Gestión 441 de la convocatoria 2020/2021 "Implementación inicial del sistema de información docente de la Facultad de Informática" que consistía en la implementación de una primera versión de sistema de información interno para la gestión de Trabajos de Fin de Grado para ser utilizado en la facultad de informática

    Expresiones de referencia y figuras retóricas para la distinción y descripción de entidades en discursos generados automáticamente

    Get PDF
    El campo de la interacción hombre-máquina ha ido evolucionando rápidamente en los últimos años, convirtiéndose en un elemento fundamental de cualquier sistema informático. Si un sistema es capaz de comunicarse con un ser humano mediante interacciones que a éste le resulten naturales y amigables (voz, imágenes, etc.), el usuario será mucho más perceptivo hacia la información que está recibiendo y tendrá más confianza en la aplicación. En este sentido, un campo fundamental dentro de la interacción hombre máquina es el de la Generación de Lenguaje Natural (GLN), un subcampo de la Inteligencia Artificial y la Lingüística Computacional que se encarga del diseño e implementación de sistemas que producen textos comprensibles en lenguajes humanos. Entre todos los problemas que se deben resolver para que el proceso completo de generación resulte satisfactorio, se encuentra el de decidir cómo habrá que referirse a las entidades o elementos que aparecerán en el texto. La tarea de Generación de Expresiones de Referencia se encarga de resolver este problema concreto. Las diferentes menciones al mismo elemento en un texto deben ser reemplazadas por la forma específica en que referirse a ellas o referencias. A la hora de planificar las referencias de un texto se deben tener en cuenta dos propósitos. En primer lugar, una referencia a un elemento del discurso debe permitir al lector u oyente distinguir a este elemento de cualquier otro presente en el contexto con el que se pudiera confundir. Por otro lado, en ocasiones las referencias contendrán información que más allá de la función de distinguir pretendan además describir las entidades a las que se refieren, presentando información relevante sobre las mismas previamente desconocida. De estas dos funciones (distintiva y descriptiva), sólo la primera ha sido ampliamente estudiada en la literatura. Se pueden encontrar numerosos trabajos que se encargan de abarcar el problema de la generación de expresiones de referencia con función distintiva estudiando aspectos como la minimalidad de una expresión, la semejanza de la expresión a las utilizadas por los seres humanos, la no ambigüedad de la referencia generada, etc. En cuanto a la descripción de entidades, aunque existen trabajos sobre generación de lenguaje natural basada en descripciones, se ha realizado poco trabajo desde el punto de vista del enriquecimiento del discurso con expresiones descriptivas que adem´as realcen cierta información considerada importante, o sobre la relación de este proceso con la función distintiva de las referencias. En este trabajo se aborda la generación de referencias de dos maneras diferentes. En primer lugar se proponen soluciones alternativas y mejoras a los algoritmos clásicos de generación de expresiones de referencia básica con función distintiva. Se aborda el problema desde tres frentes diferentes: cómo adecuar el nivel de abstracción al que se están nombrando las referencias según el contexto de la situación, qué estrategia de búsqueda usar para la elección de los atributos que permitan distinguir a un concepto, y qué palabras o expresiones resultan más adecuadas para expresar una referencia en lenguaje natural. Para cada uno de estos frentes se presentan soluciones basadas en técnicas y recursos clásicos de la Inteligencia Artificial como son los algoritmos evolutivos, el razonamiento basado en casos, o las ontologías. Además se evaluarán las diferentes soluciones presentadas teniendo en cuenta las métricas clásicas en este campo. En segundo lugar se explora el enriquecimiento de un discurso dado aportando información descriptiva utilizando figuras retóricas basadas en similitudes entre dominios como la comparación y la analogía. Para que sea posible utilizar este tipo de figuras en un sistema de generación de lenguaje natural se deben resolver problemas de arquitectura, fuentes de conocimiento, determinación de las analogías y comparaciones, etc. En este trabajo se estudian estos problemas y se propone un marco general para abordar la generación de este tipo de referencias. Los resultados obtenidos para las soluciones propuestas en este trabajo dan lugar a una discusión sobre aspectos a mejorar en trabajo futuro y limitaciones de los algoritmos implementados. También se discute la relación de la generación de expresiones de referencia, desde el punto de vista de sus funciones distintiva y descriptiva, con el resto del proceso de generación de lenguaje natural. Finalmente se presentan las conclusiones de esta investigación, así como líneas abiertas para trabajo futuro y campos de aplicación de las soluciones y resultados obtenidos. [ABSTRACT] The field of human-computer interaction has evolved rapidly in recent years, becoming a key element of any computer system. If a system is capable of communicating with a human being through interactions that result natural and friendly for him or her (voice, images, etc.), the user will be much more perceptive to the transmitted information and will have more trust on the application and its results. In this regard, a key area within the human-computer interaction field is Natural Language Generation (NLG), a subfield of Artificial Intelligence and Computational Linguistics. The field of Natural Language Generation is responsible for the design and implementation of systems that produce understandable texts in human languages from an initial non-linguistic representation of information. Within this field, one of the problems to be solved in order to generate satisfactory results is to decide how to refer to entities or elements that appear in the text. The task of Referring Expression Generation deals with this specific problem. The different references to the same element in a text should be replaced by specific ways in which to refer to them or references. The process of referring expression generation should take into account two objectives. First, a reference to an element in the discourse should allow the reader or listener to distinguish it from any other element in the context with which it could be confused. In addition, sometimes the references may contain additional information intended to describe the corresponding entities beyond the function of distinguishing. Of these two functions (distinctive and descriptive), only the former has been widely studied in the literature. Numerous works can be found dealing with the problem of distinguishing references, confronting issues such as minimality of an expression, similarity of a expression with the ones used by human beings, absence of ambiguity in the generated reference, etc. However, although there is some work related to the generation of natural language descriptions, there are fewer works focused on enhancing a discourse with certain expressions that highlight descriptive information considered important, or on its relationship with the generation of distinguishing references. This work addresses the complete problem of reference planning in two different ways. Firstly, several solutions and improvements to classical referring expression generation are proposed for references that attempt to distinguish the referents from other entities in context. The problem is addressed from three fronts: how to adjust the level of abstraction employed to name the reference according to the situation, which strategy to use for choosing the attributes that distinguish a concept, and what words or expressions are more appropriate to express a reference in natural language. For each of these points we present solutions based on classical techniques and methodologies of Artificial Intelligence, such as evolutionary algorithms, case-based reasoning, or ontologies. The results obtained from the different solutions are also evaluated using classical metrics from this field. Secondly, this work explores the enhancement of a given speech by providing descriptive information using figures of speech based on similarities between domains, such as comparison and analogy. In order to use such figures in a natural language generation system, it is necessary to address issues related to managing sources of knowledge, determining the appropriate figures,and defining an architecture to implement such systems. This work studies these issues and proposes a general framework to generate this kind of references. The results obtained by the solutions proposed in this work lead to a discussion on the shortcomings of each approach, identifying aspects that could be improved in future work. The relationship between the generation of referring expressions (both distinctive and descriptive) and the complete process of natural language generation is also discussed. Finally, the conclusions derived from these lines of research are presented,along with the identification of possible lines for future work and areas of application for the solutions and results presented in this work

    Entity description and referring expression generation in automatic generation of discourse

    Get PDF
    La descripción de entidades es una tarea indispensable en la generación automática de texto para cualquier tipo de discurso. Todo texto necesita referirse a elementos del mundo con distintos fines, y la base de estas referencias serán las descripciones que se han hecho de dichos elementos anteriormente. En este proceso se hayan involucradas dos de las tareas básicas de la Generación de Lenguaje Natural (GLN): la Determinación de Contenido y la Generación de Expresiones de Referencia. En este trabajo se estudia la relación entre ambas al describir entidades y referirse a ellas en cualquier tipo de discurso generado automáticamente. Para ello será necesario revisar la arquitectura clásica de pipeline, estudiando las interacciones que pueden ser necesarias entre los distintos módulos involucrados.Entity description is an essential task in automatic generation of text for any kind of discourse. Every text needs to refer to domain elements with different goals, and the baseline of these references would be the descriptions of these elements presented before. Two of the main tasks of Natural Language Generation (NLG) are involved in this process: Content Determination and Referring Expression Generation. In this work the relation between them is studied from the point of view of entity descriptions and references in any type of automatically generated discourse. It would be necessary to revise the classic pipeline architecture, exploring the interactions between the different modules involved.Esta investigación está financiada por el Ministerio de Educación y Ciencia (TIN2006-14433-C02-01) y la Universidad Complutense de Madrid y la Dirección General de Universidades e Investigación de la Comunidad Autónoma de Madrid (CCG07-UCM/TIC- 2803)

    Estudio de la evolución de vida artificial: ALiS (Artificial Life Simulation)

    Get PDF
    El proyecto ALiS surgió a partir de las ideas desarrolladas en el sistema de evolución digital Tierra, creado por Thomas S. Ray. Su creación fue motivada por el deseo de observar el proceso evolutivo en un medio distinto de la química del carbono, ya que nuestro conocimiento actual sobre la vida y la evolución se basa en un único ejemplo: la vida en la Tierra. Un entorno especialmente adecuado para ello es el medio digital. ALiS es la simulación de un computador virtual donde la memoria principal está ocupada por programas escritos en un lenguaje ensamblador particular para este computador, cada uno de los cuales es considerado como una criatura del sistema. Estas criaturas proceden todas de una criatura ancestral cuya ejecución en el computador la lleva, simplemente, a copiarse a sí misma en memoria una y otra vez. Añadiendo alteraciones aleatorias sobre el código de esta criatura podrán aparecer en el sistema criaturas diferentes de la primitiva, es decir, evolucionadas. Nuestro trabajo se ha fundamentado en conseguir en primer lugar simular el computador virtual básico y sobre él ajustar las mutaciones y cambios en el sistema necesarios para lograr la evolución del mismo. Conseguidos estos objetivos, hemos realizado un análisis exhaustivo de la evolución obtenida en él. [ABSTRACT] The ALiS project originated from the ideas of the digital evolution system Tierra, created by Thomas S. Ray. It was motivated by the possibility of studying the evolutionary process in an environment not based on the carbon chemistry, since our current knowledge about life and evolution is based on a single example: life on Earth. An environment which is specially appropriate for this is the digital one. ALiS is the simulation of a virtual computer where the memory is filled with programs written in an assembler language that is particular for this computer, each one of them considered as a system creature. All these creatures come from an ancestral one whose execution in the computer makes copies of itself in memory time and again. Adding random changes in the code of this ancestor, there can appear creatures that are different from the ancestor, in other words, evolved creatures. Our work has consisted of performing a simulation of the basic virtual computer, and fixing it with the mutations and changes needed to obtain evolution in it. Then, we have made an exhaustive analysis of the evolution obtained in the system

    Análisis y síntesis de expresión emocional en cuentos leídos en voz alta

    Get PDF
    Un reto importante para los conversores texto-voz es conseguir que la voz sintética suene lo mas parecido posible a la voz humana. La voz generada por estos sistemas actualmente suena artificial y esta es la principal causa de rechazo por parte del público general. Para conseguir que el sintetizador aparente “vida” interesa generar voz con distintos estados anímicos. El desafío fundamental de la generación de voz emocional es tratar de generar una emoción suficientemente clara para que no haya confusión en el oyente. Existen muchas teorías para definir una escala emocional. La elección de una escala concreta determina las emociones que se pretenden distinguir. Otro desafío importante es analizar las características acústicas de los distintos estados emocionales para intentar posteriormente regenerar las mismas a través del sintetizador (Montero, 2003). Este trabajo se plantea explorar la viabilidad de modelar las cadencias propias de la narración de historias a través de los parámetros de control de un conversor texto-voz. Para lograr estos parámetros se realizará un análisis de material de audio emocional y una vez modeladas cada una de las emociones se realizará una evaluación del material obtenido.An important challenge for text-to-speech is to get a synthesized voice that sounds as like as possible to the human voice. The voice synthesized by these systems sounds artificial and this is the most principal cause of rejection by the public at the moment. In order to obtain a lively synthesized voice it is necessary to generate a voice with emotions. The main goal of the generation of emotional voice is try to generate an emotion so clear that there will be no confusion in the listener. There are a lot of theories in order to define an emotional scale. The choice of a specific scale determines the emotions that we try to distinguish. Another important challenge is analyse the acoustic characteristics at different emotional states in order to try to regenerate the same characteristics by the synthesizer (Montero, 2003). This project raises to explorer the possibility of model the lack of the tales through control parameters in the synthesizer. In order to obtain these parameters we have to carry out an analysis of emotional audio and then, once we have obtained a model, we have carried out a test

    Una arquitectura software para el desarrollo de aplicaciones de generación de lenguaje natural

    Get PDF
    Se plantea el desarrollo de un framework orientado a objetos para Sistemas de Generación de Lenguaje Natural (GLN). Se revisan las arquitecturas utilizadas hasta la fecha, se revisa una propuesta de arquitectura genérica, y se describe el tipo de solución que se aspira a conseguir. A partir de esa información se muestra cómo la utilización de metodologías típicas de Ingeniería de Software, como la Orientación a Objeto o los Patrones de Diseño, resuelve algunos de los problemas más acuciantes de los desarrolladores de aplicaciones de GLN. Se presenta el framework implementado y se plantean las aplicaciones en desarrollo que se basan en el código presentado.This paper proposes the development of an object oriented framework for Natural Language Generation Systems (NLG). It reviews the architectures used to date and a proposal for a generic architecture, and it describes the type of solution that is desired. From this information it is shown how the use of software engineering techniques, like Object Oriented Design or Design Patterns, can solve the more pressing problems of NLG. The implemented prototype is described together with two applications under development which use the framework
    corecore