14 research outputs found
A text generation system that uses simple rhetorical figures
Este artículo describe el enriquecimiento de la calidad estilística de los
textos generados por el sistema PRINCE, una aplicación de generación de lenguaje
natural diseñada para construir textos de cuentos fantásticos. Para ello se explota el
potencial de un recurso léxico (WordNet) y algoritmos de mapeamiento estructural
para enriquecer los textos de salida con figuras retóricas simples como metáfora y
analogía. El sistema enriquecido sigue la arquitectura para sistemas multi-agente
OAA, con varios agentes cooperando para conseguir los textos finales. Los resultados
de la versión enriquecida son presentados y discutidos. Finalmente, se describen
algunos problemas y posibles extensiones.This paper describes the improvement of the stylistic quality of the
texts generated by the PRINCE system, a natural language generation application
designed for building texts for simple fairy tales. This is done by exploiting the potential
of a lexical resource - such as WordNet - and structure mapping algorithms to
enhance the output texts with simple rhetorical tropes such as metaphor and analogy.
The enhanced system follows the OAA multi-agent system architecture, with
various agents cooperating to achieve the final texts. The results of the enhanced
version are presented and discussed. Finally, some problems and possible extensions
are described.Partially supported by the Spanish Ministry of
Education and Science, Acción Integrada Hispano-Portuguesa (HP2003-0068
BigMark: análisis y predicción de calificaciones mediante Big Data
Proyecto de innovación docente en el que apliquemos estas técnicas de análisis de datos inteligentes para extraer información a partir de las calificaciones obtenidas por los alumnos durante el curso. El proyecto consiste en el desarrollo de una aplicación inteligente, disponible a través del navegador web o del móvil, para que tanto los profesores como los alumnos puedan ver las calificaciones del curso, compararlas e incluso predecirlas.
La predicción se consigue mediante el análisis de datos y la aplicación de técnicas de regresión estadística a partir de los datos del curso actual y de los cursos anteriores, tanto del alumno que busca información como (de forma anonimizada) de sus compañeros
Caramelos con sabor a nota: apoyo digital para nuevos modelos de seguimiento de la participación en clase
Memoria final del Proyecto de Innovación y Mejora de la Calidad Docente, #262 de la convocatoria 2015
Implementación inicial del sistema de información docente de la Facultad de Informática
Memoria del proyecto Innova-Gestión 441 de la convocatoria 2020/2021 "Implementación inicial del sistema de información docente de la Facultad de Informática" que consistía en la implementación de una primera versión de sistema de información interno para la gestión de Trabajos de Fin de Grado para ser utilizado en la facultad de informática
Expresiones de referencia y figuras retóricas para la distinción y descripción de entidades en discursos generados automáticamente
El campo de la interacción hombre-máquina ha ido evolucionando rápidamente en los últimos años, convirtiéndose en un elemento fundamental de cualquier sistema informático. Si un sistema es capaz de comunicarse con un ser humano mediante interacciones que a éste le resulten naturales y amigables (voz, imágenes, etc.), el usuario será mucho más perceptivo hacia la información que está recibiendo y tendrá más confianza en la aplicación.
En este sentido, un campo fundamental dentro de la interacción hombre máquina es el de la Generación de Lenguaje Natural (GLN), un subcampo de la Inteligencia Artificial y la Lingüística Computacional que se encarga
del diseño e implementación de sistemas que producen textos comprensibles en lenguajes humanos. Entre todos los problemas que se deben resolver para que el proceso completo de generación resulte satisfactorio, se encuentra el de decidir cómo habrá que referirse a las entidades o elementos que aparecerán en el texto.
La tarea de Generación de Expresiones de Referencia se encarga de resolver este problema concreto. Las diferentes menciones al mismo elemento en un texto deben ser reemplazadas por la forma específica en que referirse
a ellas o referencias. A la hora de planificar las referencias de un texto se deben tener en cuenta dos propósitos. En primer lugar, una referencia a un elemento del discurso debe permitir al lector u oyente distinguir a este elemento de cualquier otro presente en el contexto con el que se pudiera confundir. Por otro lado, en ocasiones las referencias contendrán información que más allá de la función de distinguir pretendan además describir las
entidades a las que se refieren, presentando información relevante sobre las mismas previamente desconocida.
De estas dos funciones (distintiva y descriptiva), sólo la primera ha sido ampliamente estudiada en la literatura. Se pueden encontrar numerosos trabajos que se encargan de abarcar el problema de la generación de expresiones
de referencia con función distintiva estudiando aspectos como la minimalidad de una expresión, la semejanza de la expresión a las utilizadas por los seres humanos, la no ambigüedad de la referencia generada, etc.
En cuanto a la descripción de entidades, aunque existen trabajos sobre generación de lenguaje natural basada en descripciones, se ha realizado poco trabajo desde el punto de vista del enriquecimiento del discurso con expresiones descriptivas que adem´as realcen cierta información considerada importante, o sobre la relación de este proceso con la función distintiva de las referencias.
En este trabajo se aborda la generación de referencias de dos maneras diferentes. En primer lugar se proponen soluciones alternativas y mejoras a los algoritmos clásicos de generación de expresiones de referencia básica con
función distintiva. Se aborda el problema desde tres frentes diferentes: cómo adecuar el nivel de abstracción al que se están nombrando las referencias según el contexto de la situación, qué estrategia de búsqueda usar para la
elección de los atributos que permitan distinguir a un concepto, y qué palabras o expresiones resultan más adecuadas para expresar una referencia en lenguaje natural. Para cada uno de estos frentes se presentan soluciones
basadas en técnicas y recursos clásicos de la Inteligencia Artificial como son los algoritmos evolutivos, el razonamiento basado en casos, o las ontologías. Además se evaluarán las diferentes soluciones presentadas teniendo
en cuenta las métricas clásicas en este campo.
En segundo lugar se explora el enriquecimiento de un discurso dado aportando información descriptiva utilizando figuras retóricas basadas en similitudes entre dominios como la comparación y la analogía. Para que sea
posible utilizar este tipo de figuras en un sistema de generación de lenguaje natural se deben resolver problemas de arquitectura, fuentes de conocimiento, determinación de las analogías y comparaciones, etc. En este trabajo se
estudian estos problemas y se propone un marco general para abordar la generación de este tipo de referencias.
Los resultados obtenidos para las soluciones propuestas en este trabajo dan lugar a una discusión sobre aspectos a mejorar en trabajo futuro y limitaciones de los algoritmos implementados. También se discute la relación de la generación de expresiones de referencia, desde el punto de vista de sus funciones distintiva y descriptiva, con el resto del proceso de generación de lenguaje natural.
Finalmente se presentan las conclusiones de esta investigación, así como líneas abiertas para trabajo futuro y campos de aplicación de las soluciones y resultados obtenidos.
[ABSTRACT]
The field of human-computer interaction has evolved rapidly in recent years, becoming a key element of any computer system. If a system is capable of communicating with a human being through interactions that result natural and friendly for him or her (voice, images, etc.), the user will be much more perceptive to the transmitted information and will have more trust on the application and its results.
In this regard, a key area within the human-computer interaction field is Natural Language Generation (NLG), a subfield of Artificial Intelligence and Computational Linguistics. The field of Natural Language Generation
is responsible for the design and implementation of systems that produce understandable texts in human languages from an initial non-linguistic representation of information. Within this field, one of the problems to be solved in order to generate satisfactory results is to decide how to refer to entities or elements that appear in the text.
The task of Referring Expression Generation deals with this specific problem. The different references to the same element in a text should be replaced by specific ways in which to refer to them or references. The process of referring expression generation should take into account two objectives.
First, a reference to an element in the discourse should allow the reader or listener to distinguish it from any other element in the context with which it could be confused. In addition, sometimes the references may contain additional information intended to describe the corresponding entities beyond the function of distinguishing.
Of these two functions (distinctive and descriptive), only the former has been widely studied in the literature. Numerous works can be found dealing with the problem of distinguishing references, confronting issues such as
minimality of an expression, similarity of a expression with the ones used by human beings, absence of ambiguity in the generated reference, etc.
However, although there is some work related to the generation of natural language descriptions, there are fewer works focused on enhancing a discourse with certain expressions that highlight descriptive information
considered important, or on its relationship with the generation of distinguishing references.
This work addresses the complete problem of reference planning in two different ways. Firstly, several solutions and improvements to classical referring expression generation are proposed for references that attempt to
distinguish the referents from other entities in context. The problem is addressed from three fronts: how to adjust the level of abstraction employed to name the reference according to the situation, which strategy to use for
choosing the attributes that distinguish a concept, and what words or expressions are more appropriate to express a reference in natural language.
For each of these points we present solutions based on classical techniques and methodologies of Artificial Intelligence, such as evolutionary algorithms,
case-based reasoning, or ontologies. The results obtained from the different solutions are also evaluated using classical metrics from this field.
Secondly, this work explores the enhancement of a given speech by providing descriptive information using figures of speech based on similarities between domains, such as comparison and analogy. In order to use such figures in a natural language generation system, it is necessary to address issues related to managing sources of knowledge, determining the appropriate figures,and defining an architecture to implement such systems. This work
studies these issues and proposes a general framework to generate this kind of references.
The results obtained by the solutions proposed in this work lead to a discussion on the shortcomings of each approach, identifying aspects that could be improved in future work. The relationship between the generation of referring expressions (both distinctive and descriptive) and the complete process of natural language generation is also discussed.
Finally, the conclusions derived from these lines of research are presented,along with the identification of possible lines for future work and areas of application for the solutions and results presented in this work
Entity description and referring expression generation in automatic generation of discourse
La descripción de entidades es una tarea indispensable en la generación automática de texto para cualquier tipo de discurso. Todo texto necesita referirse a elementos del mundo con distintos fines, y la base de estas referencias serán las descripciones que se han hecho de dichos elementos anteriormente. En este proceso se hayan involucradas dos de las tareas básicas de la Generación de Lenguaje Natural (GLN): la Determinación de Contenido y la Generación de Expresiones de Referencia. En este trabajo se estudia la relación entre ambas al describir entidades y referirse a ellas en cualquier tipo de discurso generado automáticamente. Para ello será necesario revisar la arquitectura clásica de pipeline, estudiando las interacciones que pueden ser necesarias entre los distintos módulos involucrados.Entity description is an essential task in automatic generation of text for any kind of discourse. Every text needs to refer to domain elements with different goals, and the baseline of these references would be the descriptions of these elements presented before. Two of the main tasks of Natural Language Generation (NLG) are involved in this process: Content Determination and Referring Expression Generation. In this work the relation between them is studied from the point of view of entity descriptions and references in any type of automatically generated discourse. It would be necessary to revise the classic pipeline architecture, exploring the interactions between the different modules involved.Esta investigación está financiada por el Ministerio
de Educación y Ciencia (TIN2006-14433-C02-01) y la
Universidad Complutense de Madrid y la Dirección General de Universidades e Investigación de la Comunidad Autónoma de Madrid (CCG07-UCM/TIC-
2803)
Estudio de la evolución de vida artificial: ALiS (Artificial Life Simulation)
El proyecto ALiS surgió a partir de las ideas desarrolladas en el sistema de evolución
digital Tierra, creado por Thomas S. Ray. Su creación fue motivada por el deseo de observar el
proceso evolutivo en un medio distinto de la química del carbono, ya que nuestro conocimiento
actual sobre la vida y la evolución se basa en un único ejemplo: la vida en la Tierra. Un entorno
especialmente adecuado para ello es el medio digital.
ALiS es la simulación de un computador virtual donde la memoria principal está ocupada por programas escritos en un lenguaje ensamblador particular para este computador,
cada uno de los cuales es considerado como una criatura del sistema. Estas criaturas
proceden todas de una criatura ancestral cuya ejecución en el computador la lleva,
simplemente, a copiarse a sí misma en memoria una y otra vez. Añadiendo alteraciones
aleatorias sobre el código de esta criatura podrán aparecer en el sistema criaturas diferentes
de la primitiva, es decir, evolucionadas.
Nuestro trabajo se ha fundamentado en conseguir en primer lugar simular el
computador virtual básico y sobre él ajustar las mutaciones y cambios en el sistema necesarios
para lograr la evolución del mismo. Conseguidos estos objetivos, hemos realizado un análisis
exhaustivo de la evolución obtenida en él.
[ABSTRACT]
The ALiS project originated from the ideas of the digital evolution system Tierra, created
by Thomas S. Ray. It was motivated by the possibility of studying the evolutionary process in an
environment not based on the carbon chemistry, since our current knowledge about life and
evolution is based on a single example: life on Earth. An environment which is specially
appropriate for this is the digital one.
ALiS is the simulation of a virtual computer where the memory is filled with programs
written in an assembler language that is particular for this computer, each one of them
considered as a system creature. All these creatures come from an ancestral one whose
execution in the computer makes copies of itself in memory time and again. Adding random
changes in the code of this ancestor, there can appear creatures that are different from the
ancestor, in other words, evolved creatures.
Our work has consisted of performing a simulation of the basic virtual computer, and
fixing it with the mutations and changes needed to obtain evolution in it. Then, we have made
an exhaustive analysis of the evolution obtained in the system
Análisis y síntesis de expresión emocional en cuentos leídos en voz alta
Un reto importante para los conversores texto-voz es conseguir que la voz sintética
suene lo mas parecido posible a la voz humana. La voz generada por estos sistemas actualmente
suena artificial y esta es la principal causa de rechazo por parte del público general. Para
conseguir que el sintetizador aparente “vida” interesa generar voz con distintos estados
anímicos.
El desafío fundamental de la generación de voz emocional es tratar de generar una emoción
suficientemente clara para que no haya confusión en el oyente. Existen muchas teorías para
definir una escala emocional. La elección de una escala concreta determina las emociones que
se pretenden distinguir. Otro desafío importante es analizar las características acústicas de los
distintos estados emocionales para intentar posteriormente regenerar las mismas a través del
sintetizador (Montero, 2003).
Este trabajo se plantea explorar la viabilidad de modelar las cadencias propias de la narración de
historias a través de los parámetros de control de un conversor texto-voz. Para lograr estos
parámetros se realizará un análisis de material de audio emocional y una vez modeladas cada
una de las emociones se realizará una evaluación del material obtenido.An important challenge for text-to-speech is to get a synthesized voice that sounds as
like as possible to the human voice. The voice synthesized by these systems sounds artificial
and this is the most principal cause of rejection by the public at the moment. In order to obtain a
lively synthesized voice it is necessary to generate a voice with emotions.
The main goal of the generation of emotional voice is try to generate an emotion so clear that
there will be no confusion in the listener. There are a lot of theories in order to define an
emotional scale. The choice of a specific scale determines the emotions that we try to
distinguish. Another important challenge is analyse the acoustic characteristics at different
emotional states in order to try to regenerate the same characteristics by the synthesizer
(Montero, 2003).
This project raises to explorer the possibility of model the lack of the tales through control
parameters in the synthesizer. In order to obtain these parameters we have to carry out an
analysis of emotional audio and then, once we have obtained a model, we have carried out a
test
Una arquitectura software para el desarrollo de aplicaciones de generación de lenguaje natural
Se plantea el desarrollo de un framework orientado a objetos para Sistemas de Generación de Lenguaje Natural (GLN). Se revisan las arquitecturas utilizadas hasta la fecha, se revisa una propuesta de arquitectura genérica, y se describe el tipo de solución que se aspira a conseguir. A partir de esa información se muestra cómo la utilización de metodologías típicas de Ingeniería de Software, como la Orientación a Objeto o los Patrones de Diseño, resuelve algunos de los problemas más acuciantes de los desarrolladores de aplicaciones de GLN. Se presenta el framework implementado y se plantean las aplicaciones en desarrollo que se basan en el código presentado.This paper proposes the development of an object oriented framework for Natural Language Generation Systems (NLG). It reviews the architectures used to date and a proposal for a generic architecture, and it describes the type of solution that is desired. From this information it is shown how the use of software engineering techniques, like Object Oriented Design or Design Patterns, can solve the more pressing problems of NLG. The implemented prototype is described together with two applications under development which use the framework