107 research outputs found

    Comparación de modelos de lenguaje en tareas de transcripción automática de noticiarios televisivos

    Get PDF
    En el presente artículo se investigan diversas técnicas de modelado de lenguaje para una tarea de transcripción automática de noticiarios bilingües. Se compara una aproximación no adaptada con varios esquemas basados en interpolación de modelos. Mediante una estrategia de adaptación dinámica, utilizando reconocedores en paralelo, se ha conseguido reducir la tasa de errores de reconocimiento en un 20.7% con respecto al modelo no adaptado. El artículo también analiza los problemas del habla espontánea que han limitado las mejoras.In this paper several language models for a bilingual broadcast news transcription task are investigated. A non-adapted approach is compared to various schemes based on mixture models. Through the use of a dynamic adaptation strategy, employing several decoders in parallel, a 20.7% reduction in the word error rate was achieved with respect to the non-adapted model. This paper also analyzes the problems of spontaneous speech, which have limited the improvements.Este proyecto ha sido parcialmente apoyado por el MCyT de España, bajo el proyecto TIC2002-02208, y la Xunta de Galicia bajo el proyecto PGIDT03PXIC32201PN

    Reconocimiento y clasificación automatizada de entidades nombradas en documentos medievales (s. XIV): Libro Becerro de las Behetrías

    Get PDF
    Mención Internacional en el título de doctorLos seres humanos utilizamos el lenguaje como medio de comunicación, lo que ha favorecido el desarrollo y organización de la sociedad en las diferentes épocas de la historia. Reflejo de ello son los innumerables testimonios textuales que tuvieron su auge en la época medieval, momento de transición de una sociedad de transmisión básicamente oral a otra en la que imperaba lo escrito. El desarrollo de técnicas computacionales ha pasado a formar parte del escenario de investigación en las Humanidades. En el ámbito de estudio de los testimonios textuales de la época medieval, las técnicas de procesamiento del lenguaje natural (PLN) han transformado significativamente los métodos, abriendo la posibilidad de generar nuevas preguntas de investigación. El procesamiento del lenguaje natural (PLN) ofrece diferentes aplicaciones como la traducción automática, recuperación y extracción de información, reconocimiento del habla, minería de textos entre otras. Dentro de la extracción de información (Information Extraction- IE) se define la subtarea de reconocimiento y clasificación de entidades nombradas EN (Named Entities- NE) cuyo objetivo es principalmente la identificación de nombres propios de personas, lugares y organizaciones. Los sistemas para el reconocimiento y clasificación de EN (NERC- Named Entity Recognition and Classification) utilizan habitualmente técnicas basadas en gramáticas lingüísticas, métodos estadísticos y gazetteers o listados de términos. En esta tesis se propone un método para la explotación de corpus de documentación medieval mediante sistemas de PLN, con el objetivo de la identificación y clasificación automatizada de las EN y relaciones para su posterior puesta a disposición, en abierto, a través de una plataforma web. Para ello, se ha llevado a cabo un estudio de caso utilizando la aplicación Freeling para español estándar y la variante diacrónica del español de los siglos XII al XVI en un corpus formado por los documentos que componen el Libro Becerro de la Behetrías de Castilla, del siglo XIV. Mediante el análisis de los problemas surgidos en la anotación automática se elabora una propuesta de adaptación para el etiquetado de las EN que no contienen triggers denominadas simples y se diseña una aplicación para la identificación de las entidades anidadas o complejas y sus relaciones. Para la evaluación de los resultados obtenidos fue necesaria la elaboración de un corpus anotado de forma manual que constituyese un gold standard, que con los niveles obtenidos de precisión, cobertura y medida F (F-measure), permitieron elaborar de forma semiautomática los gazetters de personas, lugares y organizaciones. Para su almacenamiento se diseñó una base de datos relacional en MySQL que permitiese su publicación en una plataforma web en PHP. Esta plataforma ofrece una interfaz de consulta para los usuarios en general e investigadores de diferentes disciplinas, que cuenta además con la opción de descarga de los programas desarrollados y gazetteers elaborados. Esto la convierte a su vez en una fuente de información para la reutilización e integración de los mismos en otros proyectos dentro de las Humanidades Digitales. Los resultados obtenidos en este estudio de caso ponen de manifiesto que la aplicación de este método abre las posibilidades de investigación, con otros sistemas de PLN, en corpus de documentación medieval para el reconocimiento y extracción de ENs.Computer science developments are currently an integral part of Digital Humanities scholarship. In the field of medieval text analysis, Natural Language Processing research (NLP) is significantly transforming the methods of study, opening up the possibilities to ask new research questions. Natural Language Processing (NLP) techniques facilitate, among others, automatic translation, information extraction and retrieval, speech recognition, and text mining. This thesis proposes a method for applying NLP methods to a medieval document corpus using information extraction (IE) tasks, including named entity (NE) recognition, which aims to identify mainly proper names of persons, places and organizations and their classification. Named Entity Recognition and Classification methods (NERC) often use techniques based on linguistic grammars, statistic methods and gazetteers or term lists. The method proposed in this thesis facilitates the automatic identification and classification of named entities and their relationships, presenting a case study in which the application “Freeling” for standard Spanish, and the diachronic variant for Spanish language from the XII to XVI centuries have been used. The corpus consists of the documents from the “Libro Becerro de la Behetrías de Castilla”, from the XIV century. Via the analysis of the issues emerging from the automatic annotation of this corpus, this investigation proposes an adaptation for labeling the simple named entities, and presents an application developed for the identification of the nested and complex entities and their relationships. The results obtained in this work have been evaluated using a manually annotated corpus (gold standard), analyzing precision, coverage and variance (F values). The evaluated results facilitated the semi-automatic creation of gazetters for persons, places, and organizations. In addition to the method resulting from this investigation, the software and gazetters developed during this work are offered in a web service for free download and can be consulted by specialized or non-specialized researchers from different disciplines via a user-friendly interface. Together, the method, the data, and this implementation aim to open up the possibilities for further medieval documents research and experimentationPrograma Oficial de Doctorado en Documentación: Archivos y Bibliotecas en el Entorno DigitalPresidente: María Isabel C. Jular Pérez-Alfaro.- Secretario: Diego Navarro Bonilla.- Vocal: Francisco Carlos Palett

    Cambio fonético frente a la norma en el español ecuatoriano. Enfoque acústico y sociolingüístico

    Get PDF
    Wydział NeofilologiiPrzedmiotem rozprawy jest relacja pomiędzy zmianą fonetyczną w języku hiszpańskim a normą językową na przykładzie osłabienia głoski /s/ w języku hiszpańskim z miasta Guayaquil w Ekwadorze. Głównym celem jest weryfikacja statusu badanej zmiany językowej w kontekście normy prestiżowej guayaquilskiego wariantu języka hiszpańskiego. Część teoretyczna pracy przedstawia kontekst geolingwistyczny badania i jego związek z normą językową, a także opis różnorodnych aspektów zmiany językowej i wykaz procesów fonetycznych zachodzących we współczesnym języku hiszpańskim. Druga część pracy stanowi opis badania empirycznego przeprowadzonego na autorskim korpusie CHARG, złożonym z fragmentów audycji pochodzących ze stacji radiowych z miasta Guayaquil. Za pomocą metod akustycznych i statystycznych, przeprowadzono półautomatyczną klasyfikację alofonów /s/, a następnie analizę ilościową osłabienia głoski /s/ w mowie spikerów radiowych. Uwzględniono parametry akustyczne głoski oraz zmienne wewnątrz- i zewnątrzjęzykowe wpływające na sposób jej realizacji. Przeprowadzono ponadto ankietę postaw językowych wśród mieszkańców miasta. Badanie wykazało między innymi, że choć aspiracja jest dominującą realizacją głoski /s/ w pozycji implozywnej, to nie cieszy się ona prestiżem jawnym wśród mieszkańców miasta.The subject of the thesis is the relation between the phonetic change in Spanish and the linguistic norm on the example of /s/-weakening in the variety of Spanish spoken in the Ecuadorian city of Guayaquil. The aim is to verify the status of the language change in the context of the prestigious norm of the Guayaquil Spanish. The theoretical part of the thesis describes the geolinguistic context and its relation with the linguistic norm, as well as various aspects of language change and a list of the phonetic processes occurring in contemporary Spanish. The second part of the thesis reports the empirical study carried out on an original corpus CHARG, composed of pieces of programs obtained from Guayaquil’s radio stations. Applying acoustic and statistical methods, we performed a semi-automatic classification of /s/-allophones, as well as a quantitative analysis of /s/-weakening in the radio speech. We included acoustic parameters, as well as linguistic and extralinguistic variables’ impact on the /s/ production. We also conducted a language attitude survey among Guayaquil inhabitants. The study revealed that, despite the preference for /s/-aspiration in speech, Guayaquileans do not assign overt prestige to this kind of articulation.El objetivo de la tesis es la relación entre el cambio fonético en español y la norma lingüística en el ejemplo del debilitamiento de /s/ en el español hablado en la ciudad ecuatoriana de Guayaquil. El propósito principal es verificar el estatus del cambio lingüístico estudiado en el contexto de la norma prestigiosa del español guayaquileño. La parte teórica de la tesis describe el contexto geolingüístico y su relación con la norma lingüística, como también varios aspectos del cambio lingüístico y un listado amplio de los procesos fonéticos observados en el español contemporáneo. La segunda parte de la tesis da cuenta del estudio empírico llevado a cabo sobre un corpus original CHARG, construido de fragmentos de programas de las emisoras de radio guayaquileñas. Empleando métodos acústicos y estadísticos, se ha realizado una clasificación semiautomática de los alófonos de /s/ y un análisis cuantitativo del debilitamiento de /s/ en el habla de locutores de radio. Se han tomado en cuenta parámetros acústicos se /s/ y las variables lingüísticas y extralingüísticas que influyen en el modo de su realización. Asimismo se ha desempeñado una encuesta de actitudes lingüísticas entre los habitantes de la ciudad. El estudio ha revelado que, aunque la aspiración de /s/ es la realización preferida en posición implosiva, no goza del prestigio abierto entre los habitantes de la ciudad

    Discurso, representación y cultura: La valoración simbólica de los noticiarios de televisión: los movimientos sociales chilenos y la visibilidad social

    Get PDF
    Esta investigación asume, como propósito teórico, realizar un desplazamiento que va, siguiendo a Jesús Martín-Barbero (1991), de los medios a las mediaciones y busca dar cuenta del ¿entre-medio¿ que se establece entre las demandas que hacen los movimientos sociales por visibilizar y amplificar sus discursos a través de los noticiarios de televisión y quienes poseen los medios que permiten la visibilidad o no visibilidad social. Se trata por lo tanto de investigar las distintas valoraciones simbólicas que diversos actores e instituciones sociales le atribuyen a los noticiarios de la TV, persiguiendo describir no sólo el medio sino desplazarnos hacia las mediaciones, esto es, concentrarnos en reflexionar desde/sobre ¿las articulaciones entre prácticas de comunicación y movimientos sociales, a las diferentes temporalidades y la pluralidad de matrices culturales ¿ (Martín Barbero, 1991: 203). Este análisis supone una triple búsqueda: incursionar en nuestro imaginario audiovisual y cultural a través de la discusión de los diversos mecanismos y dispositivos que operan en los modos de representación cultural que se inscriben en los noticiarios de la televisión chilena; discutir acerca de la construcción mediática de la realidad tratando con dicotomías como veracidad/falsedad, realidad/ficción, poder/subalternidad, etc.; y, por último, ¿investigar los procesos de constitución de lo masivo desde las transformaciones en las culturas subalternas¿ (Ibíd.: 203). Teniendo esta óptica en mente, los objetivos de esta investigación son los siguientes:Departamento de Prehistoria, Arqueología, Antropología Social y Ciencias y Técnicas Historiográfica

    Estudio de la velocidad de los subtítulos para sordos en España y sus consecuencias normativas

    Get PDF
    Programa de Doctorado en Documentación: Archivos y Bibliotecas en el Entorno Digital por la Universidad Carlos III de MadridPresidenta: Mercedes Caridad Sebastián.- Secretario: David Camacho Fernández.- Vocal: José Miguel Contreras Tejer

    Nuevas tecnologías aplicadas a la realización de la información audiovisual y retransmisiones deportivas

    Full text link
    La televisión del siglo XXI se ha visto transformada ante los grandes cambios que las nuevas tecnologías han traído consigo. La incidencia de los nuevos sistemas de producción digital en la elaboración de los contenidos informativos audiovisuales y retransmisiones deportivas, su repercusión en las categorías laborales y cómo las alteraciones de las rutinas productivas están afectando a las características y calidad de los mensajes informativos y contenidos deportivos son los principales aspectos que conforman el objeto de análisis de "Nuevas tecnologías aplicadas a la realización de la información audiovisual y retransmisiones deportivas". El cambio del sistema de trabajo tradicional, basado en componentes analógicos y/o lineales, al nuevo panorama digital ha ampliado enormemente las posibilidades de los medios de comunicación. La tecnología digital condiciona el proceso de creación del mensaje, pero también afecta al contenido, estructura y estética del propio mensaje. Nuevas rutinas productivas, nuevas categorías profesionales, continuos cambios de equipos e instalaciones y, como no, nuevas inversiones son sólo algunos de los aspectos a los que deben enfrentarse las empresas televisivas que desean adaptarse a las demandas informativas y deportivas del mercado. Sin embargo, esta situación, más allá del aspecto técnico debe contemplar igualmente la dimensión expresiva. Hoy todo es efímero y la tecnología de antaño basada en equipos y soportes lineales está abocada a la desaparición. Cambian las tecnologías y la situación reclama una transformación de los profesionales, ya que las figuras laborales estables tienden a extinguirse. Tal circunstancia crea conflictos respecto a las funciones y relaciones de unas categorías con otras. Ante el reto de las nuevas condiciones tecnológicas, los profesionales de la televisión se ven obligados a reciclarse, y para ello precisan una formación continua que les permita dar el salto a las nuevas demandas laborales.Roger Monzó, V. (2010). Nuevas tecnologías aplicadas a la realización de la información audiovisual y retransmisiones deportivas [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/8440Palanci

    Educación para la "competencia televisiva" : fundamentación, diseño y evaluación de un Programa Didáctico para la formación del telespectador crítico y activo en Educación Secundaria

    Get PDF
    This work presents, firstly, a review of the literature on the relationships between television and education, particularly in the field of education for a critical and active view of the medium. Secondly, it offers a curricular package entitled “Opening the Magic Box”, aimed at secondary education students for the education of viewers in the classroom. The third part of the study centres on design evaluation by experts and the experimentation of the didactic programme in the context of seven classrooms in seven schools in the province of Huelva by means of quantitative and qualitative analysis strategies

    La incidencia del contexto en los discursos

    Get PDF
    Este volumen recoge diversos trabajos que abordan el estudio de la influencia del contexto en los discursos desde diversas perspectivas (sociolingüística, biolingüística, lingüística clínica, etc.) y en diferentes ámbitos comunicativos (conversación afásica, comunicación publicitaria, comunicación virtual, etc.)This book includes several works where the incidence of context into discourse is analyzed from diferent points of view (sociolinguistics, biolinguistics, clinical linguistics, …) and in diferents communicative frames (aphasic conversation, advertising communication, cybernetic communication, …

    Diseño de interfaz y diseño de la interacción. El rol del diseño en el cambio de paradigma televisivo

    Get PDF
    [spa] Diversos factores están transformando la televisión. El proceso de digitalización, su convergencia con Internet, la ampliación de las posibilidades de interactividad y los nuevos hábitos de consumo de los telespectadores están produciendo un cambio de paradigma del medio de comunicación. Ante esta situación, desde la perspectiva del diseño se propone investigar cuál es el rol que asume esta disciplina. A partir de un estudio documental y bibliográfico se ha analizado la televisión interactiva como fenómeno a través de sus interfaces y de las prácticas asociadas al diseño de la interacción. Para el análisis se ha abordado la evolución histórica de la interactividad entre telespectador, televisor y televisión; se han contextualizado los cambios sociales, culturales, económicos y tecnológicos que acompañan esta transformación; y se ha propuesto un mapa de la televisión interactiva con el fin de delimitar su alcance. A partir de este escenario se ha examinado qué significa diseñar televisión interactiva teniendo en cuenta los elementos y factores que la caracterizan. Fruto de la investigación se ha identificado qué responsabilidades debería asumir el diseño y se han propuesto directrices a tener en cuenta para su práctica proyectual y su estudio teórico. También se han identificado los retos del diseño en la transformación del concepto de interactividad, en la figura del telespectador y en las formas de mejorar la usabilidad y accesibilidad de las interfaces televisivas
    corecore