    Where are Romance Studies Heading? A Bibliographic Data Science Analysis Using Regression

    Was waren die wichtigsten Trends in der Romanistik in den letzten Jahrzehnten? Was ist für das nächste Jahrzehnt zu erwarten? Dies sind die beiden Haupt­forschungs­­fragen des vorliegenden Artikels. Zur Beantwortung dieser Fragen wurde ein großer Datensatz von über einer Million romanistischer Forschungs­publikationen aus deutschen Bibliothekskatalogen extrahiert. Dieser Datensatz wird mittels deskriptiver Statistik und linearer Regression analysiert, um die Ent­wicklung in den kommenden Jahren vorherzusagen. Dabei werden verschiedene Felder der jeweiligen Kataloge analysiert, wie z.B. Sprache und Ort der Veröffentlichung, Verlage, E-Book und gedruckte Version, Preis und Themen.What have been the main trends in Romance Studies in the last decades? What can be expected for the next decade? These are the two main research questions of this article. To answer them, a large dataset of over one million publications of research in Romance Studies has been extracted from German library catalogs. This dataset is analyzed through descriptive statistics and linear regression in order to predict the development in future years. Several fields of the respective catalogs are analyzed, such as the language and place of publication, publishers, e-book vs. printed versions, price and subjects.

    The Novel in the Spanish Silver Age

    What distinguishes an adventure novel from a historical novel? Can the same text belong to several genres? More to one than to another? Have some existing genres been overlooked? To answer these and similar questions, José Calvo Tello combines methods from Linguistics (lexicography), Literary Studies (genre theory), and Computer Science (machine learning, natural language processing). Located in the interdisciplinary field of Digital Humanities, this study analyzes a newly developed corpus of 358 Spanish novels of the silver age (1880-1939), which includes authors like Baroja, Pardo Bazán, or Valle-Inclán. Calvo Tello's key result is a graph-based model of literary genre that reconciles recent theoretical approaches

    Catálogo hipertextual de traducciones anónimas al castellano (CHTAC). Un nuevo proyecto de Humanidades Digitales

    Son muchos los proyectos de Humanidades Digitales que en los últimos años se han llevado a cabo en el ámbito de la literatura y lengua españolas: sin embargo no se encuentra aún disponible en red un recurso en el ámbito de la traducción que quiera o pueda ofrecer una catalogación exhaustiva y unificada de todas las traducciones medievales al castellano. A partir de estas premisas y con el fin de paliar su falta, nace la idea de la creación de CHTAC. Catálogo Hipertextual de Traducciones Anónimas al Castellano, una herramienta electrónica y gratuita que facilita el acercamiento a los numerosos testimonios de literatura traducida a lo largo de la baja Edad Media, cuyo traductor se desconoce o cuya identidad no es segura


    Abstract: In this paper the Corpus of Novels of the Spanish Silver Age is presented, a collection of 358 novels published by Spanish authors between 1880 and 1939. The selection of the texts follows criteria from the studies of literature. The texts have been encoded in XML-TEI. In this format are also saved the manually curated metadata and the linguistic annotations by automatic tools. The data set allows calculating statistical descriptions of the novel, evaluate hypotheses by other researchers or explore new correlations. Finally, it will be presented semantic descriptions about several subgenres of the novel.Resumen: En este artículo se presenta el Corpus de novelas de la Edad de Plata, una colección de 358 novelas publicadas por autores españoles entre 1880 y 1939. La selección de textos sigue criterios fijados por manuales de literatura. Los textos han sido codificados en XML-TEI, formato que también recoge los metadatos revisados de manera manual y las anotaciones lingüísticas realizadas por herramientas automáticas. El conjunto de datos permite realizar descripciones estadísticas, evaluar hipótesis propuestas por otros investigadores o explorar nuevas correlaciones. Finalmente, se darán descripciones semánticas de diferentes subgéneros de la novela.Abstract: In this paper the Corpus of Novels of the Spanish Silver Age is presented, a collection of 358 novels published by Spanish authors between 1880 and 1939. The selection of the texts follows criteria from the studies of literature. The texts have been encoded in XML-TEI. In this format are also saved the manually curated metadata and the linguistic annotations by automatic tools. The data set allows calculating statistical descriptions of the novel, evaluate hypotheses by other researchers or explore new correlations. Finally, it will be presented semantic descriptions about several subgenres of the novel

    Estado de la digitalización de la Edad de Plata: un análisis cuantitativo

    En este artículo analizo el panorama que el investigador interesado en trabajar con textos digitales de la Edad de Plata encuentra al comenzar su trabajo. He realizado búsquedas sistemáticas de autores en siete fuentes generalistas de textos y documentos digitales: Project Gutenberg, Biblioteca Digital Hispánica de la BNE, Biblioteca Virtual Cervantes, Internet Archive, Google Books, Wikisource y EpubLibre. La nómina de autores contiene aquellos autores que publicaron obras de prosa entre 1880 y 1939: un total de 135 autores que van (según su fecha de nacimiento) desde Valera hasta Francisco de Ayala. Los principales objetivos de este trabajo son: 1) valorar según diferentes criterios los proyectos de digitalización y publicación electrónica; 2) tener una imagen más ajustada del estado de la digitalización de esta época; 3) observar qué criterios ha seguido la digitalización de estos autores. Finalmente trato de concretar las oportunidades y problemas que debemos tener en cuenta para el diseño y desarrollo futuro de nuestro trabajo

    What is a Genre? A Graph Unified Model of Categories, Texts, and Features

    Several theoretical models have been proposed for genre, such as the Aristotelian scholastic taxonomy, the family resemblance and the prototype theory. However, these models lack of empirical applications to real examples of genres. This proposal is the culmination of a series of analysis, presenting a theoretical, computational and visual graph-based model that fits several observations. This formalization unifies components of the previous theories, offering visually the intention (internal features) and extension (the best representatives and instances) of each category. Besides, it allows two intuitive interpretations based on the evaluation: the centrality as classification results, and the distance as similarity through shared features. The model is applied to three data-sets of different periods and languages: modern Spanish novels, classic French plays and the books of the Bible

    Diseño de corpus literario para análisis cuantitativos

    Este artículo profundiza en los diseños de corpus literarios, planteando y siguiendo cada parte del proceso completo a realizar. A diferencia de la mayoría de estudios de divulgación de las Humanidades Digitales, que suelen tener por objeto el proceso de análisis de datos o los resultados del mismo, este artículo focaliza el estadio previo, el de preparación de datos para la confección del corpus, tarea que defiende como central. Este trabajo resulta una perfecta guía metodológica para el investigador interesado en sacar adelante un proyecto basado en análisis cuantitativos en tanto que cubre todos los estadios del proceso, orienta las explicaciones hacia casos prácticos, y ha sido confeccionado por un investigador formado y con experiencia en el campo, autor él mismo de corpus de textos en españo

    Autoría y estilo. Una atribución cervantina desde las humanidades digitales. El caso de La conquista de Jerusalén

    Stylometry has become, in recent years, one of the most solid research methods in the academic field of Digital Humanities. Its effectiveness as a method for authorship attribution has been proven with cases in Spanish and other languages. This paper applies one of these digital methods for the clarification about the hypothesis of La conquista de Jerusalén, attributed to Miguel de Cervantes since its discoveryLa estilometría se ha consagrado en los últimos años como uno de los métodos de investigación más sólidos en el campo de las Humanidades Digitales. Su eficacia como método para la investigación de autorías en textos anónimos está probada, tanto en casos de autores españoles como extranjeros. En las siguientes páginas se propone, justamente, la aplicación de esta herramienta digital para el esclarecimiento de la autoría de La conquista de Jerusalén, atribuida desde su descubrimiento a Miguel de Cervantes

    Grafos de Escenas y Estudios Literarios Digitales: Una Propuesta Computacional Crítica

    Des que en 2005 Moretti els popularitzés, els grafs s'han utilitzat per a representar la interacció dels personatges en obres de teatre i novel·les. No obstant això, en els últims anys han aparegut alguns treballs avaluant aquests grafs, qüestionant la seva validesa. En aquest treball proposem una modificació d'aquests grafs, obtenint una representació de les obres dramàtiques que prioritza l'estructura en escenes. A diferència d'altres treballs d'Humanitats Digitals, realitzem una avaluació crítica mitjançant hipòtesi que conjumina variables quantitatives i qualitatives.Since their popularization by Moretti in 2005, graphs have been used to represent the interaction of characters in plays and novels. However, in recent years some works have evaluated these graphs, questioning their validity. In this research, we propose a modification of these graphs, obtaining a representation of the dramatic works that prioritizes the structure in scenes. Unlike other DH works, we carry out a critical evaluation by means of hypotheses that combine quantitative and qualitative variables.Desde que en 2005 Moretti los popularizase, los grafos se han utilizado para representar la interacción de los personajes en obras de teatro y novelas. Sin embargo, en los últimos años han aparecido algunos trabajos evaluando estos grafos, cuestionando su validez. En este trabajo, proponemos una modificación  de estos grafos, obteniendo una representación de las obras dramáticas que prioriza la estructura en escenas. A diferencia de otros trabajos de HD, realizamos una evaluación crítica mediante hipótesis que aúna variables cuantitativas y cualitativas