4 research outputs found

    Edition of a digital corpus of inventories of goods

    Get PDF
    En este trabajo se pretende dar a conocer el proceso de elaboración de un corpus diacrónico digital a partir de la selección y edición digital de inventarios de bienes de los siglos XVIII y XIX de las provincias de Madrid y Almería. Los recuentos de bienes, de estructura repetitiva y abundantes en distintos puntos de la geografía hispánica, facilitan la comparación regional y cronológica de los documentos. Este corpus forma a su vez parte de Oralia diacrónica del español (ODE), un corpus que toma como inspiración el modelo tecnológico empleado por el proyecto europeo P.S. Post Scriptum para ofrecer en línea un corpus anotado a partir de la herramienta TEITOK (Janssen, 2016).The aim of this paper is to show the process of preparing a digital diachronic corpus based on the selection and digital edition of inventories of goods from the 18th and 19th centuries in the provinces of Madrid and Almeria. Inventories of goods which have a similar structure and are abundant in various areas of the Spanish geography, facilitate the comparison of the documents. This corpus is part of Oralia diacrónica del español (ODE), a corpus that takes as inspiration the technological model used by the European project P. S. Post Scriptum to offer an annotated corpus online using the TEITOK tool (Janssen, 2016).Este trabajo se inscribe en el marco de los proyectos de investigación Hispanae Testium Depositiones HISPATESD, de referencia FFI2017-83400-P (MINECO / AEI / FEDER, UE) y Atlas Lingüístico y Etnográfico de Andalucía, s. XVIII. Patrimonio documental y humanidades digitales (ALEA XVIII) (proyectos I+D+i Junta de Andalucía - FEDER, P18-FR-695)

    CoDiAJe - the Annotated Diachronic Corpus of Judeo-spanish : Description of a Multi-alphabetic Corpus and its Textual and Linguistic Annotations

    Get PDF
    Judeo-Spanish differs from late 15th-century Spanish and modern Spanish in several respects, such as its morphology, syntax, and semantics, but the most visible difference is in the alphabet. From the end of the 19th century, Judeo-Spanish has been written in various alphabets -Greek, Cyrillic, and especially Latin-. However, the Hebrew alphabet had been used since ancient times, before it was abandoned finally only in the 1940s. This means that the majority of Judeo-Spanish texts are written in Hebrew characters. CoDiAJe is an annotated diachronic corpus that includes documents produced from the 16th century up to the present day, developed in TEITOK. The significance of its development is that this tool processes linguistic data in the alphabets mentioned above, allowing users to visualize each text in five orthographic forms (the original version in which it was written, its transcription in Latin characters, an expanded form to complete abbreviations or to correct defective writing, a version in modern Judeo-Spanish, and a version in orthographic modern Spanish). CoDiAJe enables the user to conduct searches not only for a specific word, but also for all its linguistic and orthographic variants in the different alphabets. During the annotation process, tags from the EAGLES tagset for Spanish were modified, and others were created: these are simply steps towards the creation of an accurate tagset for Judeo-Spanish. The digitized texts are also enriched with semantic-conceptual information and information on the affiliation of all non-Romance elements.El judeoespañol se diferencia del español de finales del siglo XV y del español moderno en varios aspectos que afectan a la fonética y fonología, morfología, sintaxis y semántica. Sin embargo, la diferencia más fácilmente apreciable está en el alfabeto. A finales del siglo XIX se comenzó a escribir con diferentes alfabetos: griego, cirílico y, sobre todo, latino en diferentes versiones. Sin embargo, desde tiempos remotos se utilizó el alfabeto hebreo, y su abandono definitivo solo ocurrió en la década de los cuarenta del siglo pasado, por lo que la mayor parte de los textos escritos en esta lengua están en caracteres hebreos. CoDiAJe es un corpus diacrónico anotado que incluye documentos creados desde el siglo XVI hasta nuestros días, desarrollado en TEITOK. La importancia de su desarrollo está en que procesa datos lingüísticos en los alfabetos mencionados anteriormente, da al usuario la opción de visualizar cada texto en cinco formas gráficas (la versión original independientemente del alfabeto en el que fue escrita, su transcripción en caracteres latinos, una forma expandida para completar las abreviaturas o corregir la escritura defectuosa, una versión en judeoespañol moderno y una versión en la ortografía del español moderno), y permite realizar búsquedas no solo de una palabra específica sino de todas sus variantes lingüísticas y ortográficas en textos escritos en los diferentes alfabetos. Durante el proceso de anotación se fueron modificando las etiquetas de EAGLES para el español y se crearon algunas nuevas. Significa que, a medida que se van anotando los textos, vamos creando un etiquetador para el judeoespañol. Los textos digitalizados también se enriquecen con información semántico-conceptual e información sobre la filiación de todos los elementos no románicos que se detectan en los textos

    Edición de un corpus de documentos sobre los movimientos de insurgencia en cuba durante la segunda mitad del siglo XIX

    Get PDF
    Este trabajo describe las bases metodológicas y contextuales del proyecto de investigación «Cuba y Andalucía en el siglo XIX: estudio de los lazos lingüísticos y culturales desde las Humanidades Digitales». El objetivo general es la creación y posterior tratamiento, con metodología propia de las Humanidades Digitales, de un corpus de documentación cubana del siglo XIX, su catalogación tipológica, estudio textual y análisis sociolingüístico. La originalidad de la propuesta consiste tanto en el rescate de una documentación inédita («documentos tomados al enemigo») como en el seguimiento de las ideas novedosas de la época en egodocumentos y prensa. Como resultado de todo ello se obtendrá un catálogo de rasgos variacionales cubanos y un esbozo de los conceptos y valores sociales y culturales que conforman la base de la identidad de la nueva Cuba.This paper describes the methodological and contextual bases of the research project «Cuba and Andalucía in the 19th century: a study of linguistic and cultural ties from the Digital Humanities». The general objective is the creation and subsequent treatment, with the methodology of the Digital Humanities, of a corpus of Cuban documentation from the 19th century, its typological cataloguing, textual study and sociolinguistic analysis. The originality of the proposal consists both in the rescue of unpublished documentation («documents taken from the enemy») and in the follow-up of innovative ideas of the time in ego-documents and press. The result is a catalogue of Cuban variational features and an outline of the social and cultural concepts and values that define the basis of the identity of the new Cuba

    Atti del IX Convegno Annuale dell'Associazione per l'Informatica Umanistica e la Cultura Digitale (AIUCD). La svolta inevitabile: sfide e prospettive per l'Informatica Umanistica

    Get PDF
    Proceedings of the IX edition of the annual AIUCD conferenc
    corecore