Analýza střední angličtiny online: Tvorba a využití databáze spellingových variant založené na LAEME

Abstract

Práce se zabývá sestavením a testováním webového nástroje na analýzu textů v rané střední angličtině, vytvořeného z dat dostupných v Linguistic Atlas of Early Middle English (LAEME). Jako základ pro návrh nástroje slouží úvodní teoretický přehled o historicko-lingvistickém výzkumu středoanglických textů, se zaměřením na nářečí a vztahy mezi psaným a mluveným jazykem. Práce dále podrobně vysvětluje metodologii tvorby nástroje, přičemž postupuje od struktury databáze, do níž byla data z LAEME převedena k poloautomatickému procesu zpracování dat a výstupním datům. Zpracování dat spočívalo především v segmentaci jednotlivých variant slov na menší úseky a určení, které segmenty si vzájemně odpovídají. Následně jsou popsány jednotlivé uživatelské funkce nástroje a jejich použití je vyzkoušeno na krátkých analýzách. Třebaže nástroj vyžaduje rozsáhlejší testování a úpravy, dosavadní testování nebyly objeveny závažnější chyby a nástroj lze označit za použitelný. Podařilo se otevřít nové možnosti (rychlejšího) přístupu k datům z LAEME a nástroj je navíc otevřen možnostem dalšího rozšíření, včetně přidávání zápisových variant slov z dalších období vývoje angličtiny.The present thesis deals with the construction and testing of a web-based tool for analysis of Early Middle English texts, created from the data available in the Linguistic Atlas of Early Middle English (LAEME). The introductory theoretical overview of research into Middle English texts focuses on dialectology and the relation between spoken & written language and it serves as a springboard for the development of the tool. The thesis further presents a detailed explanation of the methodology behind the tool. It describes the structure of the database containing the transformed data from LAEME and then it moves on to the semi-automatic data processing and types of output data. This processing consists mainly in the segmentation of LAEME spelling variants into smaller units and in determining which segments in a group of variants correspond to one another. The thesis also describes the individual functions available within the tool and tests their use on short sample analyses. Although more extensive testing and modifications of the tool are required, it has so far revealed no crucial errors and the tool can be described as useable. The project succeeded in opening new possibilities of faster access to LAEME data. Furthermore, the tool is prepared for future upgrades, including the addition of data...Department of the English Language and ELT MethodologyÚstav anglického jazyka a didaktikyFilozofická fakultaFaculty of Art

    Similar works