23 research outputs found

    Optimierung kommerzieller Translation-Memory-Systeme durch Integration morphosyntaktischer Analyseverfahren

    Get PDF
    Seit Anfang der 90er Jahre zählen Translation Memorys zu den bedeutsamsten Werkzeugen im Bereich der computergestützten Übersetzung. Dennoch wird in den meisten auf dem Markt verfügbaren Translation-Memory-Systemen nur ein Vergleich der Zeichenketten zwischen einem neu zu übersetzenden Segment mit einem im Translation Memory gespeicherten ausgangssprachlichen Segment durchgeführt, um ähnliche Übersetzungseinheiten aufzufinden. Linguistische Übereinstimmungen bleiben häufig unberücksichtigt, sodass bedeutungsgleiche bzw. -ähnliche Segmente mit unterschiedlicher (morpho-)syntaktischer Struktur nicht oder nur mit einem geringeren Ähnlichkeitswert ausgegeben werden. In diesem Band wird die Optimierung eines kommerziellen Translation-Memory-Systems durch Hinzuschaltung eines morphosyntaktischen Analyseprogramms beschrieben. Der Fokus liegt dabei auf der Erläuterung des entwickelten Prototyps, bestehend aus der Beschreibung des erweiterten Algorithmus zur Identifikation der längsten gemeinsamen Teilzeichenketten zwischen zwei zu vergleichenden ausgangssprachlichen Segmenten sowie des selbst konzipierten, auf linguistischen Analysen beruhenden Proximitätsmaßes zur Ermittlung von Ähnlichkeitswerten, die das menschliche Ähnlichkeitsempfinden abbilden sollen. Die umfangreiche Evaluierung des entwickelten Systems demonstriert das Ausmaß der erreichten linguistischen Optimierung kommerzieller zeichenkettenbasierter Translation Memorys

    Pioniergeist, Ausdauer, Leidenschaft. Festschrift zu Ehren von Prof. Dr. Jürgen Handke

    Get PDF
    Diese Festschrift ist dem wissenschaftlichen Wirken von Prof. Dr. Jürgen Handke gewidmet und wurde anlässlich seiner Pensionierung im März 2020 zusammengestellt. Der Band behandelt eine Vielzahl an wissenschaftlichen Bereichen, dazu zählen die Linguistik, die digitale Lehre, der Inverted Classroom, das curriculare Design sowie die Educational Robotics. Zu den Beitragenden gehören namhafte Vertreter aus Wissenschaft und Wirtschaft sowie Jungwissenschaftler und Nachwuchsforscher mit Artikeln in sowohl deutscher als auch englischer Sprache. Darüber hinaus hat sich eine Gruppe Künstler mit dem „Forschungsgegenstand“ Jürgen Handke auf künstlerische Weise auseinandergesetzt

    Placeable and localizable elements in translation memory systems

    Get PDF
    Translation memory systems (TM systems) are software packages used in computer-assisted translation (CAT) to support human translators. As an example of successful natural language processing (NLP), these applications have been discussed in monographic works, conferences, articles in specialized journals, newsletters, forums, mailing lists, etc. This thesis focuses on how TM systems deal with placeable and localizable elements, as defined in 2.1.1.1. Although these elements are mentioned in the cited sources, there is no systematic work discussing them. This thesis is aimed at filling this gap and at suggesting improvements that could be implemented in order to tackle current shortcomings. The thesis is divided into the following chapters. Chapter 1 is a general introduction to the field of TM technology. Chapter 2 presents the conducted research in detail. The chapters 3 to 12 each discuss a specific category of placeable and localizable elements. Finally, chapter 13 provides a conclusion summarizing the major findings of this research project

    “The Bard meets the Doctor” – Computergestützte Identifikation intertextueller Shakespearebezüge in der Science Fiction-Serie Dr. Who.

    Get PDF
    A single abstract from the DHd-2019 Book of Abstracts.Sofern eine editorische Arbeit an dieser Publikation stattgefunden hat, dann bestand diese aus der Eliminierung von Bindestrichen in Überschriften, die aufgrund fehlerhafter Silbentrennung entstanden sind, der Vereinheitlichung von Namen der Autor*innen in das Schema "Nachname, Vorname" und/oder der Trennung von Überschrift und Unterüberschrift durch die Setzung eines Punktes, sofern notwendig

    Wortschatzerweiterung in autonomen Erwerbskontexten : zum systematischen Ausbau des individuellen Erweiterungswortschatzes Fortgeschrittener im Land der Zielsprache

    Get PDF
    Die Arbeit fokussiert den Wortschatzerwerb fortgeschrittener Lerner des Deutschen als Fremdsprache, die in einem deutschsprachigen Land für längere Zeit leben. Sie definieren sich durch einen bereits erworbenen Grundwortschatz, müssen und wollen durch ihre neue lebensweltliche Verortung – sei es zwecks eines Studienaufenthalts oder zu Arbeitszwecken – diesen aber ausbauen. Dieser Prozess läuft bislang zumindest teilweise autonom, weshalb die Zielgruppe nun täglich mit dem unermesslichen Umfang des Gesamtwortschatzes konfrontiert ist. Der institutionelle Erwerb kann unmöglich alle lexikalischen Facetten des Deutschen vermitteln. Ziel der Arbeit ist daher die Formulierung von Konzeptionskriterien eines Wortschatzprogramms, welches diesen Prozess zu systematisieren hilft. Werkinterner Arbeitsbegriff ist dabei „personalisiertes Wörterbuch“. Das Vorgehen fußt auf zwei Grundgedanken: Erstens gilt es sich beim Ausbau dieses individuellen Erweiterungswortschatzes quantitativ und mental-kognitiv am Wortwissen von Muttersprachlern zu orientieren. Auch diese beherrschen und benötigen nur einen Bruchteil des tatsächlichen Gesamtwortschatzes, der im zielsprachlichen Vokabular zur Verfügung steht. Welche Ausdrücke dazu zählen ist zweitens von der persönlichen Prägung der Fortgeschrittenen abhängig und kann sich durch divergierende Interessen, die Region in der man lebt und nicht zuletzt dem Fachwortschatz des ausgeübten Studiums/Berufs deutlich unterscheiden. Das personalisierte Wörterbuch gibt daher keinen auf dem Grundwortschatz anknüpfenden Aufbauwortschatz vor. Lernerzentrisch kann der Fortgeschrittene selbst entscheiden, welche lexikalischen Anteile von Relevanz sind. Zu diesem Zweck wird in der Arbeit zunächst definiert, wodurch sich das Attribut „fortgeschritten“ auszeichnet. Neben den wichtigsten Kriterien – dem vorliegenden Grundwortschatz und dem dauerhaften Aufenthalt in einem deutschsprachigen Land – zählen hierzu weitere Parameter wie die intrinsische Motivation oder die Interaktion mit Muttersprachlern: Soziologisch unterschiedliche Bezugsgruppen sorgen für unterschiedliche Relevanzakzentuierungen lexikalischer Art. Es folgt eine Beleuchtung der beiden Bezugsgrößen des Erweiterungswortschatzes: namentlich Gesamt- und Grundwortschatz. Neben einer quantitativ-linguistischen Beschreibung des Gesamtwortschatzes geht in diesem Kapitelkomplex auch eine Annäherung an die kognitiven Modalitäten des mentalen Lexikons einher. Auf dessen Basis wird die Struktur des personalisierten Wörterbuchs in Form von Wortformen auf Wortrelations- bzw. Wortbildungsebene und Varietäten des deutschen Standards formuliert. Zur ersten Gruppe zählen Komposita, Synonyme, Okkasionalismen, Phraseologismen, Inhaltsfelder und Kollokationen, zur zweiten nationale Standardvarietäten und Dialekte. (Auch Soziolekte und Fachsprachen sind Gegenstand der relevanten Varietätsebenen, bleiben in der exemplarischen Darstellung der daraus resultierenden konzeptionskriteriellen Konsequenzen aber ausgespart.) Bevor diese einzeln aus didaktischer und deskriptiv-linguistischer Perspektive analysiert werden, folgt eine Betrachtung des Grundwortschatzes. Dabei geht es konkret um Evaluation, Diskursgeschichte und Kritiklinien (frequenzbasierter) Grundwortschatzlisten, aber auch um die Frage, welche Wortgruppen ausgespart bleiben und tendenziell im Erweiterungswortschatz zu verorten sind. In der besagten Analyse der verschiedenen Sprachebenen wird in der Regel an didaktische Methoden aus dem institutionalisierten Erwerb angeknüpft. Während dies bei Wortrelationstypen wie Phraseologismen oder Inhaltsfeldern glückt, erfolgt ansonsten eine stärker sprachwissenschaftliche Herangehensweise, wobei der deskriptiven Linguistik die Funktion einer Hilfswissenschaft beikommt. Am Ende jedes Kapitels werden konkrete Konzeptionskriterien ermittelt Diese zeigen, wie eine vernetzte und systematische Einspeicherung neuer lexikalischer Einheiten mit anderen Wörtern erfolgen könnte. Das Vorgehen versteht sich dabei als grundsätzlich lernerzentrisch. Vorgaben des personalisierten Wörterbuchs halten sich im Hintergrund. Möglichst viele Vernetzungsoptionen und metasprachliche Angaben sollen vom Nutzer selbst vorgenommen werden, um die Ausbildung eines Erweiterungswortschatzes im immersiven Erwerbskontext zu begleiten

    Virtual enterprises, communities & social networks. Workshop GeNeMe \u2710, Gemeinschaften in Neuen Medien. TU Dresden, 07./08.10.2010

    Full text link
    Die Tagungsreihe „GeNeMe - Gemeinschaften in Neuen Medien“ findet in diesem Jahr zum dreizehnten Mal mit einer Vielzahl interessanter Beiträge aus folgenden Themengebieten statt: Konzepte, Technologien und Methoden für Virtuelle Gemeinschaften (VG) und Virtuelle Organisationen (VO); Soziale Gemeinschaften in Neuen Medien; Wirtschaftliche Aspekte VG und VO; Wissensmanagement und Innovationsstrategien in VG, virtuelles Lehren und Lernen; Anwendungen und Praxisberichte zu VG und VO. (DIPF/Orig.

    Digitale Datenbanken: Eine Medientheorie im Zeitalter von Big Data

    Get PDF
    Wir leben längst nicht mehr nur im Informationszeitalter, sondern in der Ära von Big Data. In dieser steht die Datenbank gleichzeitig für die riesigen Erkenntnispotenziale von Informationssammlungen wie für die bedrohlichen Informationsexzesse der digitalen Medienkultur. Zudem bezeichnet der Begriff konkrete Technologien und Verfahren der Sammlung und Bereitstellung von digitalen Informationen. Zwischen diesen sehr unterschiedlichen Auffassungen gilt es, Datenbanken medientheoretisch zu verorten. Marcus Burkhardt zeichnet die Geschichte der Datenbanken nach und fragt, wie technische Verfahren der Verwaltung digitaler Informationen bedingen, was auf welche Weise in Datenbanken gefunden und durch sie gewusst werden kann.We have long moved on from a mere information age to the era of big data. Here, databases represent both the enormous potential for gaining knowledge of data collection and the alarming information excesses of digital culture. Furthermore, the term refers to concrete technologies and processes of gathering and accessing digital information. Media theory has to locate databases in between these very different conceptions. Marcus Burkhardt retraces the history of databases and asks how technical procedures of processing digital information determine what can be found how in databases and what knowledge can be gained through them

    Digitale Datenbanken

    Get PDF
    We have long moved on from a mere information age to the era of big data. Here, databases represent both the enormous potential for gaining knowledge of data collection and the alarming information excesses of digital culture. Furthermore, the term refers to concrete technologies and processes of gathering and accessing digital information. Media theory has to locate databases in between these very different conceptions. Marcus Burkhardt retraces the history of databases and asks how technical procedures of processing digital information determine what can be found how in databases and what knowledge can be gained through them
    corecore