3 research outputs found
Συμβολή στην Ελληνικοποίηση της πλατφόρμας μετατροπής κειμένου σε ομιλία OpenMary
Αντικείμενο της παρούσας διπλωματικής διατριβής ήταν η συμβολή στην
Ελληνικοποίηση της πλατφόρμας μετατροπής κειμένου σε ομιλία OpenMary. Η
πλατφόρμα OpenMary είναι μία ανοιχτού κώδικα πολυγλωσσική πλατφόρμα Κείμενο-Σε-
Ομιλία. Σχεδιάστηκε και υλοποιήθηκε η υποστήριξη για την Ελληνική γλώσσα, με
σκοπό την αναγνώριση των μερών του λόγου των ελληνικών προτάσεων και την
βέλτιστη ακουστική απόδοσή τους ανάλογα με το είδος της πρότασης. Με την
ολοκλήρωση του συνθέτη ομιλίας τα μέρη του λόγου που αναγνωρίζονται είναι οι
καταφατικές, οι ερωτηματικές, οι επιφωνηματικές και οι αρνητικές προτάσεις.
Επιπλέον, γίνεται αντιστοίχηση των ερωτηματικών και των αρνητικών προτάσεων σε
κατάλληλο προσωδιακό μοντέλο ομιλίας. Σε αυτή την εργασία θα παρουσιάσουμε τα
βήματα που γίνανε για την αναγνώριση του είδους των προτάσεων αλλά και για την
απόδοση του προσωδιακού μοντέλου. Με τη χρήση του κατάλληλου αλγορίθμου
Επεξεργασίας Φυσικής Γλώσσας επιτυγχάνετε η γραμματική αναγνώριση των λέξεων
της πρότασης και στην συνέχεια το είδος της πρόταση. Έπειτα γίνεται η
αντιστοίχιση και διόρθωση του επιτονισμού των λέξεων της πρότασης. Η πλατφόρμα
είναι σε θέση να αναγνωρίζει και να ξεχωρίζει, εκτός από το είδος της πρότασης
και τον τύπο της ερώτησης, δηλαδή αν είναι ερώτηση ολικής άγνοιας, ερώτηση
μερικής άγνοιας ή αρνητική ερώτηση. Κάνοντας αυτόν τον διαχωρισμό αποδίδεται
διαφορετικό προσωδιακό μοντέλο σε κάθε είδος. Η παρούσα υλοποίηση αξιολογήθηκε
μέσα από μία πειραματική διαδικασία. Στην πειραματική διαδικασία ζητήθηκε από
37 ακροατές να αξιολογήσουν ερωτήσεις που εκφωνήθηκαν με συνθετική ομιλία.The object of this thesis was to contribute to the Greek versions of the
text-to-speech platform OpenMary. The platform OpenMary is an open source
multilingual Text-To-Speech platform. We designed and implemented the support
for the Greek language, in order to identify the different sentence types in
Greek and define the optimal prosody specification based on the sentence type.
On completion of the speech synthesizer the sentence types that are recognized
are declarative, interrogative, exclamatory and negative sentences. In addition
interrogative and negative sentences were mapped to an appropriate prosodic
specification. In this paper we present the steps that were made for the
enrichment of the relevant modules. By using the appropriate Natural Language
Processing algorithm we initially achieved identification of the parts of
speech and consequently the corresponding sentence type. Following we assigned
and corrected the intonation of the words in the sentence. Moreover we created
additional rules for their intonation. Finally, we proceed with the conversion
of Text-to-Speech using the corresponding prosodic model. The platform is able
to recognize and distinguish between the different types of questions, namely
whether it is a Yes-No question, a Wh-question or negative question. Based on
this distinction a different prosodic model is assigned to each type. The
present implementation was evaluated through an experimental process. In the
experimental procedure 37 listeners were asked to rate questions which were
produced with synthetic speech
A framework for language-independent analysis and prosodic feature annotation of text corpora
Concept-to-Speech systems include Natural Language Generators that produce linguistically enriched text descriptions which can lead to significantly improved quality of speech synthesis. There are cases, however, where either the generator modules produce pieces of non-analyzed, non-annotated plain text, or such modules are not available at all. Moreover, the language analysis is restricted by the usually limited domain coverage of the generator due to its embedded grammar. This work reports on a language-independent framework basis, linguistic resources and language analysis procedures (word/sentence identification, part-of-speech, prosodic feature annotation) for text annotation/processing for plain or enriched text corpora. It aims to produce an automated XML- annotated enriched prosodic markup for English and Greek texts, for improved synthetic speech. The markup includes information for both training the synthesizer and for actual input for synthesising. Depending on the domain and target, different methods may be used for automatic classification of entities (words, phrases, sentences) to one or more preset categories such as "emphatic event", "new/old information", "second argument to verb", "proper noun phrase", etc. The prosodic features are classified according to the analysis of the speech-specific characteristics for their role in prosody modelling and passed through to the synthesizer via an extended SOLE-ML description. Evaluation results show that using selectable hybrid methods for part-of-speech tagging high accuracy is achieved. Annotation of a large generated text corpus containing 50% enriched text and 50% canned plain text produces a fully annotated uniform SOLE-ML output containing all prosodic features found in the initial enriched source. Furthermore, additional automatically-derived prosodic feature annotation and speech synthesis related values are assigned, such as word-placement in sentences and phrases, previous and next word entity relations, emphatic phrases containing proper nouns, and more. © 2008 Springer-Verlag Berlin Heidelberg
Μηχανική Μάθηση στην Επεξεργασία Φυσικής Γλώσσας
Η διατριβή εξετάζει την χρήση τεχνικών μηχανικής μάθησης σε διάφορα στάδια της
επεξεργασίας φυσικής γλώσσας, κυρίως για σκοπούς εξαγωγής πληροφορίας από
κείμενα. Στόχος είναι τόσο η βελτίωση της προσαρμοστικότητας των συστημάτων
εξαγωγής πληροφορίας σε νέες θεματικές περιοχές (ή ακόμα και γλώσσες), όσο και
η επίτευξη καλύτερης απόδοσης χρησιμοποιώντας όσο το δυνατό λιγότερους πόρους
(τόσο γλωσσικούς όσο και ανθρώπινους). Η διατριβή κινείται σε δύο κύριους
άξονες: α) την έρευνα και αποτίμηση υπαρχόντων αλγορίθμων μηχανικής μάθησης
κυρίως στα στάδια της προ-επεξεργασίας (όπως η αναγνώριση μερών του λόγου) και
της αναγνώρισης ονομάτων οντοτήτων, και β) τη δημιουργία ενός νέου αλγορίθμου
μηχανικής μάθησης και αποτίμησής του, τόσο σε συνθετικά δεδομένα, όσο και σε
πραγματικά δεδομένα από το στάδιο της εξαγωγής σχέσεων μεταξύ ονομάτων
οντοτήτων. Ο νέος αλγόριθμος μηχανικής μάθησης ανήκει στην κατηγορία της
επαγωγικής εξαγωγής γραμματικών, και εξάγει γραμματικές ανεξάρτητες από τα
συμφραζόμενα χρησιμοποιώντας μόνο θετικά παραδείγματα.This thesis examines the use of machine learning techniques in various tasks of
natural language processing, mainly for the task of information extraction from
texts. The objectives are the improvement of adaptability of information
extraction systems to new thematic domains (or even languages), and the
improvement of their performance using as fewer resources (either linguistic or
human) as possible. This thesis has examined two main axes: a) the research and
assessment of existing algorithms of machine learning mainly in the stages of
linguistic pre-processing (such as part of speech tagging) and named-entity
recognition, and b) the creation of a new machine learning algorithm and its
assessment on synthetic data, as well as in real world data from the task of
relation extraction between named entities. This new algorithm belongs to the
category of inductive grammar learning, and can infer context free grammars
from positive examples only