3 research outputs found

    Συμβολή στην Ελληνικοποίηση της πλατφόρμας μετατροπής κειμένου σε ομιλία OpenMary

    Get PDF
    Αντικείμενο της παρούσας διπλωματικής διατριβής ήταν η συμβολή στην Ελληνικοποίηση της πλατφόρμας μετατροπής κειμένου σε ομιλία OpenMary. Η πλατφόρμα OpenMary είναι μία ανοιχτού κώδικα πολυγλωσσική πλατφόρμα Κείμενο-Σε- Ομιλία. Σχεδιάστηκε και υλοποιήθηκε η υποστήριξη για την Ελληνική γλώσσα, με σκοπό την αναγνώριση των μερών του λόγου των ελληνικών προτάσεων και την βέλτιστη ακουστική απόδοσή τους ανάλογα με το είδος της πρότασης. Με την ολοκλήρωση του συνθέτη ομιλίας τα μέρη του λόγου που αναγνωρίζονται είναι οι καταφατικές, οι ερωτηματικές, οι επιφωνηματικές και οι αρνητικές προτάσεις. Επιπλέον, γίνεται αντιστοίχηση των ερωτηματικών και των αρνητικών προτάσεων σε κατάλληλο προσωδιακό μοντέλο ομιλίας. Σε αυτή την εργασία θα παρουσιάσουμε τα βήματα που γίνανε για την αναγνώριση του είδους των προτάσεων αλλά και για την απόδοση του προσωδιακού μοντέλου. Με τη χρήση του κατάλληλου αλγορίθμου Επεξεργασίας Φυσικής Γλώσσας επιτυγχάνετε η γραμματική αναγνώριση των λέξεων της πρότασης και στην συνέχεια το είδος της πρόταση. Έπειτα γίνεται η αντιστοίχιση και διόρθωση του επιτονισμού των λέξεων της πρότασης. Η πλατφόρμα είναι σε θέση να αναγνωρίζει και να ξεχωρίζει, εκτός από το είδος της πρότασης και τον τύπο της ερώτησης, δηλαδή αν είναι ερώτηση ολικής άγνοιας, ερώτηση μερικής άγνοιας ή αρνητική ερώτηση. Κάνοντας αυτόν τον διαχωρισμό αποδίδεται διαφορετικό προσωδιακό μοντέλο σε κάθε είδος. Η παρούσα υλοποίηση αξιολογήθηκε μέσα από μία πειραματική διαδικασία. Στην πειραματική διαδικασία ζητήθηκε από 37 ακροατές να αξιολογήσουν ερωτήσεις που εκφωνήθηκαν με συνθετική ομιλία.The object of this thesis was to contribute to the Greek versions of the text-to-speech platform OpenMary. The platform OpenMary is an open source multilingual Text-To-Speech platform. We designed and implemented the support for the Greek language, in order to identify the different sentence types in Greek and define the optimal prosody specification based on the sentence type. On completion of the speech synthesizer the sentence types that are recognized are declarative, interrogative, exclamatory and negative sentences. In addition interrogative and negative sentences were mapped to an appropriate prosodic specification. In this paper we present the steps that were made for the enrichment of the relevant modules. By using the appropriate Natural Language Processing algorithm we initially achieved identification of the parts of speech and consequently the corresponding sentence type. Following we assigned and corrected the intonation of the words in the sentence. Moreover we created additional rules for their intonation. Finally, we proceed with the conversion of Text-to-Speech using the corresponding prosodic model. The platform is able to recognize and distinguish between the different types of questions, namely whether it is a Yes-No question, a Wh-question or negative question. Based on this distinction a different prosodic model is assigned to each type. The present implementation was evaluated through an experimental process. In the experimental procedure 37 listeners were asked to rate questions which were produced with synthetic speech

    A framework for language-independent analysis and prosodic feature annotation of text corpora

    No full text
    Concept-to-Speech systems include Natural Language Generators that produce linguistically enriched text descriptions which can lead to significantly improved quality of speech synthesis. There are cases, however, where either the generator modules produce pieces of non-analyzed, non-annotated plain text, or such modules are not available at all. Moreover, the language analysis is restricted by the usually limited domain coverage of the generator due to its embedded grammar. This work reports on a language-independent framework basis, linguistic resources and language analysis procedures (word/sentence identification, part-of-speech, prosodic feature annotation) for text annotation/processing for plain or enriched text corpora. It aims to produce an automated XML- annotated enriched prosodic markup for English and Greek texts, for improved synthetic speech. The markup includes information for both training the synthesizer and for actual input for synthesising. Depending on the domain and target, different methods may be used for automatic classification of entities (words, phrases, sentences) to one or more preset categories such as "emphatic event", "new/old information", "second argument to verb", "proper noun phrase", etc. The prosodic features are classified according to the analysis of the speech-specific characteristics for their role in prosody modelling and passed through to the synthesizer via an extended SOLE-ML description. Evaluation results show that using selectable hybrid methods for part-of-speech tagging high accuracy is achieved. Annotation of a large generated text corpus containing 50% enriched text and 50% canned plain text produces a fully annotated uniform SOLE-ML output containing all prosodic features found in the initial enriched source. Furthermore, additional automatically-derived prosodic feature annotation and speech synthesis related values are assigned, such as word-placement in sentences and phrases, previous and next word entity relations, emphatic phrases containing proper nouns, and more. © 2008 Springer-Verlag Berlin Heidelberg

    Μηχανική Μάθηση στην Επεξεργασία Φυσικής Γλώσσας

    Get PDF
    Η διατριβή εξετάζει την χρήση τεχνικών μηχανικής μάθησης σε διάφορα στάδια της επεξεργασίας φυσικής γλώσσας, κυρίως για σκοπούς εξαγωγής πληροφορίας από κείμενα. Στόχος είναι τόσο η βελτίωση της προσαρμοστικότητας των συστημάτων εξαγωγής πληροφορίας σε νέες θεματικές περιοχές (ή ακόμα και γλώσσες), όσο και η επίτευξη καλύτερης απόδοσης χρησιμοποιώντας όσο το δυνατό λιγότερους πόρους (τόσο γλωσσικούς όσο και ανθρώπινους). Η διατριβή κινείται σε δύο κύριους άξονες: α) την έρευνα και αποτίμηση υπαρχόντων αλγορίθμων μηχανικής μάθησης κυρίως στα στάδια της προ-επεξεργασίας (όπως η αναγνώριση μερών του λόγου) και της αναγνώρισης ονομάτων οντοτήτων, και β) τη δημιουργία ενός νέου αλγορίθμου μηχανικής μάθησης και αποτίμησής του, τόσο σε συνθετικά δεδομένα, όσο και σε πραγματικά δεδομένα από το στάδιο της εξαγωγής σχέσεων μεταξύ ονομάτων οντοτήτων. Ο νέος αλγόριθμος μηχανικής μάθησης ανήκει στην κατηγορία της επαγωγικής εξαγωγής γραμματικών, και εξάγει γραμματικές ανεξάρτητες από τα συμφραζόμενα χρησιμοποιώντας μόνο θετικά παραδείγματα.This thesis examines the use of machine learning techniques in various tasks of natural language processing, mainly for the task of information extraction from texts. The objectives are the improvement of adaptability of information extraction systems to new thematic domains (or even languages), and the improvement of their performance using as fewer resources (either linguistic or human) as possible. This thesis has examined two main axes: a) the research and assessment of existing algorithms of machine learning mainly in the stages of linguistic pre-processing (such as part of speech tagging) and named-entity recognition, and b) the creation of a new machine learning algorithm and its assessment on synthetic data, as well as in real world data from the task of relation extraction between named entities. This new algorithm belongs to the category of inductive grammar learning, and can infer context free grammars from positive examples only
    corecore