2 research outputs found

    Exploring Character Pattern Recognition Techniques: A case study for Greek Polytonic Machine-Printed Characters

    Get PDF
    Σε αυτη την διπλωματική εργασία εξερευνούμε διάφορες τεχνικές αναγνώρισης προτύπων για χαρακτήρες και παρουσιάζουμε μια μελέτη περίπτωσης για Ελληνικούς πολυτονικούς τυπωμένους χαρακτήρες όπου οι τεχνικές αυτές είναι εφαρμόσιμες. Υλοποιούμε και περιγράφουμε στατιστικές τεχνικές μηχανικής χαρακτηριστικών (feature engineering) όπως είναι ο διαχωρισμός του χαρακτήρα σε ζώνες, ο διαχωρισμός του χαρακτήρα σε προσαρμοστικές ζώνες, η εξαγωγή ιστογραμμάτων κάθετων και οριζόντιων προβολών καθώς και μια τεχνική εξαγωγής χαρακτηριστικών που βασίζεται σε αναδρομικές υποδιαιρέσεις του χαρακτήρα. Επιπλέον, υλοποιούμε και συζητάμε δύο τεχνικές κατηγοριοποίησης, η μια βασίζεται στο μοντέλο του ταιριάσματος προτύπου (template matching) και η άλλη βασίζεται στα τεχνητά νευρωνικά δίκτυα. Επιπρόσθετα, παρουσιάζουμε την υλοποιημένη σε python βιβλιοθήκη ανοικτού κώδικα που διεκπεραιώνει αυτές τις λειτουργίες μαζί με μια ενότητα για το πώς να την χρησιμοποιήσει κάποιος. Τέλος, αξιολογούμε τις προαναφερθείσες τεχνικές σε δύο διαφορετικά σύνολα δεδομένων που περιέχουν Ελληνικούς πολυτονικούς χαρακτήρες και παρουσιάζουμε τα αποτελέσματα μας για όσον αφορά την απόδοση των μεθόδων μας.In this thesis we explore various character pattern recognition techniques and we present a case study for Greek polytonic machine-printed characters where those techniques are applicable. We implement and describe statistical feature engineering techniques such as character zoning, adaptive character zoning, extraction of horizontal and vertical projection histograms as well as a feature extraction technique based on recursive subdivisions of the character. We also implement and discuss two classification techniques, one based on the template matching model and the other one based on artificial neural networks. Additionally, the python-based open source library that implements those functionalities is presented along with a how-to-use section. Finally, we evaluate the aforementioned techniques on two separate datasets that contain Greek polytonic characters and we present our results on the performance of our methods

    Cappadocian kinship

    Get PDF
    Cappadocian kinship systems are very interesting from a sociolinguistic and anthropological perspective because of the mixture of inherited Greek and borrowed Turkish kinship terms. Precisely because the number of Turkish kinship terms differs from one variety to another, it is necessary to talk about Cappadocian kinship systems in the plural rather than about the Cappadocian kinship system in the singular. Although reference will be made to other Cappadocian varieties, this paper will focus on the kinship systems of Mišotika and Aksenitika, the two Central Cappadocian dialects still spoken today in several communities in Greece. Particular attention will be given to the use of borrowed Turkish kinship terms, which sometimes seem to co-exist together with their inherited Greek counterparts, e.g. mána vs. néne ‘mother’, ailfó/aelfó vs. γardáš ‘brother’ etc. In the final part of the paper some kinship terms with obscure or hitherto unknown etymology will be discussed, e.g. káka ‘grandmother’, ižá ‘aunt’, lúva ‘uncle (father’s brother)’ etc