    A Corpus-Based Analysis of the Language Used by Defendants of Homicide in Court

    In this study we present the updated version of the Greek Corpus of Defendants’ Testimonies, GCDT and a series of new evaluations that have been carried out on the defendants’ speech. Using criteria, such as lexical richness, lexical density, part-of-speech frequencies, word and sentence length, we look for linguistic features which could characterize the stylometric profile of the defendants. We also present GCWT, a reference corpus that has been constructed similar to GCWT stylistic features. GCWT contains witnesses’ testimonies collected in the court

    Basic quantitative characteristics of the modern greek language using the hellenic national corpus

    ABSTRACT Modern Greek is one of the least quantitatively studied modern European languages and the goal of this paper is to fill this relative void. We use the Hellenic National Corpus (HNC), which is a growing corpus that currently includes 33 million words. The corpus and all the tools used in our work were developed by the Institute for Language and Speech Processing (ILSP). In this paper we focus on three main areas: the lists of the 1000 most common words and lemmas, word length and letter frequency. We also make some comparisons with earlier work, in which we had used the previous 13 million word edition of the HNC

    State-of-the-art on monolingual lexicography for Greece (EL)

    The authors report on a recent survey on monolingual dictionaries available on the Greek market. General dictionaries outnumber spelling and educational ones and enjoy a prestigious status. Only one general dictionary is digitally born and only two are available through the web, but several are available as CDs. Most of the prestigious dictionaries have received public funding but not all. Lexicography is well considered in Greece where printed dictionaries seem to still have the lead

    A Perceptual Account of Manner Dissimilation in Greek

    Πλησιωνυμiα και συνδυαστικότητα: H περίπτωση των επιθέτων δυνατός και ισχυρός στις συνάψεις Επίθετο + Ουσιαστικό της Νέας Ελληνικής

    Στην παρούσα διατριβή επιχειρείται μια συνθετική διερεύνηση της πλησιωνυμίας και των συνδυαστικών σχέσεων στο πλαίσιο της Γνωσιακής Γραμματικής. Ελλείψει σχετικών μελετών στην ελληνική βιβλιογραφία και ανάλογων, φρασεολογικού προσανατολισμού, στην ξένη, θεωρήσαμε ότι η συστηματική μελέτη μιας τυπικής περίπτωσης πλησιωνύμων όπως τα δυνατός και ισχυρός μπορεί να αναδείξει τις προεκτάσεις της γνωσιακής προσέγγισης στη λεξικολογική έρευνα. Για τη μελέτη επελέγη μια κατηγορία σχετικά συνθετικών συνδυασμών, οι λεξικές συνάψεις, και η δομή επιθέτου και ουσιαστικού (λ.χ. δυνατό φως, δυνατή/ισχυρή έκρηξη, ισχυρό κίνητρο). Σύμφωνα με τη Γνωσιακή Γραμματική, σε σύνθετες δομές όπως οι συνάψεις τα στοιχεία των επιμέρους σημασιών που ενοποιούνται επιλέγονται από το περικείμενο. Με αφετηρία, λοιπόν, την υπόθεση ότι η κατανομή των πλησιωνύμων αντανακλά τις «κανονικότητες» στη σύνθεση, ότι καθένα δηλαδή από τα επίθετα συνδυάζεται με συγκεκριμένες κατηγορίες οντοτήτων, επιχειρείται να δειχθεί ότι: η συνδυαστικότητα των δυνατός και ισχυρός έχει εννοιολογική βάση, οι κανονικότητες στη σύνθεση επιθέτου και ουσιαστικού είναι συστηματικές, η συνδυαστικότητα δεν είναι αυθαίρετη, όπως παρουσιάζεται σε αρκετές μελέτες της φρασεολογικής προσέγγισης, αλλά μπορεί να αιτιολογηθεί στο πλαίσιο μιας γνωσιακής προσέγγισης για τη σημασία. Η διατριβή οργανώνεται σε έξι κεφάλαια. Στο πρώτο εξετάζεται η θέση των λεξικών συνάψεων στο συνεχές των φρασεολογισμών και οι γνωσιακές προσεγγίσεις για τις καθιερωμένες εκφράσεις. Στο δεύτερο και στο τρίτο κεφάλαιο εισάγεται το θεωρητικό πλαίσιο για τη διερεύνηση της συγκεκριμένης κατηγορίας συνδυασμών. Σύμφωνα με τον ορισμό του Langacker για τη σημασία, κάθε λέξη αλλά και κάθε γραμματική κατηγορία και δομή ενσωματώνει ως συστατικό της σημασίας της έναν συγκεκριμένο τρόπο θεώρησης του εννοιακού περιεχομένου. Αυτές οι παράμετροι, δηλαδή το περιεχόμενο και η θεώρηση, συνιστούν και τους κεντρικούς άξονες των δύο κεφαλαίων, που έχουν ως αντικείμενά τους τη λεξική σημασία και την πλησιωνυμία το πρώτο, και τις γραμματικές κατηγορίες του ουσιαστικού και του επιθέτου το δεύτερο.Στο τέταρτο κεφάλαιο παρουσιάζεται η μεθοδολογία για την αναγνώριση των συνάψεων με τα δυνατός και ισχυρός στο σώμα κειμένων του Εθνικού Θησαυρού Ελληνικής Γλώσσας, ενώ στο πέμπτο κεφάλαιο εξετάζονται οι εννοιολογικές σχέσεις στις συνάψεις που προέκυψαν από την επεξεργασία. Για την αναγωγή από τις σημασίες στις έννοιες θεωρήθηκε μεθοδολογικά ορθότερο να συνδυαστούν οι διακριτές, σύμφωνα με τη γνωσιακή σημασιολογία, προσεγγίσεις για τη «λεξική» και την εγκυκλοπαιδική σημασία. Κρίνοντας, δηλαδή, ότι οι ορισμοί των λεξικών θα μπορούσαν να αποτελέσουν μια «αντικειμενική» βάση, αφενός προσαρμόστηκαν οι περικειμενικές σημασίες σε αυτούς, και αφετέρου, όπου ήταν αναγκαίο, οι ίδιοι οι ορισμοί εξειδικεύθηκαν ώστε να συμπεριλάβουν και τις (σχηματικές) έννοιες που προβάλλονται μέσα στα εκάστοτε περικείμενα. Βάσει της κατανομής, επιχειρήθηκε στη συνέχεια να εντοπιστούν οι πρωτοτυπικές σημασίες των επιθέτων. Η μελέτη της πλησιωνυμίας βασίστηκε τόσο στον τρόπο με τον οποίο ορίζονται τα εν λόγω επίθετα στα λεξικά όσο και σε γνωσιακές παραμέτρους. Στο τελευταίο κεφάλαιο παρουσιάζονται τα γενικά συμπεράσματα. Συνοπτικά, η συμβολή έγκειται (1) στη συστηματική ανάλυση των δυνατός και ισχυρός (κατανομή στις συνάψεις τους, αιτιολόγηση των συνδυαστικών προτιμήσεων στο πλαίσιο μιας γνωσιακής προσέγγισης για τη σημασία), και (2) σε επίπεδο θεωρίας, αφενός στην οριοθέτηση των συνάψεων (σύνθεση φρασεολογικών και γνωσιακών κριτηρίων και επανεξέταση των ορίων της κατηγορίας, συσχέτιση της ενότητας των συνάψεων με την εδραίωση και με την εμφάνιση τους σε περικείμενα που ανακαλούν συγκεκριμένες γνώσεις/γνωσιακά σχήματα), και αφετέρου στην ερμηνεία της πλησιωνυμίας (σχέση μεταξύ των πρωτοτύπων, ασυμμετρία και εννοιολογική εξάρτηση του ενός πλησιώνυμου από το άλλο, συμπληρωματικότητα που σχετίζεται με διαφορετικούς και συμβατικούς τρόπους θεώρησης). Ειδικότερα σε ό,τι αφορά την πλησιωνυμική σχέση, αυτή, όπως διαπιστώνεται, βασίζεται σε μια σειρά σχετιζόμενων μεταξύ τους αντιθέσεων η κυριότερη από τις οποίες εντοπίζεται στη σημασία του επιθέτου ως γραμματικής κατηγορίας και στο λεξικό περιεχόμενο των υπό εξέταση πλησιωνύμων.Η διατριβή θέτει, τέλος, και ζητήματα που χρήζουν περαιτέρω έρευνας τόσο σε θεωρητικό επίπεδο, όσο και σε επίπεδο εφαρμογής.This thesis serves two interrelated purposes. The first is to investigate the combinatory preferences of the plesionyms/near-synonyms δυνατός and ισχυρός in their nominal collocations, e.g. δυνατό φως, δυνατή/ισχυρή έκρηξη, ισχυρό κίνητρο etc. The second is to define the conceptual relation between the plesionyms by reference to their collocability. In the phraseological approach (Nesselhauf 2004) collocational preferences or restrictions are usually regarded as conventional and arbitrary. Our main objective is to demonstrate that collocability is primarily conceptual, and hence motivated, and could be sufficiently explained in a cognitive framework. The framework adopted here is Cognitive Grammar, a usage-based approach to language developed by R. Langacker (as presented mainly in 1987, 1991, 2008, 2009, 2017), in which “meaning is equated with conceptualization”, i.e. mental experience (sensory, motor, emotive), and “recognition of the immediate context” (physical, linguistic, social, and cultural) (Langacker 1986: 3). Defining meaning as both “conceptual content and a particular way of construing (or ‘viewing’) that content” (2017: 33), CG extends the analysis to the context and how the activated content and the imposed construal shape the interpretation. The categorization of lexical combinations that we propose here is based on the conflation of phraseological and cognitive criteria. Crucial to this modified view of phraseological categories is the notion of “cognitive routines” which refers to simpler or complex “conventional” units that recur in similar usage events (Langacker 2008: 218, 220). Our criteria in defining the category of collocations, i.e. recurrence in specific contexts, restricted substitutability, and constituents’ autonomy, brought out two sub-categories, namely collocations in which both constituents are used in their literal or in metaphorical –though conventional– senses.The first chapters introduce relevant theoretical notions of Cognitive Grammar and examine the relation of plesionymy -which, in Cruse’s terms, grounds on “a low degree of implicit contrastiveness” (1986: 266)- and the semantic function of noun and adjective as grammatical categories. After the quantitative and qualitative analysis of the combinations we extracted from the Hellenic National Corpus, we introduce the methodology regarding the conceptual analysis. Starting from the noun, which is the “profile-determinant” of the structure, we propose a cognitive-pragmatic view of lexical meaning, i.e. a synthesis of the purely linguistic “dictionary view”, which equates meaning with a restricted set of semantic features recalling a dictionary entry, and the more pragmatic “encyclopedic” view, according to which different contexts may evoke different parts of our lexical and general knowledge. Based on these ‘contextual’ definitions we further categorize the nominal concepts in accordance with the relevant cognitive domains. Αs we see, the collocates of δυνατός are mainly described in terms of basic domains, namely conceptions associated with the immediate experience, while ισχυρός collocates mostly with ‘abstract’ concepts which pertain to more extended structures of knowledge.The contribution of the study is bifold consisting in the systematic analysis, on one hand of the plesionyms δυνατός και ισχυρός (distribution in the corpus, conceptual categorization of the nominal collocates, combinability and motivation in a cognitive framework), and on the other hand of the relation between their prototypes (complementarity, contrasts related to the assumed conventional differences in construal -static/adjectival vs. dynamic/verbal-, asymmetry and conceptual dependency of one upon the other)

    Cappadocian kinship

    Cappadocian kinship systems are very interesting from a sociolinguistic and anthropological perspective because of the mixture of inherited Greek and borrowed Turkish kinship terms. Precisely because the number of Turkish kinship terms differs from one variety to another, it is necessary to talk about Cappadocian kinship systems in the plural rather than about the Cappadocian kinship system in the singular. Although reference will be made to other Cappadocian varieties, this paper will focus on the kinship systems of Mišotika and Aksenitika, the two Central Cappadocian dialects still spoken today in several communities in Greece. Particular attention will be given to the use of borrowed Turkish kinship terms, which sometimes seem to co-exist together with their inherited Greek counterparts, e.g. mána vs. néne ‘mother’, ailfó/aelfó vs. γardáš ‘brother’ etc. In the final part of the paper some kinship terms with obscure or hitherto unknown etymology will be discussed, e.g. káka ‘grandmother’, ižá ‘aunt’, lúva ‘uncle (father’s brother)’ etc

    Machine Learning

    Machine Learning can be defined in various ways related to a scientific domain concerned with the design and development of theoretical and implementation tools that allow building systems with some Human Like intelligent behavior. Machine learning addresses more specifically the ability to improve automatically through experience