5 research outputs found

    Les noms prédicatifs dans la langue spécialisée de la bourse

    Get PDF
    International audienceEn nous appuyant sur un corpus de textes boursiers, nous nous proposons d'étudier les noms prédicatifs (Npred) et plus précisément les constructions à verbe support (CVS) du type Vsup + Npred comme p. ex. θάλω απνϋινπνίεζε (procéder à la dématérialisation), θάλω ξεπζηνπνίεζε (procéder à la liquidation), ζπλάπηω ζπκθωλία (conclure un accord), etc. Nous avons mené notre recherche sur un corpus de textes boursiers d'une taille de 40 millions de mots ce qui nous a permis d'extraire cent cinquante Npred que nous avons par la suite repartis en cinq tables suivant la méthodologie du Lexique-Grammaire développée au sein du LAD

    A method for automatic representation of prefixed verbs of modern greek

    No full text
    The subject of this research is the systematic construction of the morphological electronic dictionary of the prefixed verbs (PVs) of Modern Greek well as the syntactico-semantic description of the PVs that are formed some verb categories of the Modern Greek Lexicon-Grammar (L-G). The L-G methodological framework adopted in this research has been developed by M. Gross (1975) and elaborated at the LADL (Laboratoire d' Automatique Documentaire et Linguistique) in the University of llarne-la-Vallee. In the first part, we have analyzed the productivity of the prefixes παρα-, ξε-, συν-, and ξανα- by morphologically simple verbs. In addition, we have developed an original method for the construction of them inflected forms. In the syntactical part, we present the specifities of the PVs with the prefixes (παρα-, ξε-, συν-, and ξανα-), already mentioned above, which are formed from 8 tables of the Modern Greek Lexicon-Grammar. The linguistic data (both morphological and syntactical) presented in this research are both numerous and precise in terms of quality and can be used linguistic software for the automatic analysis of written texts.Αντικείμενο της παρούσας έρευνας είναι η συστηματική κατασκευή του μορφολογικού ηλεκτρονικού λεξικού των προθηματοποιημένων και σύνθετων (ΠΣΡ) ρημάτων της Νέας Ελληνικής καθώς και η συντακτικο-σημασιολογική περιγραφή ρημάτων του λεξικού-γραμματικής της Νέας Ελληνικής. Απώτερος στόχος είναι η αυτόματη ανάλυση κειμένων της Νέας Ελληνικής με τη χρήση γλωσσικών δεδομένων. Υιοθετήσαμε το μεθοδολογικό πλαίσιο του λεξικού-γραμματικής του οποίου τις βάσεις έθεσε ο M. Gross (1975). Το πλαίσιο αυτό στηρίζεται στις θεωρητικές αρχές της μετασχηματιστικής γραμματικής του Z.S. Harris (1951, 1968). Συγκεκριμένα, στο μορφολογικό επίπεδο διερευνήσαμε την παραγωγικότητα των προθημάτων παρα-, ξε-, συν και του α' συνθετικού ξανα- με τα μορφολογικά ρήματα. Για τη μορφολογική κωδικοποίηση ακολουθήσαμε το φορμαλισμό του συστήματος DELA του LADL. Στο συντακτικό επίπεδο, μελετήσαμε την ιδιαιτερότητα των ΠΣΡ με τα προαναφερθέντα προθήματα και ταξινομήσαμε -970 ρήματα στους πίνακες του λεξικού-γραμματικής της Νέας Ελληνικής. Τέλος, προτείναμε μέθοδο αυτόματης αναπαράστασης των ΠΡΣ και εφαρμόσαμε τα γλωσσικά δεδομένα μας, μορφολογικά και συντακτικά, σε σώματα κειμένων της Νέας Ελληνικής

    Extension du dictionnaire électronique grec de termes boursiers à partir d'un corpus spécialisé

    No full text
    International audienceUn des problèmes essentiels en traitement automatique des langues (TAL) est celui des mots non reconnus par les systèmes d'analyse automatique, quelque soit l'approche adoptée, linguistique, statistique ou hybride. Dans ce travail, nous définissons comme mots inconnus les mots non reconnus dans un corpus donné, précisément dans le corpus boursier grec car ils ne sont pas répertoriés dans les dictionnaires électroniques généraux et terminologiques du grec auxquels ont recours les systèmes de TAL. Dans un domaine de spécialité, ce problème s'avère l'un des plus délicats, suite à l'évolution rapide des langues techniques ou scientifiques. Pour l'enrichissement de ces ressources et afin d'exploiter de nouveaux domaines, il est nécessaire d'acquérir rapidement la nouvelle terminologie et de mettre à jour les ressources existantes. Parmi les mots inconnus, figurent des néologismes, mais aussi des mots étrangers, transcrits en grec ou en alphabet latin, des mots en écriture hybride (caractères grecs et latins), des noms propres, des sigles, des mots mal orthographiés et en principe des mots non accentués. Ces mots non reconnus freinent l'analyse automatique des textes boursiers. L'objet du présent travail est l'étude de mots inconnus du corpus boursier (CoBourse), ce qui nous permettra l'ajout de termes néologiques dans le dictionnaire électronique des termes du domaine boursier. Nous nous limitons aux mots simples, les unités polylexicales demandant une approche de traitement différente. À partir de données extraites, nous proposons des heuristiques pour l'annotation semi-automatique des mots inconnus détectés à l'aide du système Unitex (PAUMIER, 2003), afin de les intégrer dans le dictionnaire de termes boursiers

    Les noms prédicatifs dans la langue spécialisée de la bourse

    No full text
    International audienceEn nous appuyant sur un corpus de textes boursiers, nous nous proposons d'étudier les noms prédicatifs (Npred) et plus précisément les constructions à verbe support (CVS) du type Vsup + Npred comme p. ex. θάλω απνϋινπνίεζε (procéder à la dématérialisation), θάλω ξεπζηνπνίεζε (procéder à la liquidation), ζπλάπηω ζπκθωλία (conclure un accord), etc. Nous avons mené notre recherche sur un corpus de textes boursiers d'une taille de 40 millions de mots ce qui nous a permis d'extraire cent cinquante Npred que nous avons par la suite repartis en cinq tables suivant la méthodologie du Lexique-Grammaire développée au sein du LAD

    Extension du dictionnaire électronique grec de termes boursiers à partir d'un corpus spécialisé

    Get PDF
    International audienceUn des problèmes essentiels en traitement automatique des langues (TAL) est celui des mots non reconnus par les systèmes d'analyse automatique, quelque soit l'approche adoptée, linguistique, statistique ou hybride. Dans ce travail, nous définissons comme mots inconnus les mots non reconnus dans un corpus donné, précisément dans le corpus boursier grec car ils ne sont pas répertoriés dans les dictionnaires électroniques généraux et terminologiques du grec auxquels ont recours les systèmes de TAL. Dans un domaine de spécialité, ce problème s'avère l'un des plus délicats, suite à l'évolution rapide des langues techniques ou scientifiques. Pour l'enrichissement de ces ressources et afin d'exploiter de nouveaux domaines, il est nécessaire d'acquérir rapidement la nouvelle terminologie et de mettre à jour les ressources existantes. Parmi les mots inconnus, figurent des néologismes, mais aussi des mots étrangers, transcrits en grec ou en alphabet latin, des mots en écriture hybride (caractères grecs et latins), des noms propres, des sigles, des mots mal orthographiés et en principe des mots non accentués. Ces mots non reconnus freinent l'analyse automatique des textes boursiers. L'objet du présent travail est l'étude de mots inconnus du corpus boursier (CoBourse), ce qui nous permettra l'ajout de termes néologiques dans le dictionnaire électronique des termes du domaine boursier. Nous nous limitons aux mots simples, les unités polylexicales demandant une approche de traitement différente. À partir de données extraites, nous proposons des heuristiques pour l'annotation semi-automatique des mots inconnus détectés à l'aide du système Unitex (PAUMIER, 2003), afin de les intégrer dans le dictionnaire de termes boursiers
    corecore