356 research outputs found

    Le lexique-grammaire est-il exploitable pour le traitement des langues ?

    Get PDF
    The Lexicon-Grammar of French is a dictionary with structured syntactic-semantic information. In order to assess its exploitability in language processing, we survey four criteria: readability, degree of formalisation, degree of validity of information content, and richness in information. We contribute concrete examples to inform this discussion. We compare the significance of the criteria, in order to evaluate the validity of the priorities retained and of the compromises adopted in the course of the construction of the Lexicon-Grammar.Le lexique-grammaire du français est un dictionnaire contenant des informations syntaxico-sémantiques structurées. Pour évaluer son exploitabilité dans le traitement des langues, nous passons en revue quatre critères : sa lisibilité, son degré de formalisation, le degré de validité de son contenu informatif, et sa richesse en informations. Nous proposons des exemples concrets susceptibles d'éclairer le débat sur cette question. Nous pesons l'importance de ces critères, afin d'évaluer la validité des priorités retenues et des compromis adoptés tout au long de l'élaboration du lexique-grammaire

    Acceptability as the source of syntactic knowledge

    Get PDF
    Special issue on Lexicon-Grammar. Beijing: Institute of Applied Linguistics. In ChineseInternational audienceIn order to construct any representation of the syntax or of the vocabulary of a language, we must first know where information about syntax and semantics is to be found. The point of view of Lexicon-Grammar in this regard is that the source of knowledge lies in experimentation. We will therefore examine the experimental side of syntax and semantics. Most of this paper is based on M. Gross (1984, 1988, 1992, 1994)

    Concordanciers et flexion automatique

    Get PDF
    International audienceConcordancers et automatic inflection. More and more linguists use concordancers to extract words or phrases in context from pre-existing texts. We make a survey on how concordances are used. We discuss the main criteria of quality for choosing a concordancer for a particular use. The goal of this paper is to examine in more detail those that generate lemmatised concordances, i.e. concordances gathering the various inflected forms of a word. This technical feature is in practice specific to concordancers containing a dictionary. An automatic operation on dictionaries, inflection, is indispensable to maintain, and sometimes to operate, this type of concordancer. We explain the basics about automatic inflection and what it implies for a lexicologist. We describe a tried and tested method of automatic inflection.. This type of concordancer, in turn, is useful to lexicologists, among others.Des linguistes de plus en plus nombreux utilisent des concordanciers pour extraire de textes préexistants des mots ou expressions en contexte. Nous passons en revue les utilisations des concordances. Nous nous intéressons aux principaux critères de qualité qui permettent de choisir un concordancier satisfaisant pour un usage donné. L'objectif de cet article est d'examiner plus particulièrement ceux qui produisent des concordances lemmatisées, c'est-à-dire qui regroupent les différentes formes fléchies d'un même mot. Cette caractéristique technique est pratiquement réservée aux concordanciers avec dictionnaire. Un traitement sur les dictionnaires, la flexion automatique, est indispensable à la maintenance, et parfois au fonctionnement, des concordanciers de ce type. Nous expliquons en quoi consiste ce traitement et ce qu'il implique pour le lexicologue. Nous présentons une méthode éprouvée de flexion automatique. Un tel concordancier, à son tour, est utile, entre autres, aux lexicologues

    Exemples attestés et exemples construits dans la pratique du lexique-grammaire

    Get PDF
    National audienceCroft (1993) contrasts an 'experimental method' with an 'observational method', thus renewing the discussion between introspective linguistics and corpus linguistics, by suggesting a parallel with experimental sciences, which these terms come from. The example of lexicon-grammar, a method of syntactic-semantic description constructed with explicit reference to experimental sciences, confirms that formulating rules in accordance with the real usage of a language is not only a matter of observing examples, but also that it nevertheless requires intensive observation of examples, as well as rigorous methodological precautions in this observation. Thus, the apparently opposed traditions of introspective linguistics and of corpus linguistics are complementary and should be combined for the success of such an enterprise. These thoughts are an invitation for linguists to overcome their historical resistance to combining both types of methods.Similarly, in natural language processing, most of the community sticks to the stochastic approach, which amounts to giving up co-operation between computer technology and descriptive linguistics.L'opposition de Croft (1998) entre " méthode expérimentale " et " méthode observationnelle " renouvelle le vieux débat entre linguistique introspective et linguistique de corpus, en suscitant un parallèle avec les sciences expérimentales, auxquelles Croft emprunte ces termes. L'exemple du lexique-grammaire, une méthode de description syntaxico-sémantique dont les fondements se réfèrent explicitement aux sciences expérimentales, confirme, s'il en était besoin, que la formulation de règles conformes à la réalité de l'usage d'une langue ne se résume pas à une simple observation d'exemples. Toutefois, elle nécessite une observation intensive d'exemples, ainsi que des précautions méthodologiques rigoureuses dans cette activité d'observation. Les traditions apparemment opposées de la linguistique introspective et de la linguistique de corpus sont donc complémentaires et de nature à se combiner pour favoriser le succès d'une telle entreprise. Ces réflexions invitent les linguistes à surmonter leur réticence historique à combiner les deux types de méthodes.De même, en traitement automatique des langues, la majeure partie de la communauté en reste à l'abordage probabiliste, renonçant à faire collaborer l'informatique appliquée avec la linguistique descriptive

    Dictionaries for language processing. Readability and organization of information

    Get PDF
    What makes a dictionary exploitable in Natural Language Processing (NLP)? We examine two requirements: readability of information and general architecture, and we focus on the human tasks involving NLP dictionaries: construction, update, check, correction. We exemplify our points with real cases from projects of morpho-syntactic or syntactic-semantic dictionaries.Quelles caractéristiques d'un dictionnaire le rendent exploitable pour le traitement automatique des langues (TAL) ? Nous examinons deux exigences : la lisibilité des informations et l'architecture générale, et nous nous concentrons sur les tâches humaines concernées par les dictionnaires pour le TAL : construction, mise à jour, vérification, correction. Nous illustrons nos arguments par des exemples de cas réels tirés de projets de dictionnaires morpho-syntaxiques ou syntactico-sémantiques

    Une classe d'adjectifs de localisation

    Get PDF
    National audienceWe propose a homogeneous class of French location adjectives, ADJLOC, and a lexicon-grammar approach to their description. The adjectives are those which never constitute a predicate with a support verb, and optionally or obligatorily occur in free sentences like This is the south front of the house. ADJLOC's admit various other syntactic constructions. Thus, some of them occur in a sentence with have related to a sentence with a locative preposition: the car has a rear bumper, the car has a bumper in its rear part. Two nominalization relations lead to nominal constructions: this is the central area of the screen, this is the centre of the screen, this is the area of the centre of the screen. The constructions discussed in this article are represented in a table of syntactic properties.Nous proposons une classe homogène d'adjectifs de localisation français, ADJLOC, et une description de cette classe par la méthode du lexique-grammaire. Ces adjectifs sont définis comme ceux qui ne constituent jamais un prédicat avec un verbe support, et qui apparaissent facultativement ou obligatoirement dans des phrases libres telles que Ceci est la façade sud de la maison. Les ADJLOC admettent diverses autres constructions syntaxiques. Ainsi, certains apparaissent dans une phrase en avoir liée à une phrase à préposition locative : La voiture a un pare-chocs arrière, La voiture a un pare-chocs dans sa partie arrière. Deux relations de nominalisation mènent à des constructions nominales : Ceci est la partie centrale de l'écran, Ceci est le centre de l'écran, Ceci est la partie du centre de l'écran. Les constructions discutées dans cet article sont représentées dans une table de propriétés syntaxiques

    Recension de "Description linguistique pour le traitement automatique du français", par Matthieu Constant et al

    Get PDF
    Recension parue dans Zeitschrift für Französische Sprache und Literatur 120/3 (Stuttgart : Franz Steiner Verlag, ISSN : 0044-2747) de " Description linguistique pour le traitement automatique du français " (Matthieu Constant, Anne Dister, Louisette Emirkanian, Sophie Piron, éd., 2008, Collection " Cahiers du Cental ", 5, Louvain-la-Neuve : Presses Universitaires de Louvain, ISBN 978-2-87463-138-2, 210 p.).This volume deals with linguistic bases of language processing. The work presented in it is somewhere on paths from fundamental analyses on one or several languages, through description, formalization, simplification, assessment and elaboration, to operational computer applications. The authors are keen on producing formal, computer-compatible results. The papers are written in French and deal with French.Cet ouvrage aborde des bases linguistiques du traitement automatique des langues. Les travaux présentés se situent sur des chemins qui partent d'analyses fondamentales portant sur une ou plusieurs langues, qui parcourent ensuite des étapes de description, formalisation, simplification, évaluation et autres élaborations, pour enfin mener à des applications informatiques opérationnelles. Les auteurs manifestent leur souci de produire des résultats formels, manipulables par ordinateur. Les articles sont rédigés en français et traitent de la langue française

    Lexicon management and standard formats

    Get PDF
    International audienceInternational standards for lexicon formats are in preparation. To a certain extent, the proposed formats converge with prior results of standardization projects. However, their adequacy for (i) lexicon management and (ii) lexicon-driven applications have been little debated in the past, nor are they as a part of the present standardization effort. We examine these issues. IGM has developed XML formats compatible with the emerging international standards, and we report experimental results on large-coverage lexica
    • …
    corecore