90 research outputs found

    Un ensemble de ressources de référence pour l’étude du français : tlfi, frantext et le logiciel stella

    Get PDF
    Les recherches en traitement automatique des langues nécessitent de vastes ressources de référence : corpus textuels, dictionnaires informatiques, outils de traitement. Cette contribution présente les ressources linguistiques informatisées du laboratoire atilf (Analyse et Traitement Informatique de la Langue Française) accessibles sur la toile ainsi que leur diversité d’exploitation potentielle. Regroupant un ensemble de plus de 3600 textes de langue française réunis dans frantext et divers dictionnaires, lexiques et autres bases de données, ces ressources exploitent les fonctionnalités du logiciel stella, qui correspond à un véritable moteur de recherche dédié aux bases textuelles s’appuyant sur une nouvelle théorie des objets textuels.Progress in linguistic research, especially in the field of automatic treatment, depends on access to a vast array of linguistic resources such as texts, dictionaries and software. This paper presents the computerized linguistic resources of the atilf Research Laboratory that are available on the Web and discusses the range of their potential uses. Consisting of a set of more than 3600 documents in French in the frantext database, as well as various dictionaries, lexicons, and other databases, these resources are accessed using the functions of stella, dedicated search engine software for textual databases based on a new theory of textual objects

    A cognitive model for the representation of time in a man-machine dialogue.

    No full text
    This paper develops the foundations of a model for time representation in the framework of a man-machine dialogue system. While we analyse other approaches, especially Allen's interval calculus, we show how the relations that we commonly manipulate in everyday reasoning can in fact be reduced to two fondamental ones : succession and inclusion. By the way, we insist on the fact that a temporal model intended to reproduce some features of the human cognitive abilities shall include in a common representation linguistic information and conceptual objects. We then present the main characteristics of our temporal model, introducing the concept of coherence zone, and how this one can be used to represent tense information in natural language. Finally, we briefly show the mechanisms that ensure temporal consistency when combining new temporal information to an existing structure, and present the main elements that allow learning and predicting mechanisms within this model

    Ortolang

    Get PDF
    Dans cet article nous présentons l'infrastructure Equipex Ortolang (Open Resources and Tools for LANGuage / Outils et Ressources pour un Traitement Optimisé de la LANGue : www.ortolang.fr) en cours de mise en place dans le cadre du Programme d'Investissements d'Avenir (PIA) lancé par le gouvernement français.S'appuyant entre autres sur l'existant des centres de ressources CNRTL (Centre National de Ressources Textuelles et Lexicales : www.cnrtl.fr) et SLDR (Speech and Language Data Repository : http://sldr.org/), cette infrastructure a pour objectif d'assurer la gestion, la mutualisation, la diffusion et la pérennisation de ressources linguistiques de type corpus, dictionnaires, lexiques et outils de traitement de la langue, avec une focalisation particulière sur le français et les langues de France.Après avoir rappelé les motivations d'un tel projet, son originalité et son caractère novateur, nous présenterons les principales caractéristiques d'Ortolang, ses objectifs et ses missions, l'infrastructure logicielle et matérielle de la plateforme puis les moyens mis en œuvre, avant de conclure en indiquant comment suivre et contribuer au projet.This paper presents the infrastructure for the Equipex Ortolang (Open Resources and Tools for LANGuage / Outils et Ressources pour un Traitement Optimisé de la LANGue : www.ortolang.fr) which is currently being developed as part of the French government's Investments for the Future programme.Drawing on existing resources such as the CNRTL (Centre National de Ressources Textuelles et Lexicales: www.cnrtl.fr) and SLDR (Speech and Language Data Repository: http://sldr.org/), the infrastructure is designed for the long-term management, sharing and dissemination of linguistic resources including corpora, dictionaries, lexicons and language processing tools, with a particular focus on French and other languages in France.The paper briefly presents the rationale behind such an original and ground-breaking project, then describes the main characteristics and goals of Ortolang, the platform hardware and software as well as the means available, before concluding with planned future developments and an invitation to contribute to the project

    Mise en oeuvre d'un accès ouvert à des ressources linguistiques — bilan du projet Silfide et perspectives.

    Get PDF
    This paper presents the main technologies implemented within the Silfide project and aiming at providing a distributed access to language resources. In particular it shows the role of standardized formats (XML, TEI) and present a mechanism for distributed queries across several servers

    Le projet Silfide : vers un accès ouvert aux ressources linguistiques francophones

    Get PDF
    National audienceSILFIDE (Serveur Interactif pour la Langue Française, son Identité, sa Diffusion et son Etude) est un outil de mise en commun, conviviale et raisonnée, des connaissances sur différents aspects de la langue française. Il consiste en un réseau de serveurs informatiques et d'actions en alimentant les fonctions

    Lexique, langue et tâche dans un dialogue homme-machine finalisé

    Get PDF
    International audiencePlace du lexique dans la compréhension de dialogues homme-machin

    Du trésor de la langue française à l’ATILF et au CNRTL

    Get PDF
    Par une décision du 20 décembre 1960 est créé à Nancy un centre de recherche dont la mission consiste à réunir la documentation pertinente et à mettre en oeuvre, la rédaction et la publication d’un Trésor de la langue française (Tlf). Cette décision avait été préparée et souhaitée trois ans plus tôt à partir des conclusions d’un colloque international de lexicologie et lexicographie françaises et romanes, organisé au Centre de philologie romane de Strasbourg par son directeur, le professeur P..

    Le traitement des déictiques dans le DOHM

    Get PDF
    Colloque avec actes et comité de lecture. nationale.National audienceDans ce papier, nous proposons une analyse logique des déictiques. Notre travail s'effectue dans le cadre du dialogue de commande homme-machine. Dans un premier temps, nous présentons ce cadre et justifions la nécessité de représenter le contenu propositionnel des énoncé. Dans un second temps, nous illustrons la différence entre forme logique et contenu propositionnel ; cette différence est particulièrement importante dans le cas du traitement des déictiques. Nous montrons ensuite qu'au delà de l'intuition qui fait dire que " je " réfère à celui qui parle, il est nécessaire pour le traitement des déictiques de faire la différence entre l'acte locutionnaire (dans lequel le référent des déictiques doit être recherché) et l'acte illocutionnaire sous le champ duquel on ne peut voir apparaître que le référent des déictiques et pas leur sens

    Quel lexique pour un traitement automatique de la référence ?

    Get PDF
    International audienceLexique et traitement de la référenc

    ATILF's computerized linguistic resources involved in cooperative projects

    Get PDF
    International audienceThis paper presents some of the computerized linguistic resources of the Research Laboratory ATILF (Analyse et Traitement Informatique de la Langue Française) available on the Web. This considerable amount of resources concerning French language consists in a set of more than 3650 literary works grouped together in the textual database Frantext, plus a number of dictionaries, lexis and other databases. First, we try to place the resources in a wider perspective, next to identify special data representation and access problems. ATILF has great interest to stimulate re-usage of its resources by the NLP community. These computerized resources are involved in several national and international projects as Normalangue, INTERA, OLAC and ENABLER. The use of metadata to describe the available resources is a way of making those resources locatable and accessible. The metadata's visibility through some international harvesters will encourage collaborations and provide help for the industry, research and education. ATILF expects that the metadata description of the computerized resources will facilitate the access to local French language resources and increase the usage of the resources already available
    • …
    corecore