    KAF: Kyoto Annotation Framework

    This document presents the current draft of KAF: Kyoto Annotation Framework to be used within the KYOTO project. KAF aims to provide a reference format for the representation of semantic annotations

    Diseño y construcción de un sistema inteligente de ayuda diccionarial

    Resumen de la Tesis Doctoral presentada en la Facultad de Informática de San Sebastián de la Universidad del País Vasco en mayo de 1993

    Idiomatikotasunaren karakterizazio automatikoa: izena+aditza

    Ikerkuntza-lan honen helburua izan da izena+aditza osaerako unitate fraseologikoak (UFak) corpusetik automatikoki eskuratzeko eta haien idiomatikotasunaren arabera karakterizatzeko teknikak garatzea eta esperimentalki testatzea. Idiomatikotasuna UFen ezaugarri definitzailetzat hartu dugu, eta haren lau propietate hauek hartu ditugu neurgai gisa: instituzionalizazioa (idiosinkrasia estatistikoa), ez-konposizionaltasun semantikoa, finkapen morfosintaktikoa eta finkapen lexikala. Ondorio nagusia da arlo honetan estandar diren agerkidetza-tekniken emaitzak modu esanguratsuan gainditu direla, batez ere teknika semantikoen bidez, baina baita malgutasun morfosintaktikoaren neurketen bidez ere. Aldiz, malgutasun lexikalaren neurketek ez dute espero izatekoa zen mailako emaitza izan. Azkenik, teoria fraseologikoaren aurresan batzuen ebidentzia esperimentalak lortu ditugu.; The goal of this research is to develop and experimentally test different techniques for the automatic extraction of phraseological units (PUs) of noun+verb structure in Basque and for their characterization according to the idiomaticity level. Idiomaticity is considered the defining feature of the concept of phraseological unit (PU), ande we have measured its following components: institutionalization (statistical idiosyncrasy), semantic non-compositionality, morphosyntact ic fixedness and lexical fixedness. The results show that the standard cooccurence techniques are significantly ourtperformed by semantic measures, and, to a lower extent, by measures of morphosyntactic flexibility. The results of lexical flexibility are poorer than expected. Finally, we obtain experimental evidence for several predictions of phraseological theory

    Specification of a general linguistic annotation framework and its use in a real context

    AWA es una arquitectura general para representar información lingüística producida por procesadores lingüísticos. Nuestro objetivo es definir un esquema de representación coherente y flexible que sea la base del intercambio de información entre herramientas lingüísticas de cualquier tipo. Los análisis lingüísticos se representan por medio de estructuras de rasgos según las directrices de TEI-P4. Estas estructuras y su relación con los demás elementos que componen el análisis forman parte de un modelo de datos diseñado bajo el paradigma de orientación a objetos. AWA se encarga de la representación de la información dentro de una arquitectura más amplia para gestionar todo el proceso de análisis de un corpus. Como ejemplo de la utilidad del modelo presentado explicaremos cómo se ha aplicado dicho modelo en el procesamiento de dos corpus.In this paper we present AWA, a general architecture for representing the linguistic information produced by diverse linguistic processors. Our aim is to establish a coherent and flexible representation scheme that will be the basis for the exchange of information. We use TEI-P4 conformant feature structures as a representation schema for linguistic analyses. A consistent underlying data model, which captures the structure and relations contained in the information to be manipulated, has been identified and implemented by a set of classes following the object-oriented paradigm. As an example of the usefulness of the model, we will show the usage of the framework in a real context: two corpora have been annotated by means of an application which aim is to exploit and manipulate the data created by the linguistic processors developed so far

    Análisis automático del diccionario Hauta-Lanerako Euskal Hiztegia

    El propósito de la siguiente comunicación es el de dar a conocer la labor desarrollada en el proceso de análisis del Hauta-Lanerako Euskal Hiztegia (HLEH) [Sarasola 84/95]. Para ello se describirán las características más importantes del mismo, para pasar a continuación a detallar las fases concernientes a la preparación del diccionario fuente en MRD y la confección de la gramática que refleje la estructura del mismo

    Dictionnaire Intelligent D'aide A La Comprehension

    Introduction Dans la recherche du traitement du langage naturel, l'aspect du lexique devient de plus en plus prépondérant. En effet, il s'agit d'un champ de recherche dont on a fait bon marché autrefois mais qui s'est révélé d'une grande importance à l'heure de construire de vrais systèmes de compréhension du langage naturel doués de composantes lexicales de taille réelle. La construction à la main de ces composantes lexicales de taille réelle est bien sûr un travail énorme. Par ailleurs, il semble évident que dans les éditions courantes des dictionnaires on peut trouver de grandes quantités d'information qui-convenablement traitées- peuvent s'avérer être un point de départ important pour la construction automatique ou semi-automatique de ces bases lexicales. Ce traitement sera fait sur les versions machine (Machine Readable) de ces dictionnaires mais il ne faut pas oublier que ces versions, dans la plupart des cas, ne sont que des bandes magnétiques expressément enregistrée

    Irakaskuntza automatikoa: sistema tutore adimentsuak

    Lan honetan konputagailuen agerpenak irakaskuntza munduan izan duen eragina azaldu, eta irakaste-sistema automatikoen posibilitateak eta bilakaera aurkezten ditugu laburki. Horretaz gain, sistema automatiko horien artean dauden Sistema Tutore Adimentsuak deskribatzen dira

