19 research outputs found

    Hitzak sarean. Pello Salabururi esker onez

    Get PDF
    168 p.Hona hemen, irakurle, Pello Salaburu maisu handiari eskaintzen diogun esker on liburua. Hamaika lan bildu ditugu, hainbat alorretakoak: euskararen lexikografia, terminologia, historia, gramatika, corpus ikerketa eta baita euskara eta gaztelaniaren prozesamenduari buruzkoak ere. Askotarikoa izan baita, zalantza gabe, Salaburuk utzi digun uzta oparoa; hizkuntzalaritzan, euskararen fonologian, gramatikan, lexikografian aitzindari izan dugu, gramatika sortzailearen esparruan lehenik, gero corpus eta hiztegi digitalak sortuaz, gure hizkuntza hobeto ezagutzeko, zaintzeko eta erabiltzeko behar ditugun xxi. mendeko lanabesak eraikiaz eta gizartean zabalduaz. Salabururen uzta ikerketaz eta akademiaz harago zabaltzen da, gure gizarteak ezagutu dituen hainbat erronkatara. Pello ez da inoiz uzkurtu gogoeta egin behar izan denean, bakegintzaren bideari dagokiola edo unibertsitatearen etorkizunari, beldur gabe agertu izan zaigu beti plazan, argi mintzatuaz, zuzen, hitzen kiribiletan sekula bere burua ezkutatu gabe

    La description lexicographique de la terminologie du droit pour les besoins de la traduction juridique du français vers le polonais

    Get PDF
    Przedmiotem niniejszej monografii jest leksykograficzny opis terminologii prawa, z uwzględ-nieniem jego zastosowania w środowisku pracy tłumacza, a ściślej w kontekście tłumaczenia automatycznego i wspomaganego komputerowo. Opis ten bazuje na modelu opracowanym przez W. Banysia w ramach zorientowanego obiektowo opisu jednostek leksykalnych. Niniejsza praca stanowi zastosowanie tego modelu do leksykograficznego opisu jednostek języka prawa, należą-cych do wyodrębnionej klasy obiektowej . Monografia składa się z dwóch części. Pierwsza z nich ma charakter opisowy, a jej celem jest przedstawienie ram dyscyplinarnych i teoretycznych pracy. W rozdziale pierwszym omówiono pokrótce pojęcia języka prawa, tekstu prawniczego i przekładu prawniczego. Wyjaśniono różnice między różnymi typami tłumaczenia automatycznego (regułowym, statystycznym, hybrydowym, neuronalnym). Przedstawiono dwa podstawowe podejścia do opisu terminologii: preskryptywne oraz deskryptywne, a także podkreślono znaczenie wykorzystania korpusów językowych w ba-daniach terminologicznych. Rozdział drugi poświęcono podejściu zorientowanemu obiektowo. Szczegółowemu omówieniu zorientowanego obiektowo opisu jednostki leksykalnej W.  Banysia towarzyszy zarys następujących koncepcji teoretycznych: klas obiektowych G.  Grossa, teorii Sens-Texte, teorii słownika generatywnego oraz ontologii WordNet, z uwzględnieniem tam, gdzie to możliwe, ich przydatności do opisu leksyki specjalistycznej z dziedziny prawa. W roz-dziale trzecim omówiono problemy związane z opisem leksyki specjalistycznej w ramach opisu zorientowanego obiektowo, w szczególności zagadnienia związane z doborem i wyborem do ana-lizy jednostek leksykalnych, a także z wyborem i eksploracją korpusów. Model zorientowanego obiektowo opisu jednostek leksykalnych ma charakter deskryptywny, a jego celem jest zaprezen-towanie języka prawa w jego autentycznej formie. Druga część pracy ma charakter praktyczny, przedstawiono w niej leksykograficzny opis wybranych do analizy jednostek leksykalnych, sporządzony zgodnie z przedstawioną w części pierwszej metodologią. Składa się ona z tabel, zawierających opis pięćdziesięciu dwóch jednostek leksykalnych, należących do klasy obiektowej oraz jednej jednostki leksykalnej, należącej do superklas : oraz . Tabele te stanowią ilustrację zastosowania modelu leksykograficznego W. Banysia do opisu jednostek języka prawa

    Inside Baseball: Coverage, quality, and culture in the Global WordNet

    Get PDF
    Inside Baseball: Coverage, quality, and culture in the Global WordNet The Global WordNet is succeeding in producing relatively open linguistic data that is coordinated to a degree among numerous languages. The project has grown organically, with no overall plan or direction. The result is a certain amount of incoherence in determining what items should be treated in wordnets, and how the various wordnets should aspire to consistent quality. Using the example of terms related to baseball, which constitute a non-trivial portion of the Princeton WordNet, this paper discusses problems of coverage selection both for English and for other languages, as well as methods to improve quality and depth through public review of current content, and contribution of missing terms and definitions. It is proposed that proper names be removed entirely from WordNet and treated as a separate project, and that individual languages produce annexes of indigenous concepts that can be readily considered within sister projects as a supplement to the Anglo-American weighting of the current endeavor. To produce a consistent product that transmits inter-intelligible understanding at a high level across languages, it is proposed that an open committee of interested stakeholders convene to consider the project's goals and develop a roadmap for how to achieve them.   Baseball dla zaawansowanych: pokrycie leksykalne, jakość i kultura w Global WordNet Global WordNet z powodzeniem tworzy stosunkowo otwarte dane językowe, do pewnego stopnia powiązane pomiędzy wieloma językami. Projekt żyje własnym życiem, bez żadnego ogólnego planu ani kierunku. Rezultatem jest pewna niespójność w określaniu, które elementy powinny znaleźć się w wordnetach oraz w jaki sposób różne wordnety powinny dążyć do utrzymania tej samej jakości. Na przykładzie terminów związanych z baseballem, które zajmują niemałą część Princeton WordNet, niniejszy artykuł omawia problemy wyboru pokrycia leksykalnego zarówno dla języka angielskiego, jak i innych języków, a także metody poprawy jakości poprzez publiczny przegląd aktualnych treści oraz dodanie brakujących terminów i definicji. Proponuje się, aby nazwy własne zostały całkowicie usunięte z WordNetu i potraktowane jako odrębny projekt, a w ramach poszczególnych języków utworzone zostały aneksy rodzimych pojęć, które można wziąć pod uwagę w ramach siostrzanych projektów jako uzupełnienie obecnego anglo-amerykańskiego przedsięwzięcia. W celu stworzenia spójnego produktu, który będzie charakteryzował się wzajemną zrozumiałością na wysokim poziomie w różnych językach, proponuje się zwołanie otwartego komitetu zainteresowanych podmiotów, aby rozważyć cele projektu i opracować plan działania, w jaki sposób cele te osiągnąć

    Lexical platform – the first step towards user-centred integration of lexical resources

    Get PDF
    Lexical platform – the first step towards user-centred integration of lexical resources Lexical platform – the first step towards user-centred integration of lexical resources The paper describes the Lexical Platform - a means for lightweight integration of independent lexical resources. Lexical resources (LRs) are represented as web components that implement a minimal set of predefined programming interfaces. These provide functionality for querying and generate a simple, common presentation format. Therefore, a common data format is not needed and the identity of component LRs is preserved. Users can search, browse and navigate via resources on the basis of a limited set of anchor elements such as base form, word form and synset id.   Platforma leksykalna – pierwszy krok w kierunku integracji zasobów leksykalnych zorientowanej na użytkowników Artykuł opisuje Platformę Leksykalną – sposób na lekką integrację niezależnych zasobów leksykalnych. Zasoby leksykalne są na niej reprezentowane jako komponenty webowe, które implementują minimalny zestaw predefiniowanych interfejsów programistycznych. Interfejsy te dostarczają funkcjonalność do przeszukiwania oraz generują prosty, jednolity format prezentacji zasobów. W związku z tym wspólny format danych nie jest konieczny i tożsamość składowych zasobów leksykalnych jest zachowana. Użytkownicy mogą przeszukiwać zasoby na podstawie ograniczonego zbioru odwołań takich jak forma podstawowa, forma wyrazowa i identyfikator synsetu

    Contrastive terminography

    Get PDF
    Contrastive terminographyContrastive methods have long been employed in lexicography, in particular in bi- and multilingual dictionary projects. The main rationale for this is the necessity to comprehensively study, i.e. compare and contrast, two or more linguistic systems that are to be presented in one way or another in respective dictionaries. Similarly, the contrastive approach is of paramount importance in terminographic undertakings, on account of the need to draw a distinction between terminological (conceptual) systems existing in various languages and across cultures. It must be emphasised, however, that the contrastive element is not only a part of terminographic practice, but also of the theory of terminography. This article aims to present the role of contrastive research across various spheres of specialised (=LSP) lexicography. Terminografia kontrastywnaMetody kontrastywne stosowane są w słownikarstwie od dawna, w szczególności w odniesieniu do dwu- i wielojęzycznych projektów leksykograficznych, z uwagi na konieczność przeprowadzenia analiz porównawczych dwóch lub więcej systemów językowych, których elementy mają być w konkretny sposób przedstawione/zestawione w słowniku. Badania kontrastywne odgrywają równie ważną rolę w pracy terminograficznej, przede wszystkim ze względu na potrzebę dokonania porównania systemów terminologicznych (pojęciowych) funkcjonujących w różnych językach i kulturach. Należy podkreślić, że elementy analiz kontrastywnych nie są jedynie domeną praktyki – korzysta z nich również teoria terminografii. W artykule przedstawiono rolę badań kontrastywnych na różnych płaszczyznach działalności terminograficznej

    Contrastive terminography

    Get PDF
    Contrastive terminography Contrastive methods have long been employed in lexicography, in particular in bi- and multilingual dictionary projects. The main rationale for this is the necessity to comprehensively study, i.e. compare and contrast, two or more linguistic systems that are to be presented in one way or another in respective dictionaries. Similarly, the contrastive approach is of paramount importance in terminographic undertakings, on account of the need to draw a distinction between terminological (conceptual) systems existing in various languages and across cultures. It must be emphasised, however, that the contrastive element is not only a part of terminographic practice, but also of the theory of terminography. This article aims to present the role of contrastive research across various spheres of specialised (=LSP) lexicography.   Terminografia kontrastywna Metody kontrastywne stosowane są w słownikarstwie od dawna, w szczególności w odniesieniu do dwu- i wielojęzycznych projektów leksykograficznych, z uwagi na konieczność przeprowadzenia analiz porównawczych dwóch lub więcej systemów językowych, których elementy mają być w konkretny sposób przedstawione/zestawione w słowniku. Badania kontrastywne odgrywają równie ważną rolę w pracy terminograficznej, przede wszystkim ze względu na potrzebę dokonania porównania systemów terminologicznych (pojęciowych) funkcjonujących w różnych językach i kulturach. Należy podkreślić, że elementy analiz kontrastywnych nie są jedynie domeną praktyki – korzysta z nich również teoria terminografii. W artykule przedstawiono rolę badań kontrastywnych na różnych płaszczyznach działalności terminograficznej

    An ontology for human-like interaction systems

    Get PDF
    This report proposes and describes the development of a Ph.D. Thesis aimed at building an ontological knowledge model supporting Human-Like Interaction systems. The main function of such knowledge model in a human-like interaction system is to unify the representation of each concept, relating it to the appropriate terms, as well as to other concepts with which it shares semantic relations. When developing human-like interactive systems, the inclusion of an ontological module can be valuable for both supporting interaction between participants and enabling accurate cooperation of the diverse components of such an interaction system. On one hand, during human communication, the relation between cognition and messages relies in formalization of concepts, linked to terms (or words) in a language that will enable its utterance (at the expressive layer). Moreover, each participant has a unique conceptualization (ontology), different from other individual’s. Through interaction, is the intersection of both part’s conceptualization what enables communication. Therefore, for human-like interaction is crucial to have a strong conceptualization, backed by a vast net of terms linked to its concepts, and the ability of mapping it with any interlocutor’s ontology to support denotation. On the other hand, the diverse knowledge models comprising a human-like interaction system (situation model, user model, dialogue model, etc.) and its interface components (natural language processor, voice recognizer, gesture processor, etc.) will be continuously exchanging information during their operation. It is also required for them to share a solid base of references to concepts, providing consistency, completeness and quality to their processing. Besides, humans usually handle a certain range of similar concepts they can use when building messages. The subject of similarity has been and continues to be widely studied in the fields and literature of computer science, psychology and sociolinguistics. Good similarity measures are necessary for several techniques from these fields such as information retrieval, clustering, data-mining, sense disambiguation, ontology translation and automatic schema matching. Furthermore, the ontological component should also be able to perform certain inferential processes, such as the calculation of semantic similarity between concepts. The principal benefit gained from this procedure is the ability to substitute one concept for another based on a calculation of the similarity of the two, given specific circumstances. From the human’s perspective, the procedure enables referring to a given concept in cases where the interlocutor either does not know the term(s) initially applied to refer that concept, or does not know the concept itself. In the first case, the use of synonyms can do, while in the second one it will be necessary to refer the concept from some other similar (semantically-related) concepts...Programa Oficial de Doctorado en Ciencia y Tecnología InformáticaSecretario: Inés María Galván León.- Secretario: José María Cavero Barca.- Vocal: Yolanda García Rui

    Tune your brown clustering, please

    Get PDF
    Brown clustering, an unsupervised hierarchical clustering technique based on ngram mutual information, has proven useful in many NLP applications. However, most uses of Brown clustering employ the same default configuration; the appropriateness of this configuration has gone predominantly unexplored. Accordingly, we present information for practitioners on the behaviour of Brown clustering in order to assist hyper-parametre tuning, in the form of a theoretical model of Brown clustering utility. This model is then evaluated empirically in two sequence labelling tasks over two text types. We explore the dynamic between the input corpus size, chosen number of classes, and quality of the resulting clusters, which has an impact for any approach using Brown clustering. In every scenario that we examine, our results reveal that the values most commonly used for the clustering are sub-optimal

    SPOKEN AND SIGN LANGUAGE PROCESSING USING GRAMMATICALLY AUGMENTED ONTOLOGY

    Get PDF
    The mathematical model of grammatically augmented ontology was intro-duced to address this issue. This model was used for grammatical analysis of Ukrainian sentences. Domain specific language named GAODL for description of grammatically augmented ontology was developed. The grammar of the language was defined by means of Xtext extension for Eclipse. The developed language was used as an auxiliary part of the infor-mation technology for bidirectional Ukrainian sign language translation
    corecore