13 research outputs found
Achieving Goals in Collaboration: Analysis of Estonian Institutional Calls
Proceedings of the 16th Nordic Conference
of Computational Linguistics NODALIDA-2007.
Editors: Joakim Nivre, Heiki-Jaan Kaalep, Kadri Muischnek and Mare Koit.
University of Tartu, Tartu, 2007.
ISBN 978-9985-4-0513-0 (online)
ISBN 978-9985-4-0514-7 (CD-ROM)
pp. 59-66
20 aastat lingvistikaolümpiaadi koos Renate Pajusaluga
Rahvusvaheline lingvistikaolümpiaad kutsuti ellu 2003. aastal. Eestis seati see sisse samal aastal tänu Renate Pajusalule, kes seda vedama asus. Siinne artikkel vaatabki tagasi 20-le lingvistikaolümpiaadi aastale ning Renate rollile selles, tehes seda Renate kaasteeliste pilgu läbi. Artiklis leiavad kajastust erinevad võistlusvoorud, aga ka olümpiaadi heaks tehtavad tegevused, nagu lingvistikalaagrid, koolikülastused ja lingvistikaseminarid. Ühtlasi ilmneb artiklist, et olümpiaad ja sellega seonduv on nende 20 aasta jooksul täitnud oma laiemat eesmärki: tuhanded õpilased on saanud aimu erisugustest maailma keeltest ja ka keeleteadusest.
Abstract. Miina Norvik, Linda Freienthal, Olga Gerassimenko, Airika Harrik, Axel Jagau, Reeli Torn-Leesik, Külli Prillop: 20 years of linguistics Olympiad with Renate Pajusalu. The International Linguistics Olympiad was inaugurated in 2003. The corresponding Estonian national olympiad was established in the same year thanks to the efforts of Renate Pajusalu who became its chief organiser. The present article looks back on the role played by Professor Pajusalu in the history of the Estonian linguistics olympiad through the eyes of colleagues who have been part of the process. The text recalls the different stages of the contest, as well as various tasks preparing the olympiad such as linguistics retreats, school visits to introduce it, and linguistics seminars. It is clear that the 20 years of the olympiad and events associated with it have served its overall purpose well: thousands of school students have become aware of the diversity of the world’s languages and of the science of linguistics
Digidokumendist tekstikorpuseks: Semperi ja Barbaruse kirjavahetuse töötlemine masinanalüüsitavaks päringusüsteemis KORP
Kirjandusteadlaste ja arvutilingvistide koostöös katseprojektina valminud Johannes Semperi ja Johannes Barbaruse kirjavahetuse korpus on nii kirjanduslooliselt kui tekstilingvistiliselt huvipakkuv digitaalandmestik. Kirjandusteadlastele avab kaasaegsete digitaalsete meetodite kasutuselevõtt huvitavaid uurimisperspektiive ja vanade uurimistulemuste ülekontrollimise võimalusi arvutuslike meetoditega. Korpuslingvistidele on aga väljakutseks ajaloolise ja isikupärase keelekasutusega, erinevatest keeltest kubiseva ja rohkete koha-, aja- ja isikuviidetega tekstimaterjali ettevalmistamine rikkalikult märgendatud korpuseks. Artikkel peatub üksikasjalikumalt nii käsikirjalise materjali digitaalseks tekstiandmestikuks ettevalmistamise kui ka analüüsi- ja märgendamisprotsessi probleemidel ja nende võimalikel lahendustel. Kasutajatele tutvustatakse ka korpuste päringusüsteemi KORP võimalusi sarnaste tekstide uurimiseks.
Abstract. Marin Laak, Kaarel Veskis, Kadri Vider, Neeme Kahusk, and Olga Gerassimenko: Turning from digital document to text corpus: conversion of correspondence between Semper and Barbarus to a machine-readable unit in KORP. The article describes a joined pilot project of literary scholars and language technologists that resulted in a correspondence corpus of Estonian avant-garde poets Johannes Semper and Johannes Barbarus. The corpus is an inspiring digital dataset both for literary and linguistic researches. Contemporary digital methods allow literary scholars to find new interesting research perspectives and to revise the old research results with computational methods. Corpus linguists can find interesting challenges in historically and personally unique language use of the correspondents, in multiple languages used for citations and language play, in multiple references to places, events and persons in the textual material that was transformed to an annotated corpus. The article describes the preparation of typed-in manuscript material for a digital dataset in detail, problems of annotation and analysis and their possible solutions. The reader will get an insight to the possibilities that corpus query system KORP offers for the research of similar textual material
Vastus jah – kas seda on vaja eraldi õpetada? Eesti jah ja vene da – funktsionaalsed erinevused telefonivestluste näitel
Eesti partikkel jah täidab mitmeid suhtlusfunktsioone, teatmeteostes kajastuvad neist vaid mõned. Partiklite jah/jaa funktsioone suhtluses on uurinud R. Kasterpalu müügivestluste näitel. Analüüs näitab, et partikleid jah/jaa kasutatakse lisaks samameelsuse või jaatuse väljendamisele ka suhtlussekventside jätkamiseks ja lõpetamiseks. Lõpetav funktsioon on naaberpaari järelliikmel (nt vastus kas-küsimusele), aga ka järelliikmele järgneval ülekinnitusel (nt ettepanekuga nõustumisel). Partikleid jah/jaa kasutatakse samuti huvi mittepakkuva teema lõpetamiseks ning keset pooleliolevat kõnevooru kuuldeloleku ja vastuvõtu signaalina. O. Gerassimenko registratuurikõnede võrdluskorpus kinnitab neid tulemusi ning näitab, et eesti partiklite jah/jaa kasutusala on vene suhtluspartiklist oluliselt laiem. Erinevalt eesti partiklitest jah/jaa ei esine vene partiklit infosoovi vastuvõtmisel ning kuuldeloleku ja vastuvõtu signaalina. Küsimus-vastus sekventsis järgneb jah/jaa ootuspärasele vastusele. Tõlkesõnaraamatutes praeguseks käsitlemata erinevused nimetatud partiklite kasutuses tunduvad autoritele piisavalt olulised, et kajastada neid keeleõppes
Other-Initiated Self-Repairs in Estonian Information Dialogues: Solving Communication Problems in Cooperation
The paper gives an overview of repair sequences used in Estonian spoken information dialogues. 62 calls for information, travel bureaus, shops or outpatients’ departments are analysed. Several repair types are considered. Our further aim is to develop a dialogue system which can interact with the user in Estonian following the norms and rules of human-human communication
Direktiivsed aktipaarid eestikeelsetes infodialoogides ja nende automaatne tuvastamine
Analüüsitakse eestikeelseid telefonikõnesid ametiasutustesse, eesmärgiga arendada intelligentset kasutajaliidest, mis võimaldaks suhelda andmebaasidega eesti keeles. Analüüs põhineb Tartu Ülikooli eesti dialoogikorpusel. Käesolevas artiklis keskendutakse dialoogiaktide direktiivsetele naabruspaaridele, mille esiliikme ütleb ametiasutusse helistav klient ja järelliikme ametnik, näiteks klient avaldab infosoovi ja ametnik vastab info andmisega. Kliendi esimene sooviavaldus püstitab eesmärgi, mille saavutamiseks teevad klient ja ametnik koostööd. Mõlemad osalejad võivad algatada alamdialooge, et täpsustada kas soovi või saadud vastust. Artiklis analüüsitakse direktiivsete aktipaaride keelelisi tunnuseid ja tutvustatakse eestikeelsetes dialoogides dialoogiaktide automaatse tuvastamise eksperimente.DOI: http://dx.doi.org/10.5128/ERYa6.05</p
Suulise eesti keele korpus ja inimese suhtlus arvutiga
<p><span>Tartu Ülikoolis kogutakse suulise eesti keele korpust ja (selle alamosana) dialoogikorpust, et uurida inimestevahelist suhtlust. Kaugem eesmärk on luua kasutajaliideseid, mis võimaldaksid inim- kõne vahendusel suhelda elektrooniliste andmebaasidega. Suhtluse modelleerimine on edukam, kui selle aluseks võetud inimsuhtluse uurimine tehakse suurel eri allkeeli sisaldaval korpusel ning viiakse läbi nii kvantitatiivne kui ka kvalitatiivne analüüs. Artikkel tutvustab Tartu Ülikooli suulise eesti keele korpuse ehitust, transkribeerimise põhimõtteid ja dialoogiaktide annoteerimiseks kasutatavat tüpoloogiat. Rakendusena vaadeldakse ametlikes telefonikõnedes esinevate päringute keelevaliku seletusi.</span></p><p>DOI: http://dx.doi.org/10.5128/ERYa5.07</p