3 research outputs found

    Korpusavusteinen virheanalyysi tarkkuuden kehityksestä EVK:n taitotasoilla A2–B2

    Get PDF
    Tiivistelmä Artikkelissa tarkastellaan kielitaidon taitotasoittaista kehittymistä potentiaalisten esiintymien analyysin (Potential Occasion Analysis, Thewissen, 2015) avulla. Kehittymistä analysoidaan tarkkuuden näkökulmasta, ja sitä mitataan kohdekielen muoto- ja käyttökonventioista poikkeavien muotojen määrällä. Tutkimus on korpuspohjaista virheanalyysia (Corpus-aided Error Analysis, Dagneaux, Dennes & Granger, 1998), ja se perustuu taitotasoilla havaittujen, yhdeksään virheluokkaan sijoittuvien virheiden määrien tilastolliseen testaukseen. Aineistona on Kansainvälinen oppijansuomen korpus (ICLFI). Analyysi osoittaa, että merkittävintä kehitys on tasojen B1 ja B2 välillä; tasojen A2 ja B1 välillä tarkkuuden kehityksessä on nähtävissä myös regressiota (esim. määrite- ja fraseologiset virheet) ja stabilaatiota, jota esiintyy erityisesti morfosyntaktisissa ja syntaktisissa virhetyypeissä. Tasojen B1 ja B2 välillä muutos on kuitenkin niin selvää, että erityisesti morfosyntaktisen ja syntaktisen tarkkuuden lisääntymisen voisi nostaa yhdeksi tasoa B2 määrittäväksi piirteeksi. Jo aiemmissa tutkimuksissa taso B1 on nähty selvänä kulminaatiopisteenä kielen kehityksessä (ks. esim. Kajander, 2013, s. 93–95; Seilonen, 2013, s. 59–61; ks. myös Thewissen, 2015), ja tämän tutkimuksen valossa näin on myös tarkkuuden kehityksessä.Abstract In this article, the development of an individual’s language proficiency, based here on the language levels of Common European Framework for Reference, is examined with the help of Potential Occasion Analysis (Thewissen, 2015). The development is analyzed from the viewpoint of accuracy, and it is measured by the amount of forms that differ from the conventions of form and usage in the target language. The research represents corpus-aided error analysis (Dagneaux et al., 1998), and it is based on the statistical testing of the amount of errors seen in the nine categories of errors found in the reference levels of language proficiency. The research material consists of the International Corpus of Learner Finnish (ICLFI). The analysis shows that the most remarkable progress happens between levels B1 and B2. In addition, in the progress between levels A2 and B1, there is regression in the form of, for example, errors in adjuncts and phraseolog y as well as stabilization, which can especially be seen in morphosyntactic and syntactic errors. However, the change between B1 and B2 is so distinct that the increase in morphosyntactic and syntactic accuracy could be made one of the defining aspects of level B2. Earlier studies have indicated level B1 as a distinct culmination point in the development of language (see e.g. Kajander, 2013, p. 93–95; Seilonen, 2013, p. 59–61; Thewissen, 2015), and on the basis of this study’s results, this is also the case for the development of language accuracy

    KUINKA MAHOTTOMASTI NÄÄ TEKKIIT:juhlakirja Harri Mantilan 60-vuotispäivän kunniaksi

    No full text
    Esipuhe Harri Mantila on poikkeuksellinen professori. Näyttää siltä, että kaikessa, mihin Harri ryhtyy, hän myös onnistuu. Harri on poikkeuksellisen taitava opettaja ja esiintyjä, hallintotyötäkään pelkäämätön esimies ja tiedekunnan koulutusdekaani sekä hämmästyttävän oivaltava ja ahkera tutkija. Kaiken lisäksi Harri on mitä verrattomin kollega, jonka 60-vuotispäivää tämä käsillä oleva artikkelikokoelma juhlistaa. Kokoelma koostuu tavalla tai toisella Harrin tieteelliseen uraan liittyneiden kollegoiden artikkeleista. Teoksen sivuilla käsitellyiksi tulevat Harria kiinnostaneet ja kiinnostavat kielentutkimuksen alat, kuten dialektologia, sosiolingvistiikka, vähemmistökielet, kielipolitiikka, tekstintutkimus sekä suomen ja unkarin välinen sukukieliyhteys. Harrin lapsuuden elinpiirissä Parkanossa puhuttiin useita eri kielimuotoja, mistä juontaa juurensa hänen kiinnostuksensa murteisiin ja kielen variaatioon sekä lopulta hakeutuminen suomen kielen opintojen pariinkin vuonna 1979. Kollegat ja Harrin lukuisat oppilaat ovat saaneet kuulla suuren määrän elämänmakuisia anekdootteja Parkanon kieliyhteisöstä. Harri itse kuvaa lapsuutensa kielimaiseman vaikutusta näin: ”Jostakin syystä ne sukukieletkin murtautuivat tajuntaan jo aika varhain. Kyllä ne murteet ja sukukielet olivat niitä, jotka siinä suomen kielessä kiinnostivat kovasti.” Perheen perustaminen kuhmolaisen Meeri Haverisen kanssa toi Harrin kontaktiin kainuulaisten murteiden kanssa, ja elämän ja uran järjestyminen Oulussa puolestaan mahdollisti Harrille pohjoispohjalaisten murteiden seuraamisen ja tutkimisen. Tämän taustan pohjalta tuoreen taatan on varmasti kiinnostavaa seurata, miten pojantyttären Ellin idiolekti kehittyy. Harri aloitti työskentelyn Oulun yliopiston suomen kielen oppiaineessa vuonna 1983. Uransa aikana hän on ehtinyt toimia amanuenssina, assistenttina, yliassistenttina, lehtorina, apulaisprofessorina sekä professorina. Monenlaiset hallinnolliset tehtävät ovat myös pitäneet miehen kiireisenä kaikkina näinä vuosina. Mainittakoon merkittävimpinä hallinnollisina työtehtävinä varadekaanin ja koulutusdekaanin pestit, joita Harri on hoitanut vuosina 1997–1999 ja vuodesta 2014. Harrin kokonaisvaltaisista organisaatiokyvyistä ja taidosta hallita joukkoja olemme saaneet nauttia humanistisen tiedekunnan suuren muuton aikana. Parisatapäinen tutkijajoukko muutti kampusalueella toisiin tiloihin elokuussa 2018, ja Harri sai tehtäväkseen toimia muuttokenraalina. Muuton pitkällisten valmistelujen ja Harrin suunnitelmallisuuden ansiosta muutto onnistui hallitusti ja järjestelmällisesti. Väitöskirjansa Harri kirjoitti peräpohjalaisista murteista ja ennen kaikkea h:sta. Kirjan korkean tieteellisen tason lisäksi se muistetaan otsikosta Ei tääläkhän senthän jokhaishen sanhan hootakhan panna, mikä kuvastaa Harrin joviaalia luonnetta. Oulun murteen tutkimuksesta muotoutui Harrin myöhemmälle uralle keskeinen teema. Harrin magnum opus, jonka hän kirjoitti yhteistyössä Matti Pääkkösen kanssa, sai nimekseen Oulun seudun murteen vokaalisto. Historia, muutos ja variaatio. Tuntemuksensa suomen murteista ja kielen variaatiosta Harri on välittänyt myös niille sadoille opinnäytteiden tekijöille, joiden tutkielmia Harri on ohjannut. Harri opiskelijoineen on ollut tuttu näky myös puhutun suomen tutkijoiden valtakunnallisissa Miten suomi puhuu -seminaareissa. Viimeaikaisimpia tutkimusintressejä ovat olleet tekkiin-tyyppiset imperfektit ja nää-pronominin käyttö. Harrin pitkäaikainen haave – kokoomateos Oulun seudun kielitilanteesta – on juuri hyväksytty SKS:n julkaisusarjaan, ja se ilmestyy vuonna 2019. Lukuvuoden 1986‒1987 Harri työskenteli UKANin lähettämänä suomen kielen ja kulttuurin vierailevana lehtorina Unkarissa Debrecenin yliopistossa. Tämä vuosi oli merkittävä Harrin uran kannalta, sillä tuona aikana syntyi hänen kiinnostuksensa myös suomen ja unkarin kontrastiivista tutkimusta kohtaan. Tämän aihepiirin tuloksia Harri on esitellyt muun muassa monografiassaan Suomen ja unkarin nominaalisten verbimuotojen kontrastiivista syntaksia ja semantiikkaa. Unkarissa viettämänsä vuoden aikana Harri myös solmi lukuisia tutkimus- ja opetuskontakteja unkarilaisiin kollegoihinsa, ja tämä yhteys on kestänyt näihin päiviin saakka. Samoin on säilynyt myös rakkaus unkarin kieleen. Vuonna 1998 Harri siirtyi suomen kielen lautakunnan jäseneksi. Lautakunnan jäsenyyttä kesti kaikkiaan 12 vuotta, ja siitä yhdeksän vuoden ajan Harri toimi kielilautakunnan puheenjohtajana. Voidaan sanoa, että Harrin vaikutus suomalaiselle kielenhuollolle on ollut merkittävä. Harri linjasi puheenjohtajakautenaan, että kielenkäyttöä on ohjattava vuorovaikutteiseen, demokraattiseen ja kielen kansallista käyttökelpoisuutta vahvistavaan suuntaan. Toimiessaan suomen kielen lautakunnassa Harrin tutkimusintressit laajenivat kielen variaation alalta kielipolitiikan ja kielensuunnittelun puolelle. Tästä oli myöhemmin paljon hyötyä, kun Harri oli mukana pohjoisia vähemmistökieliä tutkivissa hankkeissa. Näissä arvostettiin Harrin näkemyksiä ja teoreettista osaamista vähemmistökielten standardisaatioon liittyvissä kysymyksissä. Harrin ura fennistinä, fennougristina, verkostoitujana ja hallinnoijana huipentui 12. kansainvälisen fennougristikongressin presidenttiyteen Oulussa elokuussa 2015. Kongressissa oli 425 osallistujaa 21 eri maasta. Kongressin lämmin ilmapiiri, korkea tieteellinen taso sekä mieleenpainuva oheisohjelma säilyvät kaikkien asianosaisten mielissä pitkään. Oululaisten suomen kielen opiskelijoiden keskuudessa Harri on kuuluisa innostavista ja vauhdikkaista luennoistaan. Hän elävöitti luentojaan ja aktivoi opiskelijoitaan jo 1980-luvulla, jolloin perinteinen opettajajohtoinen luennointi oli vielä yleistä. Eräänkin hänen entisen suomen oppilaansa opiskelu sai ensimmäisen Harrin luennon jälkeen uuden suunnan. Edellisen illan opiskelijajuhlien jälkeinen yritys paeta aamuluennolla takariviin ei auttanut: koska Harrilla on ilmiömäinen nimimuisti, hän poimi nimeltä mainiten takarivin opiskelijan analysoimaan taululle kirjoitettua rakennetta. Harrin kursseilla keskustellaan ja osallistutaan. Onneksi Harrin elämään on kuulunut kaikkien näiden vuosien aikana myös paljon muutakin kuin työ. Monet kerrat olemme saaneet nauttia Mantilan perheen vieraanvaraisuudesta heidän kodissaan. Harrin monista harrastuksista mainittakoon puutarhanhoito ja lavatanssit. Ovatpa kollegat päässeet myös Harrin tanssioppiin, milloin polkan, milloin jiven askelia opiskelemaan. Välillä elämä on ollut työpaikankin käytävällä yhtä tanssia. Tämän juhlakirjan avulla haluamme onnitella pitkäaikaista esimiestämme ja mainiota kollegaamme hänen täyttäessään 60 vuotta ja toivottaa hänelle kaikkea hyvää tulevaisuudessa. ToimittajatSisällys Esipuhe Sisällysluettelo Meänkieli ja -h- Tornion murteesta meänkieleen. Reaaliaikainen tutkimus Ruotsin Ylitorniolta 1966–1992 Heikki Paunonen Sosiolingvistiikka Savolaismurteiden muuttuva morfosyntaksi: seuruukohteena neljän sukupolven perhe Marjatta Palander Diftonginreduktio Rantsilassa 2000-luvun kynnyksellä Elina Palola Sydämellisiä kirjeitä talvisodasta. Hämäläisten sotilaiden kiitoskirjeet aikansa kielen ja kirjeenvaihtokulttuurin heijastajina Liisa Mustanoja Stadi imitoituna Johanna Vaattovaara, Niina Kunnas & Maija Saviniemi Tavallisuus puhekielessä. Keski- ja pohjoispohjalaisten puhekieltä koskevia kielikäsityksiä Tommi Kurki Teksti ja politiikka Tekstilajin normit kypsyysnäytteen arvioinnissa: fokuksessa tiivistelmän aikamuodot Anne Mäntynen Variaationtutkimus ja kielenhuolto Pirkko Nuolijärvi Elämää kielimaisemassa: kirjat yliopistolaisten julkaisuina Pirjo Hiidenmaa Somen setämies: määrästä ja merkityksistä Vesa Heikkinen Vähemmistöyhteisöt Henkilönnimien variaatiosta kolmikielisessä Raisin kunnassa Anna-Riitta Lindgren Lantalaisia Suomesta ja suomalaisia Lannasta – vai kuinka se entiseen aikaan menikään? Kirjalliset lähteet kertovat Eira Söderholm Unkari-yhteydet Finn bűnügyek magyar kontextusban, avagy egyes fordítói kihívások krimik fordítása során Edit G. Bogár A Kárpát-medencében élő magyar közösségek helyzete Enikő Molnár Bodrogi Epilogi Heittiö, lurjus, hiippari, kanalja – senkin häpeämätön satiiri, kukko, obseeni, roikale! Harri Mantila suomalaisen kioskikirjallisuustutkimuksen uranuurtajanalkuna Veli-Pekka Lehtol

    Proceedings of the Research data and humanities (RDHUM) 2019 conference:data, methods and tools

    No full text
    Preface RDHum 2019, the Research Data and Humanities Conference, takes place August 14–16, 2019 at the University of Oulu, Finland. RDHum 2019 is jointly organised by the University of Oulu and the University of Jyväskylä, in collaboration with FIN-CLARIN and The Language Bank of Finland. The event is the first in the series of conferences taking place biennially in one of the universities within the FIN-CLARIN Consortium. The first RDHum Conference is hosted by the University of Oulu, where the Oulu Corpus, a comprehensive and widely used digital research resource at the time, was collected and compiled in a project led by professor Pauli Saukkonen 50 years ago. Digital resources and technology are used more and more within the humanities and the social sciences. Researchers in digital humanities gather, administer, share and study rapidly accumulating digital resources. They also need various research methods and tools in analysing these resources. The conference Research Data and Humanities gathers researchers around these themes, and the scientific program of the Conference includes numerous topics related to digital data, digital methods and analysis in the Humanities. In this first Conference, the subjects of the presentations, posters and workshops come from several disciplines, such as linguistics, literary studies, computer science and information science. Thus the languages and societal phenomena under study, data and methods vary widely in the conference. The peer reviewed articles published in these proceedings are grouped into three categories according to their main focus: data, methods and tools. New data and corpora are presented in the following papers: Kurki et al. present Digilang, a joint venture to combine six different digital corpora. The corpora represent different kinds of data in various modalities. Ijaz seeks to determine editions analytically from bibliographic metadata. Lahti et al. describe the use of bibliograpghic data science in the study of bibliographic metadata collections. Pääkkönen presents challenges the end-user face with digital presentation systems and discusses the issues relating to metadata. Salonen et al. describe the collection and process of establishing the Corpus of Finlands Sign Language. They a lso discuss the storage, metadata and publication of the corpus. Jauhiainen presents Wanca in Korp, a sentence corpus for under-resourced Uralic languages and the process how the corpus was collected. New methods for digital humanities are presented in the following papers: Laippala in her paper discusses how to classify texts collected from the internet by means of automatic identification. Ryynänen and Hyyryläinen analyze the concept of Digital Humanities and propose a concept of “practical digital humanities” for describing research utilising a humanist approach to practical problem solving with digital technology development in the digital humanities context. Mikhailov compares texts by their frequency lists. He uses two different types of frequency word lists, unlemmatized and lemmatized, to conduct an experiment with. He observes the different outcomes of the two lists in the experiment. Ivaska presents an analysis of machine learning to identifying translated and non-translated Finnish texts and how to identify the source language of the translated text. Drobac and Linden discuss the issues relating to optical character recognition (OCR) in historical newspaper and journal text and assert that font families need to be recognized. They present an experiment relating to recognizing text in two different fonts. Cohrs and Petersen propose experimental methods of guessing a persons political party based on his tweets. Ijaz presents possibilities of analytical determination of editions from bibliographic metadata. Pääkkönen, Kettunen and Kervinen discuss findings made from user observations in searching digitized serial publications The following papers introduce new tools in digital humanities: Kettunen presents an analysis of semantic annotation of texts in the context of other automated tools for analyzing languages. He introduces a new tool, FiST, that has been developed to annotate semantically texts in Finnish. Huttunen describes digital games in reinforcing linguistic and socioemotional skills of children with communicative disabilities. She describes the properties of two versions of the game Tunne-etsivät and collection of research data from the users of the game. We gratefully acknowledge the financial and technical support from The Federation of Finnish Learned Societies, FIN-CLARIN consortium, The Language Bank of Finland, and the Universities of Oulu and Jyväskylä, and the city of Oulu, which made this event possible. We would also like to thank all the members of the FIN-CLARIN steering group, the members scientific and organising committees and the local students in the University of Oulu who encouraged to organize this event and worked hard to make this conference a reality. Finally we wish to thank all reviewers for their work and the Faculty of Humanities for agreeing to publish proceedings in Studia Humaniora Ouluensia. Jarmo Harri Jantunen (chair), Sisko Brunni, Niina Kunnas, Santeri Palviainen and Katja VästiTable of contents Preface Table of contents I Data Analytical determination of editions from bibliographic metadata. Ali Zeeshan Ijaz, Mikko Tolonen, Leo Lahti and Iiro Tiihonen Wanca in Korp: Text corpora for underresourced Uralic languages. Heidi Jauhiainen, Tommi Jauhiainen and Krister Lindén Digilang – Turun yliopiston digitaalisia kieliaineistoja kehittämässä. Tommi Kurki, Nobufumi Inaba, Annekatrin Kaivapalu, Maarit Koponen, Veronika Laippala, Christophe Leblay, Jorma Luutonen, Maarit Mutta, Markku Nikulin ja Elisa Reunanen Best Practices in Bibliographic Data Science. Leo Lahti, Ville Vaara, Jani Marjanen and Mikko Tolonen Digital heritage presentation system development + new material types: early findings. Tuula Pääkkönen Suomen viittomakielten korpusta rakentamassa. Juhana Salonen, Anna Puupponen, Ritva Takkinen ja Tommi Jantunen II Methods Guessing a tweet author’s political party using weighted n-gram models. Enum Cohrs and Wiebke Petersen Optical font family recognition using a neural network. Senka Drobac and Krister Lindén Distinguishing translations from non-translations and identifying (in)direct translations’ source languages. Laura Ivaska From bits and numbers to explanations – doing research on Internet-based big data. Veronika Laippala The Extent of Similarity: comparing texts by their frequency lists. Mikhail Mikhailov Search options used in digitized serial publications – observational user data and future challenges. Tuula Pääkkönen, Kimmo Kettunen and Jukka Kervinen Border crossing and trespassing? Expanding digital humanities research to developing peripheries with the novel digital technologies. Toni Ryynänen and Torsti Hyyryläinen III Tools Tutkimusaineiston kerääminen ja analysointi monipuolisia digitaalisia keinoja hyödyntäen. Esimerkkinä Tunne-etsivät-tutkimushankekokonaisuus. Kerttu Huttunen Kirjoitetun nykysuomen automaattisesta semanttisesta merkitsemisestä. Kimmo Kettune
    corecore