23 research outputs found
Meaning in Distributions : A Study on Computational Methods in Lexical Semantics
This study investigates the connection between lexical items' distributions and their meanings from the perspective of computational distributional operations. When applying computational methods in meaning-related research, it is customary to refer to the so-called distributional hypothesis, according to which differences in distributions and meanings are mutually correlated. However, making use of such a hypothesis requires critical explication of the concept of distribution and plausible arguments for why any particular distributional structure is connected to a particular meaning-related phenomenon.
In broad strokes, the present study seeks to chart the major differences in how the concept of distribution is conceived in structuralist/autonomous and usage-based/functionalist theoretical families of contemporary linguistics. The two theoretical positions on distributions are studied for identifying how meanings could enter as enabling or constraining factors in them.
The empirical part of the study comprises two case studies. In the first one, three pairs of antonymical adjectives (köyhä/rikas, sairas/terve and vanha/nuori) are studied distributionally. Very narrow bag-of-word vector representations of distributions show how the dimensions on which relevant distributional similarities are based already conflate unexpected and varied range of linguistic phenomena, spanning from syntax-oriented conceptual constrainment to connotations, pragmatic patterns and affectivity. Thus, the results simultaneously corroborate the distributional hypothesis and challenge its over-generalized, uncritical applicability. For the study of meaning, distributional and semantic spaces cannot be treated as analogous by default.
In the second case study, a distributional operation is purposefully built for answering a research question related to historical development of Finnish social law terminology in the period of 1860–1910. Using a method based on interlinked collocation networks, the study shows how the term vaivainen (‘pauper, beggar, measly’) receded from the prestigious legal and administrative registers during the studied period. Corroborating some of the findings of the previous parts of this dissertation, the case study shows how structures found in distributional representations cannot be satisfactorily explained without relying on semantic, pragmatic and discoursal interpretations. The analysis leads to confirming the timeline of the studied word use in the given register. It also shows how the distributional methods based on networked patterns of co-occurrence highlight incomparable structures of very different nature and skew towards frequent occurrence types prevalent in the data.Nykyaikaiset laskennalliset menetelmät suorittavat suurista tekstiaineistoista koottujen tilastollisten mallien avulla lähes virheettömästi monia sanojen merkitysten ymmärtämistä edellyttäviä tehtäviä. Kielitieteellisen metodologian kannalta onkin kiinnostavaa, miten tällaiset menetelmät sopivat kiellisten rakenteiden merkitysten lingvistiseen tutkimukseen. Tämä väitöstutkimus lähestyy kysymystä sanasemantiikan näkökulmasta ja pyrkii sekä teoreettisesti että empiirisesti kuvaamaan minkälaisia merkityksen lajeja pelkkiin sanojen sekvensseihin perustuvat laskennalliset menetelmät kykenevät tavoittamaan.
Väitöstutkimus koostuu kahdesta osatutkimuksesta, joista ensimmäisessä tutkitaan kolmea vastakohtaista adjektiiviparia Suomi24-aineistosta kootun vektoriavaruusmallin avulla. Tulokset osoittavat, miten jo hyvin rajatut sekvenssiympäristöt sisältävät informaatiota käsitteellisten merkitysten lisäksi myös muun muassa niiden konnotaatioista ja affektiivisuudesta. Sekvenssiympäristön tuottama kuva merkityksestä on kuitenkin kattavuudeltaan ennalta-arvaamaton ja ne kielekäyttötavat, jotka tutkimusaineistossa ovat yleisiä vaikuttavat selvästi siihen mitä merkityksen piirteitä tulee näkyviin.
Toisessa osatutkimuksessa jäljitetään erään sosiaalioikeudellisen termin, vaivaisen, historiaa 1800-luvun loppupuolella Kansalliskirjaston historiallisesta digitaalisesta sanomalehtikokoelmasta. Myötäesiintymäverkostojen avulla pyritään selvittämään miten se katosi oikeuskielestä tunnistamalla aineistosta hallinnollis-juridista rekisteriä vastaava rakenne ja seuraamalla vaivaisen asemaa siinä. Menetelmänä käytetyt myötäesiintymäverkostot eivät kuitenkaan edusta puhtaasti mitään tiettyä rekisteriä, vaan sekoittavat itseensä piirteitä erilaisista kategorioista, joilla kielen käyttöä on esimerkiksi tekstintutkimuksessa kuvattu. Tiheimmät verkostot muodostuvat rekisterien, genrejen, tekstityyppien ja sanastollisen koheesion yhteisvaikutuksesta. Osatutkimuksen tulokset antavat viitteitä siitä, että tämä on yleinen piirre monissa samankaltaisissa menetelmissä, mukaan lukien yleiset aihemallit
Studying the Historical Semantics of Finnishness with a Bigram Approach
Publisher Copyright: © 2022 Copyright for this paper by its authors. Use permitted under Creative Commons License Attribution 4.0 International (CC BY 4.0)Our paper analyzes the historical understanding of Finland and Finnishness as it was expressed in newspapers published in the late eighteenth century and the early nineteenth century. As the period saw the decimation of the Swedish Kingdom and establishment of the Grand Duchy of Finland within the Russian Empire, a change in language use can be expected, but the changes occurring are rather fine-grained and difficult to detect without a systematic and transparent charting of the data. This paper suggests a method based on the analysis of bigrams to study this type of semantic change. Many existing methods are designed to navigate massive amounts of linguistic data and do well in solving computational tasks, but are not always a good match for the kind of historiographical questions such as ours. More broadly, we establish that the application of Finnish can in principle refer to the categories of language, geography, nationhood, statehood, and territoriality. Our analysis shows that especially the categories of language and state underwent a gradual shift in the period from the eighteenth to the nineteenth century.Peer reviewe
The semantic turn and formation of meaning of the Finnish word maaseutu (rural)
Olemme tutkineet sanan maaseutu merkitysten muotoutumista kielen muutoksena. Analyysin aineistona olemme käyttäneet digitalisoituja suomenkielisiä sanomalehtiä 1840–1950 väliseltä ajalta. Tuloksena esitämme, että maaseutu-sanan kehityksessä tapahtui kahdessa vaiheessa 1860–1910 -luvuilla merkittävä muutos, jonka seurauksena sen yleisimmäksi merkitykseksi vakiintui kollektiivinen ja abstrakti MAASEUTU-käsite. Nykysuomessa maaseutu ymmärretäänkin lähinnä sanan kaupunki kollektiivisen tai geneerisen, lajiin tai entiteettityyppiin yleistävästi kohdistuvan viittauksen vastakohtana: maaseutu on jotain, jota kaupunki hyvin yleisellä tasolla ymmärrettynä ei ole. Tämä käsitteellinen jäsennys yleistyi Suomessa kuitenkin vasta 1800-luvun lopulla ja liittyi ajan yhteiskunnan jännitteiseen kehitykseen ja sitä koskeviin keskusteluihin. Uudella MAASEUTU-käsitteellä oli vuosisadan vaihteessa kysyntää ja se otettiin aktiivisesti myös poliittiseen käyttöön. Analyysimme osoittaa, että usein pysyviksi ja staattisiksi koetut käsitteelliset rakenteet ovat eläviä ja kulttuurisesti muotoutuvia. Esimerkiksi poliittiseen kielenkäyttöömme vakiintuneet käsitteet ovat abstraktioita, jotka muotoutuvat historiallisessa kontekstissa. Käsitteiden saatua kollektiivisesti jaetun sisällön niitä voidaan käyttää politiikassa ja julkisessa debatoinnissa – maaseutu on tästä erinomainen esimerkki.In their article The semantic turn and formation of meaning of the Finnish word maaseutu (rural) linguist Antti Kanner and human geographer Torsti Hyyryläinen analyze how the Finnish word maaseutu (‘rural, countryside’) became established in the written Finnish and how its semantics have changed during this process. The dataset for the study consists of Finnish newspapers from the 1840s to the 1950s (412 548 newspaper issues - all available in the digital archive of the Finnish National Library). The article shows that a semantic turn that took place between 1850–1910, changing the meaning of maaseutu: it became detached from the individual localities and regions and began to denote a unified and abstract countryside. As the singular form (maaseutu) became predominant, the plural (maaseudut) became increasingly rare. As such, the word maaseutu now refers to all regions and places which are outside cities and opposite to them and which can contextually be characterised as rural in contrast to urban. This linguistic process took place as a part of a historical context in which maaseutu was found useful in political debates in Finland.Peer reviewe
Maaseudun diskursiivinen käänne - maaseutu sanan muotoutuminen abstraktiksi kategoriaksi 1870-luvulla
Tarkastelemme maaseutu-sanan konstruoitumista suomenkielisessä sanomalehtiaineistossa 1840-luvulta eteenpäin. Tutkimus perustuu sanomalehtidiskurssien kielitieteelliseen analyysiin. Esitämme tulkinnan merkittävästä diskursiivisesta käänteestä, joka ajoittuu 1870-luvulle. Siinä maaseutu sana muotoutui viittaamaan yksilöllisistä ja paikallisista alueista homogeeniseksi ja abstraktiksi kollektiivikäsitteeksi, joka samalla avautui monenlaisille uusille määrittelyille ja merkityksenannoille. Nähdäksemme tämä käsitteellinen käänne on kaupungin ja maaseudun suhteen ymmärtämisen ja tulkinnan kannalta keskeinen. Aineistona käytämme Kansalliskirjaston digitalisoimaa sanomalehtiaineistoa, jossa ovat kaikki Suomessa 1770–1910 ilmestyneet sanomalehdet. Analyysin kohteena ovat suomenkieliset sanomalehdet, jotka alkoivat ilmestyä 1820-luvulla. Tämä aineisto kattaa kaikkiaan 471 996 yksittäistä lehden numeroa sisältäen noin 5 miljardia yksittäistä sanaa. Tarkastelu kohdistuu erityisesti maaseutu sanaan, joka esiintyy eri muodoissaan tässä aineistossa kaikkiaan noin 380 000 kertaa. Analyysin tuloksena voidaan esittää muun muassa, että suomen kielessä sanan maaseutu merkityksessä tapahtuu 1870–80 käänne, jonka seurauksena sanalle annettu merkityssisältö muuttuu. Maaseutu sana alkaa kehittyä erilaiseksi kategoriaksi, joka toisaalta irtautuu yksittäisistä paikallisuuksista ja rakentaa merkitystä yhtenäisestä (homogeenisesta) maaseudusta, alueesta, johon voidaan viitata yksinkertaisemmin ja kategorisemmin, yhtenä kokonaisuutena. Samalla havaitaan mielenkiintoinen muutos, joka liittyy edellä kuvattuun homogenisoitumiseen: käsitteellisen muutoksen kärjessä vaikuttavat olevan alueelliset lehdet, jotka näin konstruoivat oman roolinsa suhteessa valtakunnalliseen julkiseen keskusteluun. Maaseutu-sana abstrahoituu ja muuttuu abstraktiksi kategoriaksi, jonka täsmällistä kuvaamista ei enää pidetä tarpeellisena. Tässä yhteydessä maaseutu sana viittaakin yleisesti kaikkiin alueisiin, jotka ovat kaupunkien ulkopuolella. Tämä maaseutu-sanan merkityksen diskursiivinen käänne 1870–80 luvuilla on hyvin merkittävä maaseudun ja kaupungin suhteiden käsitteellisen jäsentymisen kannalta.Non peer reviewe
A National Public Sphere? Analysing the Language, Location and Form of Newspapers in Finland, 1771–1917
Peer reviewe
Emotive, evaluative, epistemic : a linguistic analysis of affectivity in news journalism
In this article, we introduce a linguistic approach to studying affectivity as a fundamental feature of news journalism. By reconceptualising affectivity beyond emotive storytelling, intentional stance-taking or evaluative expression, we propose a methodology that highlights how conventions related to mediating, modulating and managing affectivity permeate journalistic genres. Drawing from conversation analysis (Goffman, 1961), Bakhtinian theory of language as dialogical (Volosinov, 1995) and Wetherell’s (2012) notion of affective meaning-making, we investigate how selected linguistic forms and structures – namely evidential and epistemic modals and lexical items signalling affective intensity (such as emotive and evaluative words and metaphorical expressions) – participate in affective meaning-making in news journalism. A scalable computational methodology is introduced to study multiple linguistic structures in conjunction. In investigating a case study – the news reporting and commentary on a highly charged, year-long political conflict between the right-wing conservative government and the trade unions in Finland (2015–2016) – the approach allows a focus on the ways in which affectivity operates in journalistic texts in response to both generic expectations of the audience and journalistic conventions. Our findings include identification of the intertwining of strategic rituals of objectivity and emotionality (Tuchman 1972, Wahl-Jorgensen 1993a, 1993b), recognition of metaphoricity as a key source of affectivity and detection of different news article types having their own conventions for managing affectivity. We also observe a connection between emotive and evaluative words and the grammatical constructions used to express degrees of certainty, which suggests these modal constructions play an important part in how affectivity informs journalistic texts.</p