2,643 research outputs found

    Using corpora to track changing thought styles: evidentiality, epistemology, and Early Modern English and German scientific discourse

    Get PDF
    Most research on evidentiality has focused on classifying evidential systems synchronically; meanwhile, diachronic studies on evidentiality seem to have focused on the development of specific items into evidential markers with little regard to discourse context. This paper begins to fill this gap by presenting the results of a corpus-based study of evidential markers in Early Modern scientific discourse in English and German. The Early Modern period witnessed the transition from scholastic-based models of science to more empirical models of enquiry; this study demonstrates a decrease in the use of markers of mediated information and an increase in the use of markers of direct observation and inference accompanying these sociohistorical developments

    Polilingvali Vilniaus jaunimo raiška: socialinės tapatybės paieškos

    Get PDF
    The paper raises the problem of polilingual behaviour of Vilnius teenagers. The aim of this study is to reveal the frequency of linguistic features in the language of Vilnius teenagers of two age groups (13—14 and 15—17) as well as identify reasons for the informants’ polylingual behaviour. Extracts of spontaneous interactions from the corpus of the language of Vilnius youth have been chosen for the analysis. The results of the quantitative analysis have revealed that the elderly informants’ and younger boys’ polylingual behaviour is characterised by frequent, repetitive Russian features and nonrecurrent occurences of English features. The predominant use of English features in younger girls’ speech may imply that they have not yet mastered the Russian slang as well as point to their positive attitudes towards the English language. Within the framework of interactional sociolinguistics, the analysis of younger informants’ speech has revealed a link between English, German, Polish features and language play. Differently from the elderly teenagers, younger teenagers tend to change identities, e.g. an experienced player, an expert at love affairs, an adult who can evaluate youth language, via the play with English items. Russian items, which make a major part of slang in elderly teenagers’ speech, are used for sociopsychological purposes, as a means to display peer group identity. The study has revealed a varied polylingual production of Vilnius teenagers, which serves as a means of negotiating the social identity of a peer group member, creative and innovative teenager.Straipsnyje keliama iki šiol Lietuvoje nenagrinėta jaunimo polilingvalaus elgesio problema. Tyrimo duomenis sudaro Vilniaus paauglių kalbos tekstynas, sukauptas renkant savanorių informantų įrašus ir atliekant etnografinius stebėjimus. Darbo tikslas – palyginti kitų kalbų elementų vartojimo dažnumą ir funkcijas jaunesniųjų (13–14 m.) ir vyresniųjų (15–17 m.) moksleivių kalboje. Be to, remiantis pokalbių analizės metodu, norima ištirti, kokius vaidmenis Vilniaus jaunuoliai sau priskiria ir kokias socialines tapatybes kuria, pasitelkdami polilingvalią raišką

    Autoriaus pozicijos adverbialai ir adverbializacija lietuvių mokslo kalboje

    Get PDF
    The purpose of the paper is to demonstrate the necessity of distinguishing a semantic-functional class of stance adverbials in Lithuanian. Following Biber et al. (1999) and Hasselgård (2010) an attempt is made to show that alongside circumstance adverbials there are also linking adverbials and stance adverbials in Lithuanian. The means of realization of stance adverbials in Lithuanian is not only adverbs but also so called modal words (galbūt‘maybe’, tikriausiai ‘most probably’), various particles (taigi ‘therefore’, visgi ‘still’, ‘nevertheless’), CTPs (manoma ‘it is believed’, natūralu ‘naturally’), various adverbial clauses (kaip matyti ‘as it is seen, as one can see’, kaip žinoma ‘as is known’) but also prepositional phrases (pasak X ‘according to X’). The article devotes much attention to the semantic classification of the basic types of stance adverbials, which has been illustrated by the language data collected from the Corpus of Academic Lithuanian (Corpus Academicum Lithuanicum – CorALit – http://coralit.lt). The paper also touches upon the process of adverbialization and its relationship to grammaticalization which presupposes the desemanticization and (inter)subjectivization of the linguistic expressions under analysis. Many Lithuanian verbal and adjectival CTPs like žinoma ‘it is known’, suprantama ‘it is understood’, tarkim ‘let’s say’ can develop into stance adverbials and further into discourse markers by losing any links to the original lexical meaning of the verb they have evolved from.Straipsnio tikslas parodyti, kodėl reikėtų ir kodėl galima būtų skirti semantinę-funkcinę adverbialų klasę lietuvių kalboje. Pastaroji nėra tapatinama su prieveiksmiais kaip tradicine kalbos dalimi gramatikoje ar aplinkybėmis kaip tradicine sakinio dalimi sintaksėje. Be to, nėra kvestionuojamas aptariamų kalbos reiškinių statusas kalbos dalių ar sakinio dalių požiūriu. Siūloma atkreipti dėmesį į kalboje objektyviai egzistuojančią straipsnyje aptariamų raiškos priemonių aiškinimo įvairovę. Jų semantinė-funkcinė charakteristika netelpa į prieveiksmių (DLKG 1996, 422-429; Valeckienė 1998, 169-170), aplinkybių (DLKG 1996, 527-553; Valeckienė 1998, 55-66) bei modifikuojamųjų dalelyčių (Valeckienė 1998, 191) reikšmių ir tipų klasifikaciją. Šios semantinės-funkcinės klasės aptarimas remiasi autoriaus pozicijos raiškos tyrimu lietuvių mokslo kalboje1. Visi kalbos duomenys surinkti iš Lietuvių mokslo kalbos tekstyno (Corpus Academicum Lithuanicum: http://coralit.lt/). Darbe trumpai apžvelgiami akademinio diskurso ypatumai ir autoriaus pozicijos vaidmuo užmezgant ir plėtojant dialogą su skaitytoju. Epizodiškai gretinami adverbialinių autoriaus pozicijos sąvokos apimties ir jos raiškos būdų ypatumai kitose kalbose. Pateikiama autoriaus pozicijos adverbialų semantinė klasifikacija ir jų raiškos priemonių įvairovė. Labai trumpai aptariama adverbializacijos proceso esmė ir jo sąsajos su gramatikalizacija bei intersubjektyvumu

    Autoriaus pozicijos švelninimas: tarpdalykiniai ir tarpkalbiniai raiškos priemonių ypatumai

    Get PDF
    Hedging is a linguistic strategy frequently employed in scientific writing to diminish the author‘s commitment to the accompanying proposition and to mitigate claims, thus presenting a proposition as a possibility or probability rather than a fact. This article describes the results of a pilot study on the frequency and variety of hedging devices in Lithuanian and English research articles in two different disciplines (linguistics and medicine). The study is limited to lexical hedges only. The results of a cross – disciplinary study demonstrate that in the field of medicine, researchers tend to hedge less and hence are much more determined in their claims than linguists in both languages. The cross – linguistic study shows that English speaking researchers seem to use significantly more hedging devices than their Li­thuanian speaking colleagues in both disciplines. The variety of hedges used in English was also wider than in Lithuanian. Most frequently used hedges in both languages in linguistic articles were adverbs, whereas in medical articles it was modal verbs

    Seimo posėdžių stenogramų tekstynas autorystės nustatymo bei autoriaus profilio sudarymo tyrimams

    Get PDF
    In our paper we present a corpus of transcribed Lithuanian parliamentary speeches. The corpus is prepared in a specific format, appropriate for different authorship identification tasks. The corpus consists of approximately 111 thousand texts (24 million words). Each text matches one parliamentary speech produced during an ordinary session from the period of 7 parliamentary terms starting on March 10, 1990 and ending on December 23, 2013. The texts are grouped into 147 categories corresponding to individual authors, therefore they can be used for authorship attribution tasks; besides, these texts are also grouped according to age, gender and political views, therefore they are also suitable for author profiling tasks. Whereas short texts complicate recognition of author speaking style and are ambiguous in relation to the style of other authors, we incorporated only texts containing not less than 100 words into the corpus. In order to make each category as comprehensive and representative as possible, we included only those authors, who produced speeches at least 200 times. All the texts are lemmatized, morphologically and syntactically annotated, tokenized into the character n-grams. The statistical information of the corpus is also available. We have also demonstrated that the created corpus can be effectively used in authorship attribution and author profiling tasks with supervised machine learning methods. The corpus structure also allows using it with unsupervised machine learning methods and can be used for creation of rule-based methods, as well as in different linguistic analyses. Straipsnyje pristatome Seimo posėdžių stenogramų tekstyną, parengtą specialiu formatu, tinkančiu įvairiems autorystės nustatymo tyrimams. Tekstyną sudaro apie 111 tūkstančių tekstų (24 milijonai žodžių), kurių kiekvienas atitinka vieną parlamentaro pasisakymą eilinės sesijos posėdžio metu bei apima 7 Lietuvos Respublikos Seimo kadencijas: nuo 1990 metų kovo 10 dienos iki 2013 metų gruodžio 23 dienos. Pasisakymų tekstai sugrupuoti pagal autorius į 147 grupes, todėl tinka individualių autorių autorystės nustatymo tyrimams; jie suskirstyti pagal autorių amžiaus grupes, lytį ar politines pažiūras, todėl tinka autorių profilio sudarymo tyrimams. Trumpas tekstas neatskleidžia jo autoriaus kalbėjimo stiliaus, yra daugiaprasmiškas kitų autorių atžvilgiu, todėl į tekstyną įtraukti ne trumpesni nei 100 žodžių tekstai. Kiekvieną autorių atitinkantis tekstų rinkinys turi būti išsamus ir reprezentatyvus, todėl įtraukti autoriai, pasisakę ne mažiau kaip 200 kartų. Visi tekstai automatiškai lemuoti, morfologiškai bei sintaksiškai anotuoti, suskaidyti simbolių n-gramomis, surinkta statistinė informacija. Straipsnyje pademonstruota, kaip sukurtas tekstynas gali būti panaudotas individualių autorių autorystės nustatymo bei autorių profilio sudarymo tyrimams, naudojant prižiūrimo mašininio mokymo metodus. Tekstyno struktūra taip pat leidžia taikyti neprižiūrimo Ligita Šarkutė Viešosios politikos ir administravimo institutas Kauno technologijos universitetas K. Donelaičio g. 20-217 LT-44239 Kaunas, Lietuva El. paštas: [email protected] 28 mašininio mokymo metodus, patogi taisyklinių-loginių metodų kūrimui bei įvairioms lingvistinėms analizėms

    Šalutiniai pažyminio sakiniai: kodėl vaikams sunku juos suprasti?

    Get PDF
    The study aims to describe and interpret the results of testing the speech of Lithuanian children in order to find out whether language-specific features of Lithuanian as a highly inflected language help children grasp the complex syntactic relations between the subject and the object in relative clauses. The investigation has been aimed to test the hypothesis to the effect that depending on the language type, object relative clauses are more difficult to acquire than subject relative clauses (Guasti, Cardinaletti 2003; Utzeri 2007; Brandt, Diessel, Tomasello 2008; O’Grady, Kim, Lee et al. 2011; Benţea 2012).The findings of the research support the hypothesis that relative clauses as objects (the OO type) are more difficult to grasp than those that function as subjects (OS). This claim has been statistically confirmed in the group of 3 – 4.5 year-olds, which had a big difficulty in perceiving the difference between relative clauses functioning as subjects or objects. These findings are in line with claims related to other languages, which demonstrate that children in early childhood, distinguishing between OS or OO, misinterpret the OO type more often (Guasti, Stavrakaki, Arosio 2008). However, when an unusual, strange situation is described, or an unfamiliar verb is used, children tend to assign the same syntactic function to the head noun and the relative pronoun; in such cases the OS clause is interpreted as the OO type. This tendency also supports the parallel-function hypothesis advanced by Tavakolian (1981). In later years children already perceive the difference between the OS and OO type relative clauses, but in a pre-school period misinterpretations of the OO type are quite numerous. Children of schooling age, on the other hand, have no difficulty in interpreting this difference correctly. The results of the present study confirm the assertion that older children grasp the functions of relative clauses and interpret complex structures more easily: they gradually realize that there are two different propositions conveyed in the main and the subordinate clause. It is assumed that children understand and start using relative clauses when their language processing skills have improved, and this happens while they are getting older.In addition to language processing skills, it is important to pay due attention to the frequency of usage principle. Our research findings show that subject relative clauses are more frequent in child-directed speech, and they also appear earlier in a spontaneous child language than object clauses; this is exactly what influences an easier perception of subject relative clauses. Semantic and pragmatic factors have to be mentioned as well: while acquiring a language, children master those grammatical structures where a particular form correlates with a particular meaning more easily (Diessel, Tomassello 2000).It might be assumed that an inflectional system of Lithuanian enables children to easier interpret the syntactic relationship between the main and the relative clause (see, e.g. Arnon 2010); however, the findings of this study allow us to claim that the structure of relative clauses is complex and multilayered, encompassing not only morphological but also semantic and pragmatic factors, which should be investigated more thoroughly in the future. It has also to be stressed that while researching child language it is important to evaluate the influence of adult language, which provides the necessary environment for the child to hear and to understand syntactic constructions of different complexity. Moreover, the assumption that a rich morphological system of a language makes it easier to grasp the complex syntactic functions of sentence elements is corroborated only in part – the findings of the study show that it takes time for Lithuanian children to master correct usage of relative clauses.Straipsnyje aprašomu tyrimu mėginama atsakyti į klausimą, ar specifinės fleksinės lietuvių kalbos ypatybės padeda vaikams lengviau suvokti sudėtingas šalutinių pažyminio sakinių konstrukcijas, išreikštas subjekto-objekto santykiais. Tyrimo metu taikant kalbos supratimo užduotį buvo testuojami 96 vaikai nuo 3 iki 12 metų. Gauti rezultatai atskleidžia, kad 3–4,5 m. amžiaus vaikams sunku suvokti skirtumą tarp šalutinių subjekto ir objekto sakinių, ypač, kai vartojamas vaikui nežinomos ar sudėtingesnės reikšmės veiksmažodis. Vėlesniame amžiuje vaikai jau suvokia skirtumą tarp subjekto ir objekto santykiais reiškiamų sakinių, tačiau priešmokykliniame amžiuje dar pasitaiko nemažai objekto sakinio interpretavimo klaidų. Tyrimas atskleidė, kad mokyklinio amžiaus vaikai jau teisingai suvokia šalutinius pažyminio sakinius ir nepainioja subjekto bei objekto reikšmės. Taigi galima teigti, kad vaikai šalutinius sakinius pradeda suprati ir vartoti tik tada, kai jų kalbos apdorojimo geba yra pakankamai patobulėjusi. Be apdorojimo procesų šalutinių sakinių įsisavinimui reikšmę turi ir vartojimu grindžiamas modelis bei dažnumo principas, semantikos ir pragmatikos veiksniai. Apibendrinant galima teigti, kad prielaida, jog turtinga fleksinė sistema palengvina sudėtingų sintaksinių santykių suvokimą, pasitvirtina tik iš dalies, nes lietuviai vaikai užtrunka įsisavinti sudėtinius pažyminio sakinius

    Gotų kalbos bevardės giminės būdvardžių galūnių kaita

    Get PDF
    This article examines the evidence of morphological variation in the inflection of neuter nominative and accusative singular adjectives as well as other modifiers in Gothic (shorter nominal vs. longer pronominal forms in -ata) in an effort to test the traditional hypothesis on the principles that underlie the variation and examine the diachronic implications of the use of -ata forms. The discussion is based on a total of 76 examples of -ata. It is shown that -ata forms are found in attributive, substantivised and predicative contexts across the modifier lexicon (including adjectives, the quantifier alls, possessive and demonstrative pronouns, participles, etc.) and prevail in attributive as well as substantivised use. From a diachronic point view, the fact that the bulk of -ata forms are more systematically attested in the quantifier alls ‘all’ (a word that has strong pronominal properties) and possessive pronouns is indicative of the strong inflection being more primary to pronouns. It is then possible to propose a scenario of reconstruction where the strong inflection has been passed on from demonstrative pronouns to prototypical adjectives through pronominal adjectives (such as possessive pronouns and the like). It is suggested that the use of -ata forms is difficult to explain semantically. Instead, the evidence of inflectional variation in identical contexts and the sporadic attestation of -ata across the modifier lexicon suggests that the pronominal form is a marked relic of older usage. The scarcity of predicative -ata forms is argued to be unexceptional; it is shown that it can be explained in terms of the statistics of case usage. This eliminates the need to explain predicative -ata forms away, and the recognition of the fact that their use in Gothic extended to all syntactic contexts typical of adjectives (and other relevant modifiers) indicates that there is no syntactically-conditioned allomorphy in the neuter nominative and accusative singular. Finally, it is suggested that the patterning of -ata forms in relation to the noun, and, in particular, the tendency for these forms to be used in post-position to the head, is indicative of the adjective inflection having been pronominalised in the Germanic proto-language, when the typical pattern of word order in the noun phrase was with modifiers being used in post-position to nouns.Straipsnyje nagrinėjama gotų kalbos būdvardžių bevardės giminės vienaskaitos vardininko ir galininko formų morfologinė kaita – trumpesniosios grynojo kamieno formos ir įvardinės galūnės -ata pakaitinė vartosena – ir siekiama nustatyti kaitos priežastis bei įvertinti jos reikšmę diachroniniu požiūriu. Nagrinėjami gotų Naujojo Testamento duomenys liudija, kad įvardinė galūnė būdinga ne vien būdvardžiams, bet ir kitiems modifikatorių tipams, ir galūnės vartosenos neveikia sintaksinė aplinka. Vadinasi, pakaitinės formos nelaikytinos sintaksiškai determinuotais alomorfais. Argumentuojama, kad paliudyta formų kaita leidžia rekonstruoti germanų kalbų stipriosios būdvardžių linksniuotės raidą, o būdvardžiai įgijo savo įvardines galūnes ne tiesiogiai iš rodomojo įvardžio paradigmos, bet per tarpinę grandį – kitus modifikatorius. Morfologinė formų kaita ir netolygaus įvardinės galūnės vartojimo paliudijimas rodo, kad -ata yra žymėta reliktinė forma, liudijanti apie įvairius modifikatorių vartojimo ypatumus germanų prokalbėje

    Lemos pateikimo ir aiškinimo ypatumai dvikalbio žodyno straipsnyje

    Get PDF
    On pourrait considérer la dernière décennie en Lituanie comme une période très active de la création lexicographique. Pourtant des aspects théoriques et des problèmes pratiques de ce processus n’étaient presque pas analysés. Les dictionnaires diffèrent surtout dans la manière dont ils disposent les contextes dans l’article. Donc notre but était d’analyser comment le lemme koja (jambe, pied) est traité dans quatre dictionnaires bilingues, parus en Lituanie en 2001–2007. Nous avons concentré notre attention sur trois aspects principaux de la microstructure des dictionnaires : 1) la présentation du lemme à la tête de l’article – c’est-à-dire, sur sa caractéristique grammaticale réelle et symbolique ; 2) les traductions ou équivalents du lemme. Comme le substantif koja est polysémique, nous avons observé comment chaque signification est définie ; quels sont des indicateurs, des abréviations qui indiquent le niveau de langue ou le champ sémantique en aidant l’utilisateur à choisir la bonne traduction; 3) les exemples, présentés sous la forme des combinaisons libres et ainsi que des combinaisons phraséologiques. Il était très important d’observer si les exemples donnés étaient vraiment informatifs et si la signification des combinaisons stables était « déchiffrée ». L’analyse de quatre dictionnaires bilingues nous a permis de constater que dans la plupart des cas l’article traitant le lemme koja est rédigé d’après les règles de la lexicographie contemporaine. Cependant nous avons mentionné quelques défauts qui nuisent à l’efficacité des dictionnaires en question. Donc, quelques solutions proposées pourraient, nous l’espérons, les améliorer à l’avenir.Nors pastaruoju metu Lietuvoje beveik kasmet pasirodo naujø dvikalbių žodynų, jie praktiškai lieka „nepastebėti“ lingvistų. Regis, mūsuose iki šiol viešpatauja nuostata, jog leksikografija nėra rimta, „prestižinė“ mokslo šaka, verta išsamaus tyrinėjimo. Todėl žodynų, ypač dvikalbių, kūrimo procesas yra paliekamas likimo valiai. Tuo tarpu tiek jų makrostruktūros (žodynų bendrosios struktūros), tiek ir mikrostruktūros (žodyno straipsnio sandaros) įvairiapusė analizė turėtų ne vien teorinę, bet ir praktinę reikšmę: atsižvelgus į dabar egzistuojančių žodynų trūkumus, ateityje būtų galima juos pataisyti ir patobulinti. Šiame darbe norėtume stabtelėti ties vienu itin svarbiu mikrostruktūros aspektu – lemos pateikimo ir jos aiškinimo ypatumais dvikalbio žodyno straipsnyje. Kodėl šis aspektas yra ne mažiau svarbus, negu, tarkim, žodyno sąvado tyrinėjimas? Neretai maždaug tiek pat lemų, arba antraštinių žodžių, turintys žodynai iš esmės skiriasi – ne vien tik straipsniuose pateikiamos informacijos apimtimi, bet ir vartojimo patogumu. Taigi, analizės objektu pasirinkę keturis 2001–2006 metais Lietuvoje išleistus didelės apimties dvikalbius žodynus, kuriuose lietuvių kalba yra pagrindinė 3, pamėginsime panagrinėti, kuo yra panašus ir kuo skirtingas tos pačios lemos aiškinimas. Kaip tipišką pavyzdį, kuriuo pasinaudodami aptarsime pagrindines problemas, išskyrėme daiktavardį koja.

    Esquisse d’un modèle linguistique pour l’étude des nominations émergentes

    Get PDF
     The article presents the outline of a linguistic model that is part of a methodology for identifying and analyzing emerging or referentially unstable namings, such as cultural appropriation, street harassment, climate refugee or ecocide. The model and the method are intended to guide the interpretation – manual or semi-automatic – of the referential expressions, according to the semantic-cognitive type of the designated entity (human entity, social process, event, etc.), but also taking into account interdiscursive negotiations that affect the choice of terms and their uses. The proposed approach is original and is based on several guiding ideas: (1) take into account the complexity of the naming and the entanglement of his different facets which are categorization, meaning, performativity and valuation (desirability, preferences, social norms), (2) target the development phase of the naming (observe how speakers deal with the unstable): for this purpose, we will use the notion of identification between weak or identified entities and strong or reference entities, (3) report in an integrated way the referential elaboration of knowledge, the lexical and semantic elaboration of expressions, and the expression of intersubjective attitudes. The scientific framework combines three main disciplinary areas: automatic language processing (construction and representation of knowledge, reference), semantics (elaboration of meanings) and discourse analysis (interdiscursive elaboration of concepts and terms).L’article présente l’esquisse d’un modèle linguistique s’inscrivant dans une méthodologie de repérage et d’analyse des nominations émergentes ou référentiellement instables, telles que appropriation culturelle, harcèlement de rue, réfugié climatique ou écocide. Le modèle et la méthode sont destinés à guider l’interprétation – manuelle ou semi-automatique – des expressions référentielles, suivant le type sémantico-cognitif de l’entité désignée (entité humaine, processus social, événement), mais également en tenant compte des négociations interdiscursives qui touchent aux choix des termes et à leurs usages. L’approche proposée est originale et repose sur plusieurs idées directrices : (1) tenir compte de la complexité des nominations et de l’intrication de leurs différentes facettes que sont catégorisation, signification, performativité et valorisation (désidérabilité, préférences, normes sociales), (2) cibler la phase d’élaboration des nominations (observer comment les locuteurs composent avec l’instable) : on mobilisera, à cet effet, la notion de repérage entre entités faibles ou repérées et entités fortes ou repères, (3) rendre compte de manière intégrée de l’élaboration référentielle des connaissances, de l’élaboration lexicale et sémantique des expressions, et de l’expression des attitudes intersubjectives. Le cadre scientifique conjugue trois domaines disciplinaires principaux : le traitement automatique des langues (construction et représentation des connaissances, référence), la sémantique (élaboration des significations) et l’analyse de discours (élaboration interdiscursive des concepts et des termes)
    corecore