5,824 research outputs found

    A Quantitative Corpus-based Analysis of Linking Adverbials in Students’ Academic Writing

    Get PDF
    Udostępnienie publikacji Wydawnictwa Uniwersytetu Łódzkiego finansowane w ramach projektu „Doskonałość naukowa kluczem do doskonałości kształcenia”. Projekt realizowany jest ze środków Europejskiego Funduszu Społecznego w ramach Programu Operacyjnego Wiedza Edukacja Rozwój; nr umowy: POWER.03.05.00-00-Z092/17-00

    MODALNOŚĆ EPISTEMICZNA – ANALIZA KORPUSOWA WYKŁADNIKÓW MODALNOŚCI EPISTEMICZNEJ W WYROKACH UNIJNYCH I KRAJOWYCH

    Get PDF
    The aim of this paper is to establish the repertoire and distribution of verbal and adverbial exponents of epistemic modality in English- and Polish-language judgments passed by the Court of Justice of the EU (CJEU) and non-translated judgments passed by the Supreme Court of Poland (SN). The study applies a model for categorizing exponents of epistemicity with regard to their (i) level (high-, medium- and low-level of certainty, necessity or possibility expressed by the markers; primary dimension), (ii) perspective (own vs. reported perspective), (iii) opinion (based either on facts or beliefs) and (iv) time (the embedding of epistemic markers in sentences relating to the past, present or future) (contextual dimensions). It examines the degree of intra-generic convergence of translated EU judgments and non-translated national judgments in terms of the employment of epistemic markers, as well as the degree of authoritativeness of judicial argumentation, and determines whether the frequent use of epistemic markers constitutes a generic feature of judgments. The research material consists of a parallel corpus of English- and Polish-language versions of 200 EU judgments and a corpus of 200 non-translated domestic judgments. The results point to the high salience and differing patterns of use of epistemic markers in both EU and national judgments. The frequent use of high-level epistemic markers boosts the authoritativeness of judicial reasoning.Celem pracy jest ustalenie zasobu i dystrybucji czasownikowych i przysłówkowych wykładników modalności epistemicznej w angielsko- i polskojęzycznych tłumaczeniach wyroków Trybunału Sprawiedliwości UE (CJEU) i nietłumaczonych wyrokach Sądu Najwyższego RP (SN). W badaniu wykorzystano model kategoryzacji wykładników modalności epistemicznej pozwalający na ich klasyfikację ze względu na (i) intensywność (wysoką, średnią bądź niską, tj. stopień pewności, konieczności albo prawdopodobieństwa wyrażany przez poszczególne wykładniki; wymiar podstawowy), (ii) perspektywę (własną bądź przytaczaną), (iii) opinię (opartą na faktach albo przekonaniu), a także (iv) czas (przeszły, teraźniejszy, przyszły) (wymiary kontekstowe). Badanie miało na celu ustalenie wewnątrzgatunkowego stopnia dopasowania tłumaczonych wyroków unijnych do nietłumaczonych wyroków krajowych pod względem występowania wykładników modalności epistemicznej, określenie stopnia autorytatywności argumentacji sędziowskiej oraz stwierdzenie, czy częste występowanie wykładników stanowi cechę gatunkową wyroków. Materiał badawczy obejmuje równoległy korpus 200 wyroków unijnych przetłumaczonych na język angielski i polski oraz korpus 200 wyroków krajowych. Wyniki badania wskazują na istotną wagę wykładników o wysokiej intensywności zarówno w wyrokach unijnych, jak i krajowych. Stwierdzono, że częste użycie wykładników modalności epistemicznej o wysokiej intensywności podnosi poziom autorytatywności argumentacji sędziowskiej

    PSP: Pre-trained Soft Prompts for Few-Shot Abstractive Summarization

    Full text link
    Few-shot abstractive summarization has become a challenging task in natural language generation. To support it, we designed a novel soft prompts architecture coupled with a prompt pre-training plus fine-tuning paradigm that is effective and tunes only extremely light parameters. The soft prompts include continuous input embeddings across an encoder and a decoder to fit the structure of the generation models. Importantly, a novel inner-prompt placed in the text is introduced to capture document-level information. The aim is to devote attention to understanding the document that better prompts the model to generate document-related content. The first step in the summarization procedure is to conduct prompt pre-training with self-supervised pseudo-data. This teaches the model basic summarizing capabilities. The model is then fine-tuned with few-shot examples. Experimental results on the CNN/DailyMail and XSum datasets show that our method, with only 0.1% of the parameters, outperforms full-model tuning where all model parameters are tuned. It also surpasses Prompt Tuning by a large margin and delivers competitive results against Prefix-Tuning with 3% of the parameters.Comment: 12 page

    Linguistic unit discovery from multi-modal inputs in unwritten languages: Summary of the "Speaking Rosetta" JSALT 2017 Workshop

    Get PDF
    We summarize the accomplishments of a multi-disciplinary workshop exploring the computational and scientific issues surrounding the discovery of linguistic units (subwords and words) in a language without orthography. We study the replacement of orthographic transcriptions by images and/or translated text in a well-resourced language to help unsupervised discovery from raw speech.Comment: Accepted to ICASSP 201

    Short- and long-term effects of rote rehearsal on ESL learners’ processing of L2 collocations

    Get PDF
    Worldwide there is thought to be around 750 million people who speak English as a foreign language (Crystal, 2003, p. 69). For these speakers the difference between make a picture and take a picture may seem arbitrary. However, use of the former is likely to influence how their second language (L2) performance is perceived (Boers, Eyckmans, Kappel, Stengers, & Demecheleer, 2006). Consequently, L2 speakers' use of collocations (“fixed, identifiable, non-idiomatic phrases and constructions”; Benson, Benson, & Ilson, 1997, p. xv) and other formulaic sequences is an important aspect of L2 competence (Wray, 2002). Several factors appear to influence the acquisition and use of L2 collocations. One of them is L1–L2 collocational congruency. Research has demonstrated that word-for-word translation equivalents (congruent collocations) are processed more efficiently than incongruent collocations (Wolter & Gyllstad, 2011; Yamashita & Jiang, 2010). Moreover, research has demonstrated that collocational frequency, and the frequency of formulaic sequences more generally, influences processing, with more frequent combinations being processed more quickly (Siyanova-Chanturia, Conklin, & van Heuven, 2011; Wolter & Gyllstad, 2013). Researchers have also explored the role of different L2 input conditions on the processing of collocations. Sonbul and Schmitt (2013) compared the effects of three treatments (enriched, enhanced, and decontextualized input) on the collocational competence of learners of English as a second language (ESL). For explicit knowledge, they observed an improvement in both receptive and productive tests for all treatment conditions, but for implicit knowledge no gains were found. Peters (2012) examined L2-German learners' acquisition of words and formulaic sequences as dependent on an instructional method (directing learners' attention through instructions) and input enhancement (bolding and underlining). In a form recall test, input enhancement led to gains in learners' knowledge, whereas the instructional method did not seem to affect their results. The present study brings together a number of questions that have been prominent in the literature by examining the short- and long-term effects of two different input conditions on ESL learners' processing of L2 collocations, as well as exploring the influence of frequency and collocational congruency

    Magdalena Jaszczyk-Grzyb. Mowa nienawiści ze względu na przynależność etniczną i narodową w komunikacji internetowej. Analiza porównawcza języka polskiego i niemieckiego. Poznań: Wydawnictwo Naukowe UAM. 2021. Pp. 375

    Get PDF
    Book review: Magdalena Jaszczyk-Grzyb. Mowa nienawiści ze względu na przynależność etniczną i narodową w komunikacji internetowej. Analiza porównawcza języka polskiego i niemieckiego. Poznań: Wydawnictwo Naukowe UAM. 2021. Pp. 375Book review: Magdalena Jaszczyk-Grzyb. Mowa nienawiści ze względu na przynależność etniczną i narodową w komunikacji internetowej. Analiza porównawcza języka polskiego i niemieckiego. Poznań: Wydawnictwo Naukowe UAM. 2021. Pp. 37

    Short- and long-term effects of rote rehearsal on ESL learners’ processing of L2 collocations

    Get PDF
    Worldwide there is thought to be around 750 million people who speak English as a foreign language (Crystal, 2003, p. 69). For these speakers the difference between make a picture and take a picture may seem arbitrary. However, use of the former is likely to influence how their second language (L2) performance is perceived (Boers, Eyckmans, Kappel, Stengers, & Demecheleer, 2006). Consequently, L2 speakers' use of collocations (“fixed, identifiable, non-idiomatic phrases and constructions”; Benson, Benson, & Ilson, 1997, p. xv) and other formulaic sequences is an important aspect of L2 competence (Wray, 2002). Several factors appear to influence the acquisition and use of L2 collocations. One of them is L1–L2 collocational congruency. Research has demonstrated that word-for-word translation equivalents (congruent collocations) are processed more efficiently than incongruent collocations (Wolter & Gyllstad, 2011; Yamashita & Jiang, 2010). Moreover, research has demonstrated that collocational frequency, and the frequency of formulaic sequences more generally, influences processing, with more frequent combinations being processed more quickly (Siyanova-Chanturia, Conklin, & van Heuven, 2011; Wolter & Gyllstad, 2013). Researchers have also explored the role of different L2 input conditions on the processing of collocations. Sonbul and Schmitt (2013) compared the effects of three treatments (enriched, enhanced, and decontextualized input) on the collocational competence of learners of English as a second language (ESL). For explicit knowledge, they observed an improvement in both receptive and productive tests for all treatment conditions, but for implicit knowledge no gains were found. Peters (2012) examined L2-German learners' acquisition of words and formulaic sequences as dependent on an instructional method (directing learners' attention through instructions) and input enhancement (bolding and underlining). In a form recall test, input enhancement led to gains in learners' knowledge, whereas the instructional method did not seem to affect their results. The present study brings together a number of questions that have been prominent in the literature by examining the short- and long-term effects of two different input conditions on ESL learners' processing of L2 collocations, as well as exploring the influence of frequency and collocational congruency

    On lexical bundles in Polish patient information leaflets : a corpus-driven study

    Get PDF
    Dotychczas rzadko podejmowano się korpusowych badań nad często powtarzalnymi frazeologizmami w tekstach napisanych w języku polskim, zwłaszcza reprezentujących rejestry specjalistyczne. Rezultatem takiego stanu rzeczy jest m.in. niedobór badań korpusowych nad zbitkami wielowyrazowymi (lexical bundles) (Biber et al. 1999) na materiale w języku polskim. Wykonane z perspektywy rejestru języka (Biber i Conrad 2009), niniejsze badanie o charakterze eksploracyjno-opisowym jest pomyślane jako pierwszy krok na drodze do opracowania bardziej wszechstronnego opisu - z wykorzystaniem podejścia sterowanego korpusem - użycia i funkcji dyskursywnych najczęstszych zbitek wielowyrazowych występujących w ulotkach dla pacjentów, które są jednym z najczęściej używanych typów tekstów w sektorze opieki zdrowotnej w Polsce. Materiał badawczy obejmuje 100 ulotek napisanych w języku polskim, pozyskanych ze stron internetowych dziesięciu firm farmaceutycznych działających na polskim rynku leków, zebranych w specjalnie do tego celu stworzonym korpusie liczącym ok. 197 000 wyrazów tekstowych. Oparte w dużym stopniu na elementach metodologii zaczerpniętej z badań Bibera, Conrad i Cortes (2003, 2004), Bibera (2006) i Goździa-Roszkowskiego (2011), niniejsze badanie ma również na celu przedstawienie propozycji metodologicznych w kontekście przyszłych badań nad zbitkami wielowyrazowymi na materiale polskich tekstów. Takie zamierzenie wydaje się uzasadnione, ponieważ dotychczasowe badania nad zbitkami wielowyrazowymi w przeważającej większości wykonano na materiale tekstów napisanych w języku angielskim. Wyniki niniejszego badania pilotażowego wykazały istotny związek pomiędzy wysoką frekwencją zbitek wielowyrazowych a funkcją komunikacyjną i kontekstem sytuacyjnym, w jakim zazwyczaj używane są ulotki dla pacjentów.So far little attention has been paid to the corpus analysis of recurrent phraseologies found in Polish texts, in particular texts representing specialists registers of language use. Also, one may note the lack of corpus linguistic studies of lexical bundles (Biber et al. 1999) found in texts originally written in Polish. Conducted from a register perspective (Biber and Conrad 2009), this descriptive and exploratory study is intended as a first step towards a comprehensive corpus-driven description of the use and functions of the most frequent lexical bundles found in patient information leafl ets (PILs), one of the most commonly used text types in the healthcare sector in Poland. The research material includes 100 PILs written originally in Polish, extracted from internet websites of ten pharmaceutical companies operating on the Polish market, compiled in a purpose-designed corpus of circa 197,000 words. Based largely on the methodology proposed by Biber, Conrad and Cortes (2003, 2004), Biber (2006), and Goźdź-Roszkowski (2011), which makes possible an analysis of the use and discourse functions of lexical bundles, the present study is primarily meant to provide methodological guidelines for future research on lexical bundles in Polish texts. This appears to be important since so far lexical bundles have been studied predominantly in texts originally written in English. The results of this preliminary research reveal salient links between the frequent occurrence of lexical bundles on the one hand, and situational and functional characteristics of the text variety under scrutiny on the other
    corecore