2,007 research outputs found

    El Making of ... Top Trendit! - Anglicisms in Women's Magazine Advertising in Finland and Spain.

    Get PDF
    Englanninkielistä alkuperää olevien sanojen eli anglismien määrä mainonnassa kasvaa jatkuvasti ja ne herättävät reaktiota sekä puolesta että vastaan. Sekä Suomessa että Espanjassa englannin kielen käyttö yleistyy koko ajan. Nämä kaksi maata ovat kulttuuriltaan ja kielitilanteeltaan erilaisia: suomi on pieni kieli kun taas espanja on maailman toiseksi puhutuin kieli ja sen asema näyttää vakaalta myös englannin kieleen verrattuna. Mainonta heijastaa yhteiskuntaamme ja englannin kielen määrä sekä käyttötavat osoittavat kuinka hyväksytyksi tämä kieli koetaan. Tutkimuksessa vertaillaan Suomessa ja Espanjassa julkaistuissa naistenlehdissä olevaa mainontaa ja tarkastellaan miten paljon ja minkälaisia anglismeja niissä esiintyy. Lisäksi tutkitaan missä kohdissa mainoksia anglismeja esiintyy. Tarkastelun kohteena ovat Elle ja Cosmopolitan lehdet. Hypoteesi on, että suomalaisissa mainoksissa käytetään enemmän anglismeja kuin espanjalaisissa mainoksissa kulttuuriin, historiaan ja kielelliseen identiteettiin liittyvien syiden vuoksi. Tutkimus osoitti, että suomalaisissa mainoksissa esiintyy enemmän anglismeja kuin espanjalaisissa mainoksissa, mutta jälkimmäisessä anglismityyppien skaala oli laajempi. Kummassakin aineistossa yleisimmät anglismit olivat ns. koodinvaihtoja, mikä tarkoittaa, että anglismit olivat suurimmaksi osaksi yksittäisiä englanninkielisiä sanoja tai lauseita. Eniten anglismeja kummastakin aineistosta löytyi tuotteiden nimistä ja mainosten informaatio-osioista. Myös prosentuaalisesti kummankin maan tutkimusaineistossa oli enemmän mainoksia, jotka sisälsivät vähintään yhden anglisimin kuin mainoksia, joissa niitä ei ollut yhtään.fi=Opinnäytetyö kokotekstinä PDF-muodossa.|en=Thesis fulltext in PDF format.|sv=Lärdomsprov tillgängligt som fulltext i PDF-format

    ELF and Translationese in Relation to Plain English on the Websites of Finnish Medium-Sized Export Companies

    Get PDF
    Englanninkielisillä kotisivuilla on suuri merkitys erityisesti suomalaisille vientiyrityksille, sillä niiden avulla yritykset pystyvät markkinoimaan itseään ja tuotteitaan potentiaalisille ulkomaisille asiakkaille. Nykyään yrityksen kotisivut toimivat usein ensimmäisenä kontaktina asiakkaan ja yrityksen välillä asiakkaan hankkiessa tietoa uudesta yrityksestä tai tuotteesta. Koska yritysten kotisivuilla on tärkeä rooli ensivaikutelman luomisessa, on tärkeää, että myös niillä käytettävä kieli on helppolukuista ja virheetöntä. Erilaiset kielelliset poikkeamat osoittautuivat kuitenkin varsin yleisiksi vientiyritysten englanninkielisillä kotisivuilla. Nämä kielelliset poikkeamat tunnistettiin Englanti lingua francana - ja translationese-kielimuodon piirteiksi. Englanti lingua francana (ELF) on kielimuoto, jota englantia vieraana kielenä puhuvat henkilöt käyttävät puhuessaan muiden vieraskielisten kanssa. Translationese on puolestaan kielimuoto, jota esiintyy käännetyssä kirjoitetussa kielessä ja jossa lähdekielen piirteet ovat selkeästi havaittavissa ja heikentävät käännöksen sujuvuutta. Internetissä kieli yhdistelee kirjoitetun ja puhutun kielen ominaisuuksia, mikä selittää molempien kielimuotojen esiintymisen kotisivuilla. Tutkimuksessa näitä kielellisiä piirteitä verrattiin lisäksi Plain English -kielimuotoon, jonka ensisijainen pyrkimys on tuottaa kielellisesti ja tyylillisesti mahdollisimman selkeää ja helppolukuista englantia väärinymmärrysten välttämiseksi. Tutkimus osoitti, että ELF-piirteet eivät johda vakaviin väärinymmärryksiin mutta saattavat vaikuttaa negatiivisesti tekstin luettavuuteen. Sanatasolla translationese johtaa selkeisiin poikkeamiin Plain English -kielimuodosta, mutta niiden vaikutus luettavuuteen jää kuitenkin vähäisemmäksi kuin lausetasolla ilmenevän translationesen, joka poikkeaa selkeästi Plain English -kielimuodoista ja johtaa helposti väärinymmärryksiin. ELF:n ja translationesen yleisyys yritysten kotisivuilla osoittaa, etteivät monet yritykset vielä tiedosta helppolukuisten ja kielellisesti virheettömien kotisivujen positiivista vaikutusta koko yrityksen imagoon, ja enemmän huomiota tulisikin tulevaisuudessa kiinnittää yritysten englanninkielisten kotisivujen kielelliseen laatuun.fi=Opinnäytetyö kokotekstinä PDF-muodossa.|en=Thesis fulltext in PDF format.|sv=Lärdomsprov tillgängligt som fulltext i PDF-format

    Phonological Parameters of Indigenous and ASL Country Name-Signs

    Get PDF
    This investigation was guided by the following research questions: What are the American Sign Language (ASL) and indigenous signs for each country in the world? What phonological features do they exhibit? Are these features consistent with previous research on ASL? The research presented in this article is the result of a project that provides a comprehensive online compilation of country-name signs. A website was created to display both written descriptions and videos of the signs, and 180 countries with 314 total variations were identified, documented, recorded, coded and analyzed. A thorough literature review was conducted and an analysis of phonological parameters based on Battison (1978) was performed using pivot tables in Microsoft Excel. Findings include: (a) the distinction between the 1 and g/q handshape in previous literature; (b) 100% of the applicable signs analyzed satisfied the symmetry condition; and (c) indigenous signs adopted into ASL are frequently altered to contain two iterations instead of just one beat. An in-depth discussion of the implications of language contact, globalization, technology and practical application for interpreters is included

    CEFR-nivåer och svenska flerordsuttryck

    Get PDF
    Peer reviewe

    Language and Linguistics in a Complex World Data, Interdisciplinarity, Transfer, and the Next Generation. ICAME41 Extended Book of Abstracts

    Get PDF
    This is a collection of papers, work-in-progress reports, and other contributions that were part of the ICAME41 digital conference

    Language and Linguistics in a Complex World Data, Interdisciplinarity, Transfer, and the Next Generation. ICAME41 Extended Book of Abstracts

    Get PDF
    This is a collection of papers, work-in-progress reports, and other contributions that were part of the ICAME41 digital conference

    Distributional Semantic Models for Clinical Text Applied to Health Record Summarization

    Get PDF
    As information systems in the health sector are becoming increasingly computerized, large amounts of care-related information are being stored electronically. In hospitals clinicians continuously document treatment and care given to patients in electronic health record (EHR) systems. Much of the information being documented is in the form of clinical notes, or narratives, containing primarily unstructured free-text information. For each care episode, clinical notes are written on a regular basis, ending with a discharge summary that basically summarizes the care episode. Although EHR systems are helpful for storing and managing such information, there is an unrealized potential in utilizing this information for smarter care assistance, as well as for secondary purposes such as research and education. Advances in clinical language processing are enabling computers to assist clinicians in their interaction with the free-text information documented in EHR systems. This includes assisting in tasks like query-based search, terminology development, knowledge extraction, translation, and summarization. This thesis explores various computerized approaches and methods aimed at enabling automated semantic textual similarity assessment and information extraction based on the free-text information in EHR systems. The focus is placed on the task of (semi-)automated summarization of the clinical notes written during individual care episodes. The overall theme of the presented work is to utilize resource-light approaches and methods, circumventing the need to manually develop knowledge resources or training data. Thus, to enable computational semantic textual similarity assessment, word distribution statistics are derived from large training corpora of clinical free text and stored as vector-based representations referred to as distributional semantic models. Also resource-light methods are explored in the task of performing automatic summarization of clinical freetext information, relying on semantic textual similarity assessment. Novel and experimental methods are presented and evaluated that focus on: a) distributional semantic models trained in an unsupervised manner from statistical information derived from large unannotated clinical free-text corpora; b) representing and computing semantic similarities between linguistic items of different granularity, primarily words, sentences and clinical notes; and c) summarizing clinical free-text information from individual care episodes. Results are evaluated against gold standards that reflect human judgements. The results indicate that the use of distributional semantics is promising as a resource-light approach to automated capturing of semantic textual similarity relations from unannotated clinical text corpora. Here it is important that the semantics correlate with the clinical terminology, and with various semantic similarity assessment tasks. Improvements over classical approaches are achieved when the underlying vector-based representations allow for a broader range of semantic features to be captured and represented. These are either distributed over multiple semantic models trained with different features and training corpora, or use models that store multiple sense-vectors per word. Further, the use of structured meta-level information accompanying care episodes is explored as training features for distributional semantic models, with the aim of capturing semantic relations suitable for care episode-level information retrieval. Results indicate that such models performs well in clinical information retrieval. It is shown that a method called Random Indexing can be modified to construct distributional semantic models that capture multiple sense-vectors for each word in the training corpus. This is done in a way that retains the original training properties of the Random Indexing method, by being incremental, scalable and distributional. Distributional semantic models trained with a framework called Word2vec, which relies on the use of neural networks, outperform those trained using the classic Random Indexing method in several semantic similarity assessment tasks, when training is done using comparable parameters and the same training corpora. Finally, several statistical features in clinical text are explored in terms of their ability to indicate sentence significance in a text summary generated from the clinical notes. This includes the use of distributional semantics to enable case-based similarity assessment, where cases are other care episodes and their “solutions”, i.e., discharge summaries. A type of manual evaluation is performed, where human experts rates the different aspects of the summaries using a evaluation scheme/tool. In addition, the original clinician-written discharge summaries are explored as gold standard for the purpose of automated evaluation. Evaluation shows a high correlation between manual and automated evaluation, suggesting that such a gold standard can function as a proxy for human evaluations. --- This thesis has been published jointly with Norwegian University of Science and Technology, Norway and University of Turku, Finland.This thesis has beenpublished jointly with Norwegian University of Science and Technology, Norway.Siirretty Doriast

    24th Nordic Conference on Computational Linguistics (NoDaLiDa)

    Get PDF
    corecore