    Where do the wild things live? Corpus method to detect anglicisms and their derivatives on Russian Internet

    Описан метод автоматизированного обнаружения английских заимствований и их производных с помощью менеджера корпусов Sketch Engine и его инструмента Keyword, работающего на основе принципа TF-IDF. Пилотное исследование было проведено на материале небольшого количества блоговых текстов о моде (174 213 словоупотреблений – 218 091 токен) с сайта LiveJournal, в которых благодаря применению функции Keyword было выявлено 84 заимствования в сфере моды (4 506 вхождений) и 32 производных (1 194 вхождения)

    Percepciones y uso autodeclarado de anglicismos del campo de las TIC por parte de estudiantes universitarios españoles

    This paper presents a twofold analysis that, on the one hand, is intended to examine the presence of IT Anglicisms in the contemporary Spanish digital press; on the other hand, it aims to reveal the degree of knowledge and use of these English lexical items by a sample of Spanish speaking university students and to explore what their perceptions and attitudes are towards Anglicisms and their use ‒not only in specialised contexts such as the IT field, but also when dealing with current and more general topics. The administration of a questionnaire to 232 pupils studying various degrees in two Spanish universities provided reliable data of the high level of knowledge and reported use of a sample of IT terms extracted from an Anglicisms search tool, ‘Observatorio Lázaro’. In addition, the findings have shown open and positive perceptions by Spanish students towards the usage of Anglicisms. Various pragmatic functions (expressive and referential) seem to motivate these uses. Finally, some pedagogical implications of this study are discussed in the sphere of ESP teaching/learning.Este trabajo presenta un doble análisis que, por un lado, pretende examinar la presencia de anglicismos informáticos en la prensa digital española contemporánea, y por otro, propone descubrir el grado de conocimiento y uso de estas unidades léxicas inglesas por parte de una muestra de estudiantes universitarios nativos de español y además explorar cuáles son sus percepciones y actitudes hacia los anglicismos y su uso, no solo en contextos especializados como el campo de las TIC, sino también cuando se trata de temas actuales y más generales. La administración de un cuestionario a 232 estudiantes de diversos Grados de dos universidades españolas proporcionó datos fiables del alto nivel de conocimiento y uso autodeclarado de una muestra de términos informáticos extraídos de una herramienta de búsqueda de anglicismos, el ‘Observatorio Lázaro’. Además, los resultados obtenidos demuestran las percepciones abiertas y positivas de los participantes hacia el uso de anglicismos. Diferentes funciones pragmáticas (expresiva y referencial) parecen motivar estos usos. Finalmente, se discuten algunas implicaciones pedagógicas de este estudio en el ámbito de la enseñanza/aprendizaje del Inglés para Fines Específicos

    Anglicisms in financial Italian: A corpus-driven analysis of Italian press from 2008 to 2020

    This research focuses on the identification and analysis of the terminology of Anglo-American origin, the so-called Anglicisms, related to the lexicon of the 2008 global financial crisis that have entered the Italian special language of economics and finance since the outbreak of the crisis in 2008 to the year 2020. The research is a corpus-driven analysis conducted on a specifically built monolingual corpus that aims to quantitatively and qualitatively analyse the Italian special language of economics and finance and its features. The corpus constitutes of four Italian financial newspapers addressed both to an audience of experts and professionals, in the case of the specialised journals Milano Finanza and Italia Oggi, and to an audience of laypersons, in the case of the newspapers of general reach Il Sole 24 Ore and La Repubblica. For each newspaper 25 articles a-year have been selected, for a total of 1,3000 articles. Furthermore, the qualitative and quantitative conclusions drawn upon the data extracted on the anglicisms investigated have been further supported by the construction of an Anglo-American monolingual reference corpus, balanced with respect to the Italian corpus in terms of the period of time considered, from 2008 to 2020, to the varied audience addressed, and to the number of articles collected. In fact, the reference corpus constitutes of 25 articles a-year selected from four English financial newspapers published from 2008 to 2020; additionally, the newspapers that constitute the reference corpus have been geographically selected, as two of them are British, The Financial Times and City A.M, and two are American, i.e. Investors’ Business Daily and American Banker

    Specialized Languages: The alter ego of any research field

    Across different fields of research, one feature is often overlooked: the use of language for specialized purposes (LSP) as a cross-discipline. Mastering cross-disciplinarity is the precondition for communicating detailed results within any field. Researchers in specialized languages work cross-disciplinarily, because they work with both derivative and contributory approaches. Derivative, because specialized language retrieves its philosophy of science as well as methods from both the natural sciences, social sciences and humanistic sciences. Contributory because language results support the communication of other sciences. Take for instance computational linguistics: its derivative part uses the competences and methods from computer science and couples them with linguistics; its contributory part is the lexicographical, terminological and syntactical results within a specific domain or genre that help science fields communicate their findings. With this article, we want to create awareness of the work in this special area of language studies and of the inherent cross-disciplinarity that makes LSP special compared to common-core language. An acknowledgement of the importance of this field both in terms of more empirical studies and in terms of a greater application of the results would give language specialists in trade and industry a solid and updated basis for communication and language use

    Baltic Journal of English Language, Literature and Culture, vol.2

    The purpose of this study was to investigate whether social counselling via chat conversations could meet the criteria for a professional conversation, and how the six social workers who were interviewed felt that it had affected the profession and the clients who are seeking their help. Communication, professionality, power, roles and regions are the key topics of this study. A hermeneutic approach has not only influenced the interviews but also the content analysis that was used to encode the results. The interviews revealed that the chat conversations was a successful tool but not entirely without difficulties. The initial contact making between the client and the social worker favours the client, since she/he remains anonymous and that was the main advantage of the method. The biggest concern however was that in the anonymity it is not possible to report cases that the social worker are obligated to. The changing of forum does not necessarily affect the professionality but due to the faceless chat conversation an entire dimension of communication disappears because the loss of body language. Therefore, the traditional face-to-face conversation contains a value that is hard to replac

    What makes a neologism a success story?

    Semantically-enriched business process modeling and management

    Business Process Modeling is a means to intuitively describe the enterprise\u27s organizational structure and interrelated business processes with the help of diagrams that are composed of Business Objects and that are stored in a dedicated database, the Business Object Repository. A large set of Business Objects that occur in the process models is labeled in natural language expressions. These object labels are neither checked in terms of language competence nor in terms of their business performance. This dissertation describes innovative solutions which cover the topics that are not exhaustively handled like the verification on language level as well as the better alignment between modeling levels and implementation levels. The solution creates and employs a knowledge matrix that adds a machine processable semantic layer on top of the Business Repository.Die Geschäftsprozessmodellierung ist eine Methode um intuitiv die Organisationsstrukturen und die abhängigen Geschäftsprozesse mit Hilfe von Modellen zu beschreiben. Die Modelle bestehen aus Geschäftsobjekten und werden in einer dedizierten Datenbank abgelegt, dem Business Repository. Ein großer Teil der Geschäftsobjekte sind mit natürlich sprachlichen Ausdrücken benannt. Die neuen Aufgabenstellungen sind die Prüfungen aller vorliegenden sprachabhängigen Arbeitsergebnisse von BPM auf Sprachkompetenz und auf Geschäftsperformanz. Die vorliegende Dissertation enthält innovative Lösungen zu bisher nicht vollständig behandelten Aufgabenstellungen wie der Verifizierung der Sprachebenen sowie einem besseren Alignment zwischen Modellierungsebenen und Umsetzungsebenen. Sie lässt eine Wissensmatrix entstehen, die dem klassischen BPM eine automatisierte, maschinenverarbeitbare neue Schicht - die semantische Ebene - oberhalb des Business Repository hinzufügt

    English semantic loans, loan translations, and loan renditions in informal Polish of computer users

    Głównym celem niniejszej monografii jest całościowe opisanie zapożyczeń semantycznych oraz kalk leksykalnych i frazeologicznych (dokładnych i niedokładnych) w polskim języku informatyki (w jego odmianie potocznej). Celem dodatkowym jest obszerne omówienie teoretyczne problematyki zapożyczeń semantycznych i kalk, a w szczególności wskazanie rozbieżności oraz różnego rodzaju luk w stanowiskach badaczy zajmujących się ww. typami zapożyczeń, a także podkreślenie trudności metodologicznych, przed jakimi staje językoznawca je badający. Wspomniane trudności dotyczą przede wszystkim niejasnych kryteriów wyodrębniania zapożyczeń semantycznych i kalk od jednostek nimi niebędących: opisano zatem szczegółowo proces różnicowania pomiędzy zapożyczeniami semantycznymi a rodzimymi neosemantyzmami, zapożyczeniami semantycznymi a (ponownymi) zapożyczeniami leksykalnymi, kalkami frazeologicznymi a rodzimymi neofrazeologizmami, kalkami a zapożyczeniami leksykalnymi, zapożyczeniami semantycznymi a kalkami frazeologicznymi, kalkami frazeologicznymi dokładnymi a niedokładnymi oraz półkalkami a hybrydami. Autor zaproponował tutaj własne kryteria pomocne w odróżnianiu ww. zjawisk językowych. Podstawą badań jest samodzielnie zebrany przez autora monografii korpus polszczyzny specjalistycznej. W jego skład wchodzą krótkie notki (wpisy, posty) pochodzące z wybranych 32 forów internetowych o tematyce komputerowo-internetowej. Z każdego z 32 forów zebrano próbki wypowiedzi użytkowników (każda próbka liczy między 20.000 a 60.000 słów; w większości przypadków ich wielkość waha się pomiędzy 45.000 a 55.000 słów). Łączna wielkość korpusu to ponad półtora miliona słów (1.541.449) rozumianych ortograficznie, tj. jako szereg liter oddzielonych spacją. Korpus jest zatem stosunkowo duży i może być uznany za w pełni reprezentatywny dla nieformalnej polszczyzny informatycznej. Jest on bardzo zróżnicowany tematycznie, zawiera bowiem wpisy dotyczące zarówno sprzętu komputerowego (jednostki centralne, procesory, twarde dyski, wentylatory chłodzące, obudowy, drukarki, pamięci, myszy, klawiatury, słuchawki, skanery itd.), jak i oprogramowania (systemy operacyjne, edytory tekstu, arkusze kalkulacyjne, gry komputerowe, programowanie itd.) oraz Internetu (przeglądarki internetowe, komuni katory, programy antywirusowe, wirusy itd.). Autor stoi na stanowisku, że własnoręcznie zebrany korpus jest znacznie cenniejszym narzędziem badawczym niż gotowe korpusy dostępne w Internecie (takie jak Narodowy Korpus Języka Polskiego), które nie są najwłaściwszym wyborem dla celów badań nad językiem specjalistycznym. Korpus taki jest również lepszą podstawą badań niż artykuły prasowe zamieszczane w prasie komputerowej, które często są adaptacjami tekstów, które powstały wcześniej w języku angielskim. Praca zawiera także omówienie języka Internetu, ze szczególnym uwzględnieniem forów internetowych. Bardzo dokładnie opisano również proces tworzenia własnego korpusu językowego, zarówno od strony technicznej, jak i metodologiczno-materiałowej. W pracy zebrano i dokładnie opisano 204 typy angielskich zapożyczeń semantycznych (derywaty nie są traktowane jako odrębne typy, zatem np. formy akcelerator i akceleracja są traktowane jako ten sam typ), które wystąpiły łącznie 42.638 razy w korpusie oraz 529 typów angielskich kalk (16 leksykalnych i 513 frazeologicznych; 440 kalk dokładnych oraz 89 niedokładnych), które wystąpiły łącznie 8.228 razy. Tym samym niniejsza monografia jest - wedle najlepszej wiedzy autora - najobszerniejszym omówieniem ww. typów zapożyczeń w potocznym języku informatyki. Co istotne, większość omówionych kalk i zapożyczeń semantycznych nie została do tej pory odnotowana w literaturze przedmiotu ani w słownikach języka polskiego (Uniwersalnym słowniku języka polskiego pod red. S. Dubisza oraz Słowniku języka polskiego PWN pod red. L. Drabik i E. Sobol). Niniejsza monografia jest ilustracją tezy, że we współczesnej polszczyźnie stale wzrasta liczba angielskich zapożyczeń semantycznych oraz kalk frazeologicznych (kalki leksykalne są stosunkowo nieliczne). Są one wzajemnie od siebie zależne, tzn. - jak pokazała niniejsza analiza - powstawanie zapożyczeń semantycznych sprzyja powstawaniu kalk, a powstawanie kalk sprzyja powstawaniu zapożyczeń semantycznych. Kalki, które nie zawierają wyrazu użytego w nowym znaczeniu pod wpływem obcym (a zatem zapożyczenia semantycznego) są bowiem stosunkowo nieliczne. I odwrotnie - większość zapożyczeń semantycznych pojawia się razem z kalkami je zawierającymi. Jak wskazuje niniejsza praca, angielskie zapożyczenia semantyczne i kalki frazeologiczne nie są nieznaczną i niewielką grupą w porównaniu do anglicyzmów leksykalnych; nie tylko ich liczba, ale także rola w języku polskim stale się powiększa. Są one szczególnie widoczne w języku specjalistycznym, takim jak język informatyki; język taki, co istotne, podlega nieustannym zmianom, co jest odbiciem stałego rozwoju technologicznego. Badania nad zapożyczeniami semantycznymi i kalkami, zwłaszcza -choć nie wyłącznie - w szybko zmieniającym się języku specjalistycznym, są zatem koniecznością. Autor ma nadzieję, że niniejsza praca będzie postrzegana jako odpowiedź na taką konieczność

    24th Nordic Conference on Computational Linguistics (NoDaLiDa)

    A Cross-Linguistic Study of Metaphor Variation in Promotional Discourse of the Tourist Sector in Spanish, English and German: Implications for Translation

    [ES] Esta tesis se centra en la variación interlingüística del uso metafórico del lenguaje en sitios web turísticos promocionales en inglés británico, alemán de Alemania y castellano peninsular. A pesar de la importancia económica del turismo y la gran demanda de traducciones en este sector, el número de estudios sobre el uso de las metáforas en la promoción turística todavía es reducido. El volumen de publicaciones sobre la traducción de las metáforas en este campo es aún menor. Por ello, el presente estudio pretende colmar estos vacíos mediante la descripción del uso metafórico del lenguaje en este género para cada lengua, la comparación de los resultados y la exploración de las implicaciones que puede tener la variación observada para la traducibilidad y el proceso de traducción de las metáforas lingüísticas. Con este motivo se compilaron tres corpus comparables de páginas web turísticas promocionales de los países Inglaterra, Alemania y España, así como tres corpus léxicos más pequeños de 20.000 palabras cada uno. En un proceso de dos fases, los corpus léxicos se sometieron primero a un análisis manual exhaustivo que facilitó la identificación de grupos de metáforas con una combinación de dominios fuente y meta problemáticos desde el punto de vista traductológico. Estos grupos se estudiaron en la segunda fase en los corpus grandes mediante la búsqueda de vocabulario de los dominios fuente. El estudio adopta un marco teórico propio de la Lingüística Cognitiva, basándose principalmente en la Teoría de la Metáfora Conceptual. Una de las principales contribuciones de esta tesis doctoral consiste en la adaptación del probado procedimiento para la identificación de metáforas MIP (Pragglejaz, 2007) para su uso en un estudio comparativo de tres idiomas morfológicamente distintos. Además, se elaboró una tipología de esquemas de proyección (mapping schemes) y una descripción de los dominios fuente y meta más adecuados para los estudios y la práctica de la traducción que los ya existentes. Finalmente fue desarrollado una metodología para la determinación de la traducibilidad literal de las metáforas lingüísticas. Los resultados indican que el uso de la metáfora en los sitios web turísticos promocionales en los tres idiomas muestra grandes similitudes respecto a la existencia de diferentes tipos de metáfora y su distribución. Sin embargo, se observan diferencias en sus frecuencias, su realización lingüística preferida y sus principales funciones discursivas. A menudo, la variación interlingüística detectada en el uso de la metáfora se puede relacionar con los estilos claramente distintos de los sitios web promocionales en los tres idiomas. Los datos recopilados en este estudio proporcionan a los traductores datos acerca de qué tipo de metáfora puede o incluso debería ser aumentado o disminuido en un texto para lograr que una traducción suene natural, y como las supresiones debidas a las diferencias morfológicas pueden ser compensadas de la mejor manera, dependiendo de la combinación de idiomas y el sentido de la traducción.[CA] Aquesta tesi se centra en la variació interlingüística de l'ús metafòric del llenguatge en llocs web turístics promocionals en anglés britànic, alemany d'Alemanya i castellà peninsular. Malgrat la importància econòmica del turisme i la gran demanda de traduccions en aquest sector, el nombre d'estudis sobre l'ús de les metàfores en la promoció turística encara és reduït. El volum de publicacions sobre la traducció de les metàfores en aquest camp és encara menor. Per això, el present estudi pretén satisfer aquests buits mitjançant la descripció de l'ús metafòric del llenguatge en aquest gènere per a cada llengua, la comparació dels resultats i l'exploració de les implicacions que pot tindre la variació observada per a la traduïbilitat i el procés de traducció de les metàfores lingüístiques. Amb aquest motiu es van compilar tres corpus comparables de pàgines web turístiques promocionals dels països d' Anglaterra, Alemanya i Espanya, així com tres corpus lèxics més xicotets de 20.000 paraules cadascun. En un procés de dues fases, els corpus lèxics es van sotmetre primer a una anàlisi manual exhaustiva que va facilitar la identificació de grups de metàfores amb una combinació de dominis font i meta problemàtics des del punt de vista traductològic. Aquests grups es van estudiar en la segona fase en els corpus grans mitjançant la cerca de vocabulari dels dominis font. L'estudi adopta un marc teòric propi de la Lingüística Cognitiva, basant-se principalment en la Teoria de la Metàfora Conceptual. Una de les principals contribucions d'aquesta tesi doctoral consisteix en l'adaptació del provat procediment per a la identificació de metàfores MIP (Pragglejaz, 2007) per al seu ús en un estudi comparatiu de tres idiomes morfològicament diferents. A més a més, es va elaborar una tipologia d'esquemes de projecció (mapping schemes) i una descripció dels dominis font i meta més adequats per als estudis i la pràctica de la traducció que els ja existents. Finalment, va ser desenvolupat una metodologia per a la determinació de la traduïbilitat literal de les metàfores lingüístiques. Els resultats indiquen que l'ús de la metàfora en els llocs web turístics promocionals en els tres idiomes mostra grans similituds respecte a l'existència de diferents tipus de metàfora i la seua distribució. No obstant això, s'observen diferències en les seues freqüències, la seua realització lingüística preferida i les seues principals funcions discursives. Sovint, la variació interlingüística detectada en l'ús de la metàfora es pot relacionar amb els estils clarament diferents dels llocs web promocionals en els tres idiomes. Les dades recopilades en aquest estudi proporcionen als traductors dades sobre quina mena de metàfora pot o fins i tot hauria de ser augmentat o disminuït en un text per a aconseguir que una traducció sone natural, i com les supressions degudes a les diferències morfològiques poden ser compensades de la millor manera, depenent de la combinació d'idiomes i el sentit de la traducció.[EN] This dissertation focusses on the cross-linguistic variation of metaphorical language use on promotional tourism websites in British English, German of Germany and European Spanish. Despite the economic impact of the tourism industry and the high demand for translations in this branch, only few studies have ventured into metaphor use in tourism promotion so far. Research into metaphor translation in this field is even scarcer. The present study aims to fill these voids by describing metaphorical language use of this register for each language, comparing the results with the other two languages, and by seeking possible implications of the observed variation for the translatability as well as the translation process of metaphor vehicles. For this purpose, three comparable corpora of regional promotional tourism websites from England, Germany and Spain were compiled, as well as three smaller, 20,000-word sample corpora. In a two-step process, the sample corpora first underwent a comprehensive manual metaphor analysis, which helped to identify metaphor groups with a source-target domain combination that is problematic from a translational point of view. These groups were further studied in the large corpora using source-domain vocabulary searches. The study was approached from a Cognitive Linguistics perspective, building mainly on Conceptual Metaphor Theory. One of the main contributions of this dissertation lies in the adaptation of the widely used metaphor identification procedure MIP (Pragglejaz, 2007) for the cross-linguistic comparison of the morphologically different research languages. Furthermore, a typology of mapping schemes and a description of the source and target domains were suggested which suit translation purposes better than existing ones. Finally, a methodology for the determination of the literal translatability of metaphor vehicles was developed. The findings suggest that the metaphor use on promotional tourism websites in the three languages is largely similar with regard to the existence of different metaphor types and their distribution. However, differences can be found in their frequencies, their preferred linguistic realisation and their main discursive functions. The observed cross-linguistic variation in metaphor use can often be related to the markedly distinct styles of the promotional websites in the three languages. The data gathered in this study provide translators with information about which type of metaphor can or even should be reduced or increased in number in order to achieve a natural sounding translation and how morphologically necessary suppressions can best be compensated for, depending on the language pair and translation direction.Stepins, KV. (2022). A Cross-Linguistic Study of Metaphor Variation in Promotional Discourse of the Tourist Sector in Spanish, English and German: Implications for Translation [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/182290TESI