12,444 research outputs found

    English semantic loans, loan translations, and loan renditions in informal Polish of computer users

    Get PDF
    Głównym celem niniejszej monografii jest całościowe opisanie zapożyczeń semantycznych oraz kalk leksykalnych i frazeologicznych (dokładnych i niedokładnych) w polskim języku informatyki (w jego odmianie potocznej). Celem dodatkowym jest obszerne omówienie teoretyczne problematyki zapożyczeń semantycznych i kalk, a w szczególności wskazanie rozbieżności oraz różnego rodzaju luk w stanowiskach badaczy zajmujących się ww. typami zapożyczeń, a także podkreślenie trudności metodologicznych, przed jakimi staje językoznawca je badający. Wspomniane trudności dotyczą przede wszystkim niejasnych kryteriów wyodrębniania zapożyczeń semantycznych i kalk od jednostek nimi niebędących: opisano zatem szczegółowo proces różnicowania pomiędzy zapożyczeniami semantycznymi a rodzimymi neosemantyzmami, zapożyczeniami semantycznymi a (ponownymi) zapożyczeniami leksykalnymi, kalkami frazeologicznymi a rodzimymi neofrazeologizmami, kalkami a zapożyczeniami leksykalnymi, zapożyczeniami semantycznymi a kalkami frazeologicznymi, kalkami frazeologicznymi dokładnymi a niedokładnymi oraz półkalkami a hybrydami. Autor zaproponował tutaj własne kryteria pomocne w odróżnianiu ww. zjawisk językowych. Podstawą badań jest samodzielnie zebrany przez autora monografii korpus polszczyzny specjalistycznej. W jego skład wchodzą krótkie notki (wpisy, posty) pochodzące z wybranych 32 forów internetowych o tematyce komputerowo-internetowej. Z każdego z 32 forów zebrano próbki wypowiedzi użytkowników (każda próbka liczy między 20.000 a 60.000 słów; w większości przypadków ich wielkość waha się pomiędzy 45.000 a 55.000 słów). Łączna wielkość korpusu to ponad półtora miliona słów (1.541.449) rozumianych ortograficznie, tj. jako szereg liter oddzielonych spacją. Korpus jest zatem stosunkowo duży i może być uznany za w pełni reprezentatywny dla nieformalnej polszczyzny informatycznej. Jest on bardzo zróżnicowany tematycznie, zawiera bowiem wpisy dotyczące zarówno sprzętu komputerowego (jednostki centralne, procesory, twarde dyski, wentylatory chłodzące, obudowy, drukarki, pamięci, myszy, klawiatury, słuchawki, skanery itd.), jak i oprogramowania (systemy operacyjne, edytory tekstu, arkusze kalkulacyjne, gry komputerowe, programowanie itd.) oraz Internetu (przeglądarki internetowe, komuni katory, programy antywirusowe, wirusy itd.). Autor stoi na stanowisku, że własnoręcznie zebrany korpus jest znacznie cenniejszym narzędziem badawczym niż gotowe korpusy dostępne w Internecie (takie jak Narodowy Korpus Języka Polskiego), które nie są najwłaściwszym wyborem dla celów badań nad językiem specjalistycznym. Korpus taki jest również lepszą podstawą badań niż artykuły prasowe zamieszczane w prasie komputerowej, które często są adaptacjami tekstów, które powstały wcześniej w języku angielskim. Praca zawiera także omówienie języka Internetu, ze szczególnym uwzględnieniem forów internetowych. Bardzo dokładnie opisano również proces tworzenia własnego korpusu językowego, zarówno od strony technicznej, jak i metodologiczno-materiałowej. W pracy zebrano i dokładnie opisano 204 typy angielskich zapożyczeń semantycznych (derywaty nie są traktowane jako odrębne typy, zatem np. formy akcelerator i akceleracja są traktowane jako ten sam typ), które wystąpiły łącznie 42.638 razy w korpusie oraz 529 typów angielskich kalk (16 leksykalnych i 513 frazeologicznych; 440 kalk dokładnych oraz 89 niedokładnych), które wystąpiły łącznie 8.228 razy. Tym samym niniejsza monografia jest - wedle najlepszej wiedzy autora - najobszerniejszym omówieniem ww. typów zapożyczeń w potocznym języku informatyki. Co istotne, większość omówionych kalk i zapożyczeń semantycznych nie została do tej pory odnotowana w literaturze przedmiotu ani w słownikach języka polskiego (Uniwersalnym słowniku języka polskiego pod red. S. Dubisza oraz Słowniku języka polskiego PWN pod red. L. Drabik i E. Sobol). Niniejsza monografia jest ilustracją tezy, że we współczesnej polszczyźnie stale wzrasta liczba angielskich zapożyczeń semantycznych oraz kalk frazeologicznych (kalki leksykalne są stosunkowo nieliczne). Są one wzajemnie od siebie zależne, tzn. - jak pokazała niniejsza analiza - powstawanie zapożyczeń semantycznych sprzyja powstawaniu kalk, a powstawanie kalk sprzyja powstawaniu zapożyczeń semantycznych. Kalki, które nie zawierają wyrazu użytego w nowym znaczeniu pod wpływem obcym (a zatem zapożyczenia semantycznego) są bowiem stosunkowo nieliczne. I odwrotnie - większość zapożyczeń semantycznych pojawia się razem z kalkami je zawierającymi. Jak wskazuje niniejsza praca, angielskie zapożyczenia semantyczne i kalki frazeologiczne nie są nieznaczną i niewielką grupą w porównaniu do anglicyzmów leksykalnych; nie tylko ich liczba, ale także rola w języku polskim stale się powiększa. Są one szczególnie widoczne w języku specjalistycznym, takim jak język informatyki; język taki, co istotne, podlega nieustannym zmianom, co jest odbiciem stałego rozwoju technologicznego. Badania nad zapożyczeniami semantycznymi i kalkami, zwłaszcza -choć nie wyłącznie - w szybko zmieniającym się języku specjalistycznym, są zatem koniecznością. Autor ma nadzieję, że niniejsza praca będzie postrzegana jako odpowiedź na taką konieczność

    Design of a Controlled Language for Critical Infrastructures Protection

    Get PDF
    We describe a project for the construction of controlled language for critical infrastructures protection (CIP). This project originates from the need to coordinate and categorize the communications on CIP at the European level. These communications can be physically represented by official documents, reports on incidents, informal communications and plain e-mail. We explore the application of traditional library science tools for the construction of controlled languages in order to achieve our goal. Our starting point is an analogous work done during the sixties in the field of nuclear science known as the Euratom Thesaurus.JRC.G.6-Security technology assessmen

    English lexical and semantic loans in informal spoken Polish

    Get PDF
    Celem niniejszej monografii jest opisanie najnowszych anglicyzmów leksykalnych i semantycznych występujących we współczesnej potocznej polszczyźnie mówionej. Podstawą badań jest korpus złożony z 20 rozmów codziennych, nagranych, przetranskrybowanych i przeanalizowanych przez autora pracy. Korpus składa się z ponad 60 000 słów. Autor zdecydował się na badanie zapożyczeń w języku mówionym, jako że wyrazy obce w języku pisanym (zwłaszcza prasowym) zostały dość dobrze opisane, niewiele jest natomiast prac poświęconym zapożyczeniom — zwłaszcza semantycznym — w języku mówionym. Opisano zarówno poszczególne zapożyczenia (ich znaczenie, wymowę, kolokacje oraz kontekst, w jakim pojawiły się w korpusie), jak i scharakteryzowano je jako zjawisko globalne, czyli dokonano podziału zapożyczeń według rozmaitych kryteriów, na przykład według części mowy, częstotliwości ich występowania w korpusie czy też okresu, w którym trafiły do polszczyzny. Autor podjął również próbę ustalenia, w jakim stopniu pojawianie się zapożyczeń w języku mówionym jest zależne od tematu rozmowy i idiolektu rozmówców. Badania zilustrowano licznymi tabelami statystycznymi obrazującymi różne aspekty ilościowe i jakościowe znalezionych w korpusie zapożyczeń leksykalnych i semantycznych. W monografii opisano również różnorakie problemy metodologiczne, jakie stwarzało badanie zapożyczeń w języku mówionym. Autor zaproponował ponadto własną hipotezę na temat sposobów wprowadzania i rozprzestrzeniania się zapożyczeń semantycznych w polszczyźnie. Hipoteza ta związana jest z koncepcją „odpowiedników prymarnych”, stosowaną dotychczas w badaniach nad przyswajaniem i uczeniem się języków obcych. Wiele z opisanych w niniejszej pracy zapożyczeń leksykalnych i semantycznych nie zostało dotychczas opisanych w literaturze przedmiotu ani zarejestrowanych w słownikach języka polskiego czy wyrazów obcych. Takim zapożyczeniom poświęcono szczególną uwagę. Jednym z wniosków zawartych w pracy jest stwierdzenie, że o ile liczba zapożyczeń leksykalnych w języku mówionym w ostatnich latach nie wzrasta (co przeczy odczuciu większości Polaków), o tyle znacząco wzrosła liczba typów zapożyczeń semantycznych

    Building semantic user profile for Polish web news portal

    Get PDF
    We present our research at Onet, the largest Polish news portal, aimed at constructing meaningful user profiles that are most descriptive of their interests in the context of the media content they browse. We used two distinct state-of-the-art numerical text-representation techniques: LDA topic modeling and Word2Vec word embeddings. We trained our models on the corpora of articles in Polish and compare them with a baseline model built on a general language corpora.We compared the performance of algorithms on two distinct tasks - similar articles retrieval and users gender classification. Our results show that the choice of text representation depends on the task - Word2Vec is more suitable for text comparison, especially for short texts such as titles. In the user profiling task, the best performance was obtained with a combination of features: topics from the article text and word embeddings from the title

    “To mamy wpajane od dziecka” – a recipient passive in Polish?

    Get PDF
    The Polish construction mieć ‘have’ + passive participle has recently been discussed as a possible new perfect tense in the process of grammaticalization, but good arguments against this interpretation have been put forward: Semantically it is merely a resultative construction, and diachronically it has been attested with the same semantics since the beginning of literacy. However, a certain group of sentences with mieć + passive participle has not been paid sufficient attention so far. In these sentences the participle can be formed from an imperfective verb, it can be combined with a temporal adverbial referring to the time of the event and the subject is never the agent but the beneficiary. These constructions have to be classified as a recipient passive. In parallel with the Polish direct passive, there are three recipient-passive constructions (imperfective, perfective, resultative). Together with the resultative active, the constructions with mieć + passive participle fill a gap in the Polish voice system
    corecore