51 research outputs found

    Osittain automatisoitujen menetelmien käyttö suorien anglismien tunnistamiseen suomenkielisissä korpusaineistoissa

    Get PDF
    The goal of this thesis is to investigate methods that could help with harvesting neologisms and more specifically anglicisms (i.e. English-sourced borrowings) in Finnish language. The work is partially motivated by the Global Anglicism Database project to gather anglicisms from various languages, which can serve both as an anglicism dictionary and researchers as a source of information for studying language contact and borrowing either in depth for a specific language or cross-linguistically. A systematic way of harvesting anglicisms in current Finnish language from a suitable corpus is devised. The research examines what kinds of data sources suitable for this goal are available, and what would be the criteria for a useful data source; how to use a data source like that to prepare a good list of anglicisms candidates so that there would be as little irrelevant material as possible but so that no anglicisms would not be lost in the process, and how could the candidates be scored so that the more probable anglicisms would appear closer to the top of a candidate list. Several of Language Bank's Finnish language monolingual corpora are considered. The most important criteria are identified to be the size and genre of the corpus and its annotation. The criteria are explored from the description of corpora on Language Bank's website and available literature and by hands-on examination of the data. Other important measures of corpus suitability are the amount of unannotated foreign language material, amount of noise, and potential anglicism proportion in the corpora. This information is gained via meticulous exploration of random samples of the corpora neologism candidate lists and evaluation on previously gained anglicism set. A combination of two corpora with good coverage of known anglicisms and relatively low amount of noise is chosen as the dataset for the next phase of the anglicism identification process. Anglicism candidate lists are prepared by a process of removing tokens irrelevant for anglicism harvesting. That includes an identifiable part of foreign language material in the corpus, formally recognizable noise, known lemmas of the words that were present in Finnish language around the time just before the major influx of English borrowings to Finnish language started, and their inflected forms. Several methods of scoring candidates are devised that would assign better scores to tokens with higher probability to be an anglicism. The score is based on tokens' frequency in the corpus and relative frequency of the character-level n-grams made out of tokens in representative purely English and purely Finnish corpora. The tokens in the candidate list are scored and ordered, and the resulting list is evaluated based on the ranking of a set of previously identified anglicisms. The method is proved to be somewhat effective; the resulting average ranking of known anglicisms is better than it would be in a randomly sorted candidate list

    A comparison of Czech and Austrian regulation of unfair competition with special regard to the regulation of false advertisement

    No full text
    59 "podstatně" vztahuje k jednotlivým osobám.164 V případě druhé části skutkové podstaty, která upravuje oblast B2C se nevyžaduje ani soutěžní vztah, ani citelný přesun poptávky. Spotřebitel se chrání před nekalými obchodními praktikami zcela.165 Závěr Poznávaní cizích právních řádů může být inspirativní nejen pro zákonodárce, ale může být také přínosem pro práci právníků v praxi. České a rakouské právo mají mnoho společného. Oba právní řády spočívají na římskoprávních základech a jsou součástí kontinentální právní kultury. Podobné rysy mohou být dány také společnou právní historií. Základem právní úpravy nekalé soutěže jsou v Rakousku i v České republice mezinárodní smlouvy, zejména Pařížská unijní úmluva. Kromě mezinárodněprávních závazku má největší vliv na úpravu nekalé soutěže resp. na sbližování právních předpisů v této oblasti, komunitární právo. Klíčový význam mají zejména dvě směrnice, směrnice o klamavé a srovnávací reklamě a směrnice o klamavých obchodních praktikách. Při zkoumání současných i v minulosti platných právních úprav nekalé soutěže lze dospět k závěru, že právní úprava rakouská má mnoho společného s předválečnou úpravou v ZPNS. Důvodem podobností je zřejmě společný vzor, kterým byl německý zákon proti nekalé soutěži z roku 1909. V Rakousku je právo nekalé soutěže upraveno, stejně jako..
    • …
    corecore