Search CORE

2 research outputs found

Kieltoilmaisujen säilyminen konekäännöksessä – tutkimus ranska- suomi-käännösten laadusta Googlen kääntäjällä

Author: Sirén Janne
Publication venue: fi=Turun yliopisto|en=University of Turku|
Publication date: 18/06/2015
Field of study

Tutkimuksen aiheena on kieltoilmaisujen kääntyminen Google-kääntäjällä ranskasta suomeen. Tutkimuksessa käsitellään yksinkertaisen kiellon ne pas, kaksoiskiellon ni ni sekä kieltoilmaisujen ne plus, ne rien, ne jamais, ne aucun ja ne personne käännöksissä ilmeneviä virheitä. Hypoteesina oli, että kiellon jääminen pois näiden kieltoilmaisujen käännöksissä voi muuttaa sanoman merkityksen päinvastaiseksi. Tutkimusmenetelmänä oli satunnaisten ranskankielisten näytelauseiden kääntäminen Google-kääntäjällä suomeksi ja tulosten arviointi kieltoilmaisun käännöksen onnistumisen kannalta ja sen osalta, kääntyykö merkitys päinvastaiseksi, jos kielto jää pois. Tutkimuksessa todettiin kiellon jäävän pois 58/108 lauseesta. Lauseista, joista kielto oli jäänyt pois, 16:n voidaan arvioida muuttuneen merkitykseltään päinvastaiseksi. Epäselviä tapauksia oli runsaasti käännösten heikon laadun vuoksi, mikä vaikeutti arviointityötä. Monissa tapauksissa kielto kääntyi vain osittain. Jos käännettävät lauseet ovat monimutkaisia ja niissä on enemmän kuin yksi kielto, käännös onnistuu yleensä tavanomaista huonommin. Google-kääntäjä on ns. tilastollinen konekääntäjä, eli sen käännösten onnistumiseen vaikuttaa oleellisesti käytettävissä olevien yksi- ja monikielisten sanastojen ja kaksi- tai monikielisten käännösten määrä ja laatu. Konekääntäjien käytettävissä olevaa suomenkielistä sanasto- ja käännösmateriaalia pitäisikin saada lisätyksi. Konekääntäjien tulosten laadun parantamisella on oleellista vaikutusta tulevaisuuden käännöskustannusten kehittymisen ja ylipäätään lisääntyvien käännöstarpeiden tyydyttämisen kannalta.Siirretty Doriast

UTUPub

Statistical machine translation system and computational domain adaptation

Author: Dunđer Ivan
Publication venue
Publication date: 01/01/2015
Field of study

Statističko strojno prevođenje temeljeno na frazama jedan je od mogućih pristupa automatskom strojnom prevođenju. U radu su predložene metode za poboljšanje kvalitete strojnog prijevoda prilagodbom određenih parametara u modelu sustava za statističko strojno prevođenje. Ideja rada bila jest izgraditi sustave za statističko strojno prevođenje temeljeno na frazama za hrvatski i engleski jezik. Sustavi su trenirani za dva jezična smjera, na dvije domene, na paralelnim korpusima različitih veličina i obilježja za hrvatsko-engleski i englesko-hrvatski jezični par, nakon čega proveden postupak ugađanja sustava. Istraženi su hibridni sustavi koji objedinjuju značajke obiju domena. Time je ispitan izravan utjecaj adaptacije domene na kvalitetu automatskog strojnog prijevoda hrvatskog jezika, a nova saznanja mogu koristiti pri izgradnji novih sustava. Provedena je automatska i ljudska evaluacija (vrednovanje) strojnih prijevoda, a dobiveni rezultati uspoređeni su s rezultatima strojnih prijevoda dobivenih primjenom postojećih web servisa za statističko strojno prevođenje.Phrase-based statistical machine translation is one of possible automatic machine translation approaches. This work proposes methods for increasing the quality of machine translation by adapting certain parameters in the statistical machine translation model. The idea was to build phrase-based statistical machine translation systems for Croatian and English language. The systems were be trained for two directions, on two domains, on parallel corpora of different sizes and characteristics for Croatian-English and English-Croatian language pair, after which the tuning procedure was conducted. Afterwards, hybrid systems which combine features of both domains were investigated. Thereby the direct impact of domain adaptation on the quality of automatic machine translation of Croatian language was explored, whereas new findings can be utilised for building new systems. Automatic and human evaluation of machine translations were carried out, while obtained results were compared with results obtained from applying existing statistical machine translation web services

Repozitorij Filozofskog fakulteta u Zagrebu' at University of Zagreb

Digitalni arhiv Filozofskog fakulteta u Zagrebu