Ezagutza baseak itzultzaile neuronaletan

Abstract

Proiektu honetan itzulpen automatikoko sistemetan kanpoko ezagutza sartzea aztertzen da gaur egungo arloaren egoeraren arkitekturan, Transformerran, itzulpenak hobetzeko asmoz. Testuetan maiz agertzen ez diren hitzak, domeinu jakin bateko hitz eta termino teknikoak izan ere, itzultzea zaila da itzultzaile automatikoentzat. Horregatik, kanpoko ezagutza sartzea onuragarria da emaitza hobeak lortzeko. RNNetan erabili diren hurbilpenak aztertzen dira eta Transformerrarentzako berri bat diseinatzen da, arkitektura honek erabiltzen duen teknologiaz aprobetxatuz, autoarreta. Emaitzak ebaluatzeko domeinu biomedikoko testuen itzulpenen kalitatea aztertzen da. SNOMED CT ontologia klinikokoak batzen dituen terminoak eta hemendik ikasitako termino hauen errepresentazioak, word embeddingak, erabiltzen dira kanpoko ezagutza bezala

    Similar works