research

Programari per a la personalització de motors de TA. Anàlisi de productes

Abstract

L'objectiu d'aquest Treball de Fi de Màster és analitzar programari que permet la personalització de motors de TA. Amb aquest propòsit s'han escollit 6 eines diferents (Machine Translation Training Tool, ModernMT, MTradumàtica, LetsMT, KantanMT i Microsoft Translation Hub) i s'ha investigat la seva instal·lació i el seu entrenament. A més, es proporciona una explicació teòrica sobre els sistemes de TA, la qualitat en TA i el seu estat de la qüestió. De la mateixa manera, es descriuen amb precisió els recursos que s'han utilitzat durant el treball, les característiques principals de les eines, la creació dels dos corpus i la instal·lació i l'entrenament del programari. Amb els motors ja entrenats s'ha preparat un resum de les característiques més importants de cada eina i una anàlisi de la qualitat de la TA. A banda d'aquests resultats, aquest treball subratlla els mètodes relatius a la instal·lació i a l'entrenament dels programes.El objetivo de este Trabajo de Fin de Máster es analizar software que permite la personalización de motores de TA. Con este propósito se han escogido 6 herramientas distintas (Machine Translation Training Tool, ModernMT, MTradumàtica, LetsMT, KantanMT y Microsoft Translation Hub) y se ha indagado acerca de su instalación y de su entrenamiento. Además, se han creado dos corpus (chino-catalán y francés-catalán) para entrenar los motores de estos programes con combinaciones lingüísti-cas concretas. Así, se proporciona una explicación teórica acerca de los sistemas de TA, de la calidad en TA y de su estado de la cuestión. De la misma manera, se describen con precisión los recursos que se han utilizado a lo largo de este trabajo, las características principales de las herramientas, la crea-ción de los dos corpus y la instalación y el entrenamiento del software. Con los motores ya entrenados se ha preparado un resumen de las características más relevantes de cada herramienta y un análisis de la calidad de la TA. A parte de estos resultados, este trabajo subraya los métodos relativos a la ins-talación y al entrenamiento de los programas.The aim of this Master's Degree Dissertation is analyzing software that allows engine customization of Machine Translation. With this purpose 6 different tools (Machine Translation Training Tool, Mo-dernMT, MTradumàtica, LetsMT, KantanMT and Microsoft Translation Hub) have been chosen and their installation and their engine training have been explored. Moreover, two corpus (chinese-catalan and french-catalan) have been created in order to train the engines with specific linguistic combina-tions. A theoretical explanation about MT systems, quality in MT and its state-of-the-art is provided. Likewise, the resources used during this dissertation, the tools' main features, every single step of the creation of both corpus and the installation and the training of the software is described. Once the engines have been trained, a summary of the most significant features of each tool and the analysis of the quality of the MT are given. Apart from these results, this dissertation highlights the methods of the installation and the training

    Similar works