Search CORE

3 research outputs found

Integrating optical character recognition and machine translation of historical documents

Author: Afli Haithem
Way Andy
Publication venue: COLING 2016 Organizing Committee Committee
Publication date: 01/12/2016
Field of study

Machine Translation (MT) plays a critical role in expanding capacity in the translation industry. However, many valuable documents, including digital documents, are encoded in non-accessible formats for machine processing (e.g., Historical or Legal documents). Such documents must be passed through a process of Optical Character Recognition (OCR) to render the text suitable for MT. No matter how good the OCR is, this process introduces recognition errors, which often renders MT ineffective. In this paper, we propose a new OCR to MT framework based on adding a new OCR error correction module to enhance the overall quality of translation. Experimentation shows that our new system correction based on the combination of Language Modeling and Translation methods outperforms the baseline system by nearly 30% relative improvement

Irish Universities

DCU Online Research Access Service

Avaluació de la traducció automàtica d'imatges mitjançant sistemes de reconeixement de text en dispositius mòbils : Google Translate Images i Microsoft Translator Images

Author: Páez Mérida María
Universitat Autònoma de Barcelona. Facultat de Traducció i d'Interpretació
Publication venue
Publication date: 01/01/2020
Field of study

Aquest treball presenta un exercici d'avaluació de resultats de traducció automàtica mitjançant les aplicacions mòbils de traducció d'imatges Google Translate Images i Microsoft Translator Images, en la combinació d'idiomes anglès espanyol. Es comprova la seva potencial funcionalitat per al públic general i els professionals de la traducció. La investigació presenta un marc teòric a mode d'aproximació al concepte de qualitat en la indústria de la traducció, més concretament en la traducció automàtica, així com a les diferents aplicacions de la intel·ligència artificial en la traducció d'imatges; a la secció pràctica s'avaluen i comparen els resultats de TA de Google i Microsoft a partir d'una mostra d'imatges seleccionades aleatòriament.Este trabajo presenta un ejercicio de evaluación de resultados de traducción automática mediante las aplicaciones móviles de traducción de imágenes Google Translate Images y Microsoft Translator Images, en la combinación de idiomas inglés español. Se comprueba su potencial funcionalidad para el público general y los profesionales de la traducción. La investigación introduce un marco teórico a modo de aproximación al concepto de calidad en la industria de la traducción, más concretamente en la traducción automática, así como a las distintas aplicaciones de la inteligencia artificial en la traducción de imágenes; en la sección práctica se evalúan y comparan los resultados de TA de Google y Microsoft a partir de un muestrario de imágenes seleccionadas aleatoriamente.This paper presents an exercise in evaluating machine translation results using the mobile image translation applications Google Translate Images and Microsoft Translator Images in the English Spanish language combination. Its potential functionality for the general public and translation professionals is verified. The research presents a theoretical framework as an approach to the concept of quality in the translation industry, more specifically in machine translation, as well as the different applications of artificial intelligence in image translation; in the practical section, Google and Microsoft MT results are evaluated and compared from a sample of randomly selected images

Diposit Digital de Documents de la UAB

Integrating optical character recognition and machine translation of historical documents

Author: Afli Haithem
Way Andy
Publication venue: COLING 2016 Organizing Committee Committee
Publication date: 01/12/2016
Field of study

Irish Universities