377 research outputs found

    Multilingual Information Framework for Handling textual data in Digital Media

    Get PDF
    This document presents MLIF (Multi Lingual Information Framework), a high-level model for describing multilingual data across a wide range of possible applications in the translation/localization process within several multimedia domains (e.g. broadcasting interactive programs within a multilingual community)

    Taking statistical machine translation to the student translator

    Get PDF
    Despite the growth of statistical machine translation (SMT) research and development in recent years, it remains somewhat out of reach for the translation community where programming expertise and knowledge of statistics tend not to be commonplace. While the concept of SMT is relatively straightforward, its implementation in functioning systems remains difficult for most, regardless of expertise. More recently, however, developments such as SmartMATE have emerged which aim to assist users in creating their own customized SMT systems and thus reduce the learning curve associated with SMT. In addition to commercial uses, translator training stands to benefit from such increased levels of inclusion and access to state-of-the-art approaches to MT. In this paper we draw on experience in developing and evaluating a new syllabus in SMT for a cohort of post-graduate student translators: we identify several issues encountered in the introduction of student translators to SMT, and report on data derived from repeated measures questionnaires that aim to capture data on students’ self-efficacy in the use of SMT. Overall, results show that participants report significant increases in their levels of confidence and knowledge of MT in general, and of SMT in particular. Additional benefits – such as increased technical competence and confidence – and future refinements are also discussed

    Bringing industry standards to Open Source localisers : a case study of Virtaal

    Get PDF
    The XML Localisation Interchange File Format (XLIFF) is an open standard promising interoperability and tool independence. It might be thought of as a natural fit for Open Source localisation, yet the Gettext PO format remains the de facto standard in Open Source localisation. We present a case study of the XLIFF implementation in Virtaal - an Open Source localisation tool supporting multiple formats. The primary target user group of Virtaal is made up of localisers of Open Source software - often volunteers. We study the implementation choices adopted by the developers with specific focus on the workflow metadata in XLIFF. In this regard we propose recommendations for simplification that hopefully improve XLIFF for use by a wider audience in future.El format XLIFF (XML Localisation Interchange Format) és un estàndard obert que vol facilitar la interoperabilitat en localització així com la independència d'eines específiques. Es podria considerar un format ideal per a la localització de programari de codi obert, però el format PO de Gettext continua sent l'estàndard de facto en aquest tipus d'entorns. En aquest article presentem un estudi de cas sobre la implementació de XLIFF en Virtaal, una eina per a la localització de programari de codi obert compatible amb diversos formats. Virtaal es dirigeix principalment a localitzadors de programari obert, que sovint són voluntaris. Hem estudiat les solucions que els desenvolupadors van adoptar durant la implementació, especialment en relació a les metadades relatives al flux de treball en XLIFF. En aquest sentit, proposem algunes recomanacions per simplificar aquest estàndard que esperem que puguin contribuir a millorar XLIFF i que pugui ser utilitzat per un major grup d'usuaris en el futur.El formato XLIFF (XML Localisation Interchange Format) es un estándar abierto pensado para facilitar la interoperabilidad y la independencia respecto a herramientas. A pesar de que XLIFF puede parecer una solución ideal para la localización de software de código abierto, el formato PO de gettext continúa siendo el estándar de facto en este tipo de entornos. En este artículo presentamos un estudio de caso sobre la implementación de XLIFF en Virtaal, una herramienta para la localización de software de código abierto compatible con varios formatos. Virtaal se dirige principalmente a los localizadores de software abierto, muchos de ellos voluntarios. Hemos estudiado las soluciones adoptadas por los desarrolladores durante su implementación, en especial las relacionadas con los metadatos de flujo de trabajo en XLIFF. En este sentido, hacemos algunas propuestas para simplificar este estándar que esperamos puedan contribuir a mejorar XLIFF y a ampliar su círculo de usuarios en el futuro

    The relevance of metadata during the localisation process: An experiment

    Get PDF
    [EN]In localisation, there is a constant need to automate processes in an attempt to reduce the cost and time associated with those processes. One of the main ways of achieving this objective is to reuse previously localised data and metadata by using standardised translation memory formats – such as the LISA Translation Memory eXchange (TMX) format or the OASIS XML Localisation Interchange File Format (XLIFF). Although XLIFF has emerged as the most desirable format for the exchange of localisation data, much work still needs to be done before it can be generalised to most localisation activities and can be implemented in a straightforward way. Our research aims to study the importance of the localisation metadata associated with the translation suggestions provided by computer-assisted translation (CAT) tools. We analysed the ways in which localisation data and metadata (D/M) can be represented in the current specification of XLIFF (i.e. XLIFF 1.2). We designed a new format called the Localisation Memory Container (LMC) to organise previously localised XLIFF files in a single container. Finally, we developed a prototype (XLIFF Phoenix) to leverage the D/M from the LMC to improve the translator’s task by helping CAT tools not only to produce more translation suggestions easily (similar to bi-text approaches), but also to enrich those suggestions with relevant metadata. In order to test whether the ‘CAT-orientated’ enriched metadata are helpful to the translator, we designed an experimental translation task using Swordfish II. Different levels of D/M were introduced in the same document for the different participants, which enabled us to study the influence of the D/M on the translation decision-making process and on the machine–human interaction. In this chapter, we present our research objectives, the methodology and procedures, and an analysis of the results of the experiment. Finally, we extract some preliminary conclusions about the importance of metadata during the localisation process, both as displayed in our experiment and as an integrated function of the tool’s automated capabilities

    Guía de formatos para la traducción

    Get PDF
    Amb aquest treball s'abordarà la qüestió dels formats relacionats amb la traducció.En este trabajo se abordará la cuestión de los formatos relacionados con la traducción.This project deals with the formats which are related to translation

    HANDLING MULTILINGUAL CONTENT IN DIGITAL MEDIA: A CRITICAL ANALYSIS

    No full text
    This document expresses and analyzes the need to define a generic method for representing multilingual information in multimedia data. It describes the basic requirements that would bear upon such representations and establishes the potential link with ISO committee TC 37/SC 4 (Language Resource Management) and with XMT (eXtended MPEG-4 Textual format)

    Cloud service localisation

    Get PDF
    The essence of cloud computing is the provision of software and hardware services to a range of users in dierent locations. The aim of cloud service localisation is to facilitate the internationalisation and localisation of cloud services by allowing their adaption to dierent locales. We address the lingual localisation by providing service-level language translation techniques to adopt services to dierent languages and regulatory localisation by providing standards-based mappings to achieve regulatory compliance with regionally varying laws, standards and regulations. The aim is to support and enforce the explicit modelling of aspects particularly relevant to localisation and runtime support consisting of tools and middleware services to automating the deployment based on models of locales, driven by the two localisation dimensions. We focus here on an ontology-based conceptual information model that integrates locale specication in a coherent way

    XLIFF y el traductor: ¿Por qué es importante?

    Get PDF
    XLIFF ha esdevingut el principal estàndard d'intercanvi de dades en localització, que només troba competència en el format PO quan es tracta de projectes de codi obert i que coexisteix amb el format LCX de projectes de localització en entorns de Microsoft. Tanmateix, mentre que cada vegada hi ha més grans empreses proveïdores de serveis d'internet i traducció que ofereixen o demanden traducció automàtica i humanan que acaben arribant a la conclusió que han de donar cobertura a aquest estàndard, els avantatges de l'ús de XLIFF es poden veure limitades si la integració amb els processos d'informació i comunicació multilingües d'aquestes empreses no va acompanyada del coneixement real de les necessitats dels traductors. D'altra banda, el format encara resulta àmpliament desconegut per traductors i aspirants a localitzadors, que són els que haurien de poder contribuir al seu desenvolupament i, especialment, a la implementació i impuls de XLIFF en els seus llocs de treball i en els projectes en què col·laboren. D'aquesta manera contribuirien a augmentar les possibilitats que XLIFF acabi convertintse en una eina cada vegada més útil. Aquesta mancança es deu en part a l'evident manca d'articles acadèmics que tractin sobre el sentit, el significat i la utilitat de XLIFF, que té en compte els problemes principals i el coneixement mitjà del traductor pel que a tasques de traducció i localització es refereix. L'article d'Ignacio García de 2006 titulat "Formatting and the Translator: Why XLIFF Does Matter?" Suposa una de les poques excepcions, tot i que principalment tracta sobre un únic aspecte de la relació entre el format estàndard i el projecte de traducció. L'article es proposa proporcionar una visió de l'estandar que sigui àmplia i alhora accessible per a l'usuari final: els traductors i els estudiants de traducció. En el present article presentem, a través d'exemples pràctics, com l'estàndard pot resultar d'impacte en la rutina diària dels traductors per obtenir el màxim profit del seu ús.XLIFF has become the main localisation data exchange standard, coming up against competitors only in open source projects with the PO format, and also coexisting with LCX in the Microsoft localisation environment. However, while more and more of the big internet services and translation provider companies offering or requiring machine and human translation realise that they must offer support for this standard, the advantages of XLIFF usage can be limited if integration with their multilingual information and communication processes is not matched with a real understanding of translators' needs. On the other hand, the format is still widely unknown by translators and aspiring localisers, who should be able to contribute to the development and, particularly, the implementation and leverage of XLIFF in their workplace and in the projects they are involved in, thus increasing the chances for XLIFF to evolve into a more and more useful tool. This gap is partly due to a glaring lack of academic articles dealing with the meaning, significance and usage of XLIFF which take into account the main concerns and the average knowledge of the translator as regards translation and localisation tasks. Ignacio García's 2006 "Formatting and the Translator: Why XLIFF Does Matter?" is one of few exceptions, although mostly dealing with just one aspect of the relationship between the standard format and the translation job.This paper aims at providing a comprehensive yet accessible view of the standard to its end users: translators and translation students. We will present, through practical examples, how the standard can have an impact in their daily routine and how they can make the most out of it.XLIFF se ha convertido en el principal estándard de intercambio de datos en localización, que solo encuentra competencia en el formato PO cuando se trata de proyectos de código abierto, y que coexiste con el formato LCX de proyectos de localización de entorno Microsoft. No obstante, mientras cada vez hay más grandes empresas proveedoras de servicios de internet y traducción de las que ofrecen o demandan traducción automática y humanan que acaban llegando a la conclusión de que deben dar cobertura a este estándar, lo cierto es que las ventajas del uso de XLIFF se pueden ver limitadas si la integración con los procesos de información y comunicación multilingües de estas empresas no va acompañada del entendimiento real de las necesidades de los traductores. Por otro lado, el formato todavía resulta ampliamente desconocido por traductores y aspirantes a localizadores, que son los que deberían poder contribuir a su desarrollo y, especialmente, a la implementación e impulso de XLIFF en sus lugares de trabajo y en los proyectos en los que colaboran. De este modo contribuirían a aumentar las posibilidades de que XLIFF acabe convirtiéndose en una herramienta cada vez más útil. Esta carencia se debe en parte a la flagrante falta de artículos académicos que traten sobre el sentido, el significado y la utilidad de XLIFF, que tiene en cuenta los problemas principales y el conocimiento medio del traductor en lo que a tareas de traducción y localización se refiere. El artículo de Ignacio García de 2006 titulado “Formatting and the Translator: Why XLIFF Does Matter?” supone una de las pocas excepciones, a pesar de que principalmente trata sobre un único aspecto de la relación entre el formato estándar y el proyecto de traducción. El artículo se propone proporcionar una visión del estandar que sea amplia y a la vez accesible para el usuario final: los traductores y los estudiantes de traducción. En el presente artículo presentamos, a través de ejemplos prácticos, cómo el estándar puede resultar de impacto en la rutina diaria de los traductores para obtener el máximo provecho de su uso

    Towards an Open Source Localisation Orchestration Framework

    Get PDF
    This paper describes the design and implementation of a novel environment for the inter-connectivity of distributed localisation components - both open source and proprietary - in response to the scarcity of relevant research in this area, as we view interoperability as being the key to the seamless integration of different entities. The proposed solution promotes interoperability through the adoption of a Service Oriented Architecture (SOA) framework based on established localisation standards. We describe a generic use scenario and the architecture of the environment that allows us to study interoperability issues in localisation processes. This environment was successfully demonstrated at the CNGL Public Showcase in Microsoft, Ireland, November 2010.Aquest article descriu el disseny i la implementació d'un nou entorn per a la interconnectivitat de components de localització distribuïts, tant de codi obert com a propietari, donant així resposta a l'escassetat d'estudis d'investigació rellevants en aquesta àrea, ja que considerem que la interoperabilitat és clau per aconseguir la integració completa de diferents entitats. La solució que proposem permet la interoperabilitat mitjançant un esquema d'arquitectura orientada a serveis (SOA) que es basa en els estàndards de localització habituals. Descriurem un escenari d'ús genèric i l'arquitectura de l'entorn que ens permetrà estudiar qüestions d'interoperabilitat en els processos de localització. Aquest entorn va ser presentat amb èxit en el CNGL Public Showcase que es va celebrar a la seu de Microsoft, Irlanda, el novembre de 2010.Este artículo describe el diseño y la implementación de un nuevo entorno para la interconectividad de componentes de localización distribuidos, tanto de código abierto como propietario, con el propósito de paliar la escasez de estudios de investigación relevantes en esta área. A nuestro entender, la interoperabilidad es clave para conseguir la integración completa de diferentes entidades. La solución que proponemos permite la interoperabilidad mediante un esquema de arquitectura orientada a servicios (SOA) que se basa en los estándares de localización habituales. Describiremos un escenario de uso genérico y la arquitectura del entorno que nos permitirá estudiar cuestiones de interoperabilidad en los procesos de localización. Este entorno fue presentado con éxito en el CNGL Public Showcase que se celebró en la sede de Microsoft en Irlanda en noviembre de 2010
    corecore