    TMX: Intercambio de memorias de traducción

    En aquest article presentem TMX (Translation Memory eXchange), el format estàndard d'intercanvi de memòries de traducció. Repassarem el concepte de memòria de traducció i els seus usos, que les converteixen en un dels principals recursos per al traductor. Veurem les estratègies per recuperar de manera ràpida els segments més similars als que estem traduint i els mecanismes per ordenar els segments recuperats segons la seva similitud amb el segment a traduir. Presentarem breument les especificacions del format TMX i els seus diferents nivells i analitzarem el grau d'acceptació d'aquest format entre les eines de traducció assistida.In this paper the standard format for translation memories interchange (TMX) is presented. We review the concept of translation memory and its uses. We also present strategies for quick access to the most similar segments to the one being translated and the ways to sort the retrieved segments according to similarity. The specifications of the TMX format and its levels will be presented. We analyze the degree of implementation of this format in CAT toolsEn este artículo presentamos el TMX (Translation Memory eXchange), el formato estándar de intercambio de memorias de traducción. Repasaremos el concepto de memoria de traducción y sus usos que las convierten en uno de los principales recursos para el traductor. Veremos las estrategias para recuperar de manera rápida los segmentos más similares a que estamos traduciendo y los mecanismos para ordenar los segmentos recuperados según su similitud con el segmento a traducir. Se analizarán los formatos internos de las memorias de traducción en las principales herramientas de traducción asistida y se verá la importancia de disponer de un formato de intercambio que sea estándar, versátil y que permita su evolución para adaptarse a las nuevas necesidades.Presentaremos brevemente las especificaciones del formato TMX y sus diferentes niveles y analizaremos el grado de aceptación de este formato entre las herramientas de traducción asistida. Finalmente presentaremos algunas de las propuestas de futuro para este formato

    El corpus paral·lel del Diari Oficial de la Generalitat de Catalunya

    In this paper the process of compilation of the parallel corpus from the Official Diary of the Catalan Government (DOGC) is presented. It describes the downloading process, the tools and processes for the treatment and linguistic analysis. The final result is a big parallel corpus that is freely available in several formats and with several annotation levels. This corpus is a very valuable resource for different applications. As example, three possible fields of application are described: as a translation memory to be used in a Computer-Assisted Translation tool; for terminology extraction and query and for training statistical machine translation systems.En este trabajo se presenta el proceso de compilación del corpus paralelo del Diario Oficial de la Generalitat de Catalunya (DOGC). Describe el proceso de descarga, las herramientas y los procesos para el tratamiento y el análisis lingüístico. El resultado final es un gran corpus paralelo que está disponible gratuitamente en varios formatos y con varios niveles de anotación. Este corpus es un recurso muy valioso para diferentes aplicaciones. Como ejemplo, se describen tres posibles campos de aplicación: como una memoria de traducción para ser utilizada en una herramienta de traducción asistida por computadora; para la extracción y consulta de terminología y para la formación de sistemas estadísticos de traducción automática.En aquest treball es presenta el procés de compilació del corpus paral·lel del Diari Oficial de la Generalitat de Catalunya (DOGC). Descriu el procés de descàrrega, les eines i els processos per al tractament i l'anàlisi lingüística. El resultat final és un gran corpus paral·lel que està disponible gratuïtament en diversos formats i amb diversos nivells d'anotació. Aquest corpus és un recurs molt valuós per a diferents aplicacions. Com a exemple, es descriuen tres possibles camps d'aplicació: com una memòria de traducció per ser utilitzada en una eina de traducció assistida per computadora; per a l'extracció i consulta de terminologia i per a la formació de sistemes estadístics de traducció automàtica

    The financial performance of an innovative megaproject

    The financial structure of megaprojects, known in the literature as project finance, is characterized by the creation of a legally independent project company financed with a concentrated equity ownership and a high level of non-recourse debt. Research in this field may yield new ideas and theories about the existing theoretical framework on capital structure, stakeholder management and risk management. A case-study is analyzed in this paper: the financial performance of the first metro line in Seville (Spain). In spite of previous cost overruns in the construction stage, the present operation stage is considered successful from the point of view of social and financial profitability, whereby the risks have been theoretically transferred to stakeholders, as defined by Value for Money considerations. The objective of this study involves: first to determine whether this megaproject meets the expectations for which it was created in terms of hope of return of the shareholders, and the expectations of the economic and financial feasibility under a change of subsidy policies; and secondly to determine whether the conditions remain for not including the investment as public debt. This issue is crucial in a budgetary constraint context for the planning of future metro lines. By taking this first experience into account, this article also provides information for potential participants in the projects of the new metro lines, which are currently in the planning stage

    Effects of cardiorespiratory exercise on cognition in older women exposed to air pollution

    The aim was to analyze the effects of cardiorespiratory exercise and air pollution on cognition and cardiovascular markers in four groups of older women: the active/clean air group (AC), the active/polluted air group (AP), the sedentary/clean air group (SC), and the sedentary/polluted air group (SP). Active groups performed a training task based on progressive walking. Prior to and after the experiment, the following parameters were assessed: cognition, by Mini Mental State Examination (MMSE); maximum oxygen uptake (VO2max), estimated by the Six-Minute Walk Test (6mWT); heart rate (HR); and oxygen saturation (SpO2). There were significant differences (p < 0.05) between the AC and the SP in all the MMSE dimensions except “Registration”, and in all the physiological variables (VO2max, SpO2, HR). Aerobic exercise may be a protective factor against the effects that pollution have on cognition and on the mechanisms of oxygen transport

    Metodología y evaluación de la expansión del WordNet del gallego con WN-Toolkit

    In this paper the methodology and a detailed evaluation of the results of the expansion of the Galician WordNet using the WN-Toolkit are presented. This toolkit allows the creation and expansion of wordnets using the expand model. In our experiments we have used methodologies based on dictionaries and parallel corpora. The evaluation of the results has been performed both in an automatic and in a manual way, allowing a comparison of the precision values obtained with both evaluation procedures. The manual evaluation provides details about the source of the errors. This information has been very useful for the improvement of the toolkit and for the correction of some errors in the reference WordNet for Galician.En este artículo se presenta la metodología utilizada en la expansión del WordNet del gallego mediante el WN-Toolkit, así como una evaluación detallada de los resultados obtenidos. El conjunto de herramientas incluido en el WN-Toolkit permite la creación o expansión de wordnets siguiendo la estrategia de expansión. En los experimentos presentados en este artículo se han utilizado estrategias basadas en diccionarios y en corpus paralelos. La evaluación de los resultados se ha realizado de manera tanto automática como manual, permitiendo así la comparación de los valores de precisión obtenidos. La evaluación manual también detalla la fuente de los errores, lo que ha sido de utilidad tanto para mejorar el propio WN-Toolkit, como para corregir los errores del WordNet de referencia para el gallego.This research has been carried out thanks to the Project SKATeR (TIN2012-38584-C06-01 and TIN2012-38584-C06-04) supported by the Ministry of Economy and Competitiveness of the Spanish Government

    Methodology and evaluation of the Galician WordNet expansion with the WN-Toolkit

    In this paper the methodology and a detailed evaluation of the results of the expansion of the Galician WordNet using the WN-Toolkit are presented. This toolkit allows the creation and expansion of wordnets using the expand model. In our experiments we have used methodologies based on dictionaries and parallel corpora. The evaluation of the results has been performed both in an automatic and in a manual way, allowing a comparison of the precision values obtained with both evaluation procedures. The manual evaluation provides details about the source of the errors. This information has been very useful for the improvement of the toolkit and for the correction of some errors in the reference WordNet for Galician.En este artículo se presenta la metodología utilizada en la expansión del WordNet del gallego mediante el WN-Toolkit, así como una evaluación detallada de los resultados obtenidos. El conjunto de herramientas incluido en el WN-Toolkit permite la creación o expansión de wordnets siguiendo la estrategia de expansión. En los experimentos presentados en este artículo se han utilizado estrategias basadas en diccionarios y en corpus paralelos. La evaluación de los resultados se ha realizado de manera tanto automática como manual, permitiendo así la comparación de los valores de precisión obtenidos. La evaluación manual también detalla la fuente de los errores, lo que ha sido de utilidad tanto para mejorar el propio WN-Toolkit, como para corregir los errores del WordNet de referencia para el gallego.En aquest article es presenta la metodologia utilitzada en l'expansió del WordNet del gallec mitjançant el WN-Toolkit, així com una avaluació detallada dels resultats obtinguts. El conjunt d'eines inclòs en el WN-Toolkit permet la creació o expansió de wordnets seguint l'estratègia d'expansió. En els experiments presentats en aquest article s'han utilitzat estratègies basades en diccionaris i en corpus paral·lels. L'avaluació dels resultats s'ha realitzat de manera tant automàtica com a manual, permetent així la comparació dels valors de precisió obtinguts. L'avaluació manual també detalla la font dels errors, la qual cosa ha estat d'utilitat tant per millorar el propi WN-Toolkit, com per corregir els errors del WordNet de referència per al gallec

    "Robinson Crusoe": creación de la edición electrónica bilingüe. El proyecto InLéctor

    Actualmente el libro electrónico va ganando territorio en el mercado editorial pero sigue siendo un proceso lento y costoso. Para incentivar el uso del libro electrónico se pueden ofrecer prestaciones adicionales que mejoren la experiencia lectora del usuario. Una de estas mejoras puede ser ofrecer conjuntamente el texto original y el traducido. El presente trabajo explica el proceso de creación del libro electrónico bilingüe de la novela Robinson Crusoe de Daniel Defoe para ser incorporada al proyecto InLéctor. Este proyecto pretende crear herramientas para la creación de libros electrónicos bilingües interactivos. Este proyecto se lleva a cabo en el grupo de investigación Language Processing Group (LPG) de la Universitat Oberta de Catalunya (UOC). Las obras y las traducciones literarias que se publican son de dominio público. Los programas desarrollados se basan en software libre y se publicarán también bajo una licencia libre.Nowadays the electronic book is gaining territory in the literary market but it is still a slow and expensive process. To encourage the use of the electronic book it is posible to offer additional features that will improve the user's reading experience. One of these improvements can be the offer of the original text and the translated text together. This project consists of the creation of interactive bilingual ebooks. This project is carried out in the research group Language Processing Group (LPG) of the Universitat Oberta de Catalunya (UOC). The published originals and translations are in the public domain. The developed programs are based on free software and will also be published under a free license

    Unconventional data, unprecedented insights: leveraging non-traditional data during a pandemic

    Introduction: The COVID-19 pandemic prompted new interest in non-traditional data sources to inform response efforts and mitigate knowledge gaps. While non-traditional data offers some advantages over traditional data, it also raises concerns related to biases, representativity, informed consent and security vulnerabilities. This study focuses on three specific types of non-traditional data: mobility, social media, and participatory surveillance platform data. Qualitative results are presented on the successes, challenges, and recommendations of key informants who used these non-traditional data sources during the COVID-19 pandemic in Spain and Italy. Methods: A qualitative semi-structured methodology was conducted through interviews with experts in artificial intelligence, data science, epidemiology, and/or policy making who utilized non-traditional data in Spain or Italy during the pandemic. Questions focused on barriers and facilitators to data use, as well as opportunities for improving utility and uptake within public health. Interviews were transcribed, coded, and analyzed using the framework analysis method. Results: Non-traditional data proved valuable in providing rapid results and filling data gaps, especially when traditional data faced delays. Increased data access and innovative collaborative efforts across sectors facilitated its use. Challenges included unreliable access and data quality concerns, particularly the lack of comprehensive demographic and geographic information. To further leverage non-traditional data, participants recommended prioritizing data governance, establishing data brokers, and sustaining multi-institutional collaborations. The value of non-traditional data was perceived as underutilized in public health surveillance, program evaluation and policymaking. Participants saw opportunities to integrate them into public health systems with the necessary investments in data pipelines, infrastructure, and technical capacity. Discussion: While the utility of non-traditional data was demonstrated during the pandemic, opportunities exist to enhance its impact. Challenges reveal a need for data governance frameworks to guide practices and policies of use. Despite the perceived benefit of collaborations and improved data infrastructure, efforts are needed to strengthen and sustain them beyond the pandemic. Lessons from these findings can guide research institutions, multilateral organizations, governments, and public health authorities in optimizing the use of non-traditional data.This project was primarily supported by Fulbright-Schuman Program. The project was partially supported by the Valencian Government (Convenio Singular signed with Generalitat Valenciana, Conselleria de Innovacion, Industria, Comercio y Turismo, Dirección General de Innovacion), which also partially supported NO

    Clusters and industrial districts: where is the literature going? Identifying emerging sub-fields of research

    Ingenio Working Paper SeriesThe industrial district and cluster literature has generated an extraordinary quantity of articles, debates, and topics for discussion, and encompasses one of the most vibrant lines of research in the field of economics, geography, management and related disciplines. The literature, however, is fairly fragmented. In this paper, bibliometric methods are used to analyze cluster literature published between 1957 and 2014 in order to explore prospective research priorities through the method of bibliographic coupling. Beyond focusing on foundational works in the past, this approach shifts the focus away from the practice of analyzing co-citations and seminal contributions to one of looking at current and emerging trends in the literature. Using the ISI-Web of Knowledge (Web of Science) as a database, examination of two samples of 3,955 and 2,419 articles is made. Results reveal the existence of sub-fields of inquiry that are following their own particular research agendas, which remain distinct yet interconnected to one another.N