7,512 research outputs found
A Process Calculus for Molecular Interaction Maps
We present the MIM calculus, a modeling formalism with a strong biological
basis, which provides biologically-meaningful operators for representing the
interaction capabilities of molecular species. The operators of the calculus
are inspired by the reaction symbols used in Molecular Interaction Maps (MIMs),
a diagrammatic notation used by biologists. Models of the calculus can be
easily derived from MIM diagrams, for which an unambiguous and executable
interpretation is thus obtained. We give a formal definition of the syntax and
semantics of the MIM calculus, and we study properties of the formalism. A case
study is also presented to show the use of the calculus for modeling
biomolecular networks.Comment: 15 pages; 8 figures; To be published on EPTCS, proceedings of MeCBIC
200
The sonnets of Seamus Heaney in Spanish
This paper seeks to offer a more nuanced and further-reaching exploration of the translation of all of Seamus Heaney’s sonnets into a Spanish ‘collected’, lead by the Mexican poet Pura López-Colomé. Taking in critical thinking on creativity and the ‘post-colonial’ sonnet as well as Heaney’s and López-Colomé’s own views and metaphorics relating to literary translation, this paper asks not only what Sonetos brings to the originals, but what they bring also to poetry and translation. The paper argues that Sonetos offers a distinct insight into questions of semantic faithfulness and the translator’s visibility, but also that whilst we must eschew metaphysical or essentialist language in analysis, the project of Sonetos has also been to communicate not just original poetry’s, but also translation’s qualities as a strategy of (secular) revelation
Paraphrase or parasite? The Semiotic Stories of Translation
Translation, for Saussure, assumed the codified rule of language respecting the difference between synchronic and diachronic linguistics. Translation may be regarded as a theoretical possibility, though impossible for the creative speech of language speakers. Peirce’s logical semiotics reasoned the linguistic-and-cultural (linguïcultural) interpretants of received signs. Semiotranslation is a semiotic game to change the symbiosis of two languages into one language. Identified with both Saussure and Peirce, Jakobson’s intralingual, interlingual, and intersemiotic forms of translation propose rewording, translation proper, and transmutation. Peirce’s semiosis creates simple and complex symbols but navigates between translation, semiotranslation, and transduction. Translation derives from the para-functions of replicas in “paraphrase” and “parasite” to signify the multiplicity of ideas and trends in biotranslation. The source text can be re-organized into the iconic activity of Saussurean paraphrase; or the target text can be indexically recontextualized in the parasitical evolution of Peirce’s instinct and facts of life applied to arts — neither approaching pure science.publishedVersio
Text-to-Text Extraction and Verbalization of Biomedical Event Graphs
Biomedical events represent complex, graphical, and semantically rich interactions expressed in the scientific literature. Almost all contributions in the event realm orbit around semantic parsing, usually employing discriminative architectures and cumbersome multi-step pipelines limited to a small number of target interaction types. We present the first lightweight framework to solve both event extraction and event verbalization with a unified text-to-text approach, allowing us to fuse all the resources so far designed for different tasks. To this end, we present a new event graph linearization technique and release highly comprehensive event-text paired datasets, covering more than 150 event types from multiple biology subareas (English language). By streamlining parsing and generation to translations, we propose baseline transformer model results according to multiple biomedical text mining benchmarks and NLG metrics. Our extractive models achieve greater state-of-the-art performance than single-task competitors and show promising capabilities for the controlled generation of coherent natural language utterances from structured data
Young children learning and understanding number and mathematical reasoning using BSL
Deaf children whose preferred language is BSL are being taught mathematics and assessed in English (a second language for them). If deaf children are underachieving in mathematics, it is likely related to the fact that they are (often) not taught mathematics in their native/preferred language, BSL, or assessed in their native/preferred language. These children are either taught through spoken English, 'signs supporting English' (spoken English with the use of gestures and sign vocabulary borrowed from BSL but impoverished grammatically), or impoverished BSL. Some of these children are fortunate to be taught by teachers fluent in BSL, by Deaf native users of the language or fluent 2L BSL users. The majority of these children have parents who did not have knowledge of BSL when they were born and who often do not develop fluent BSL after their children are recognised as deaf. These children who are biologically suited to visual language development often acquire BSL through impoverished parental input, through contact with other children, from teachers (impoverished for some) BSL. Some of these children will be fortunate in having Deaf, native BSL user contact pre-school and through formal schooling. 40 years of research have shown sign languages of the world to be linguistically comparable to spoken languages: they are true languages. My hypothesis is that the children’s knowledge of BSL does support the development of the kinds of abstract reasoning involved in learning mathematics but that this is often not recognised or valued. This research focuses on children's use of BSL for counting and mathematical reasoning. I do this by looking at the literature and research on this area and use a recently developed BSL translation of a primary school assessment of mathematics. G. Tate, J. Collins and P. Tymms (2003). The approach of this study of learning mathematics by the use of BSL is from a linguistics perspective. Using randomly selected examples from previously translated (written English to BSL) assessment questions, this research explores the issues involved in translating such questions, and takes a detailed look at the linguistic features of BSL in relation to mathematics concepts. The dominant educational perspective for the education of deaf children is that success in the learning of mathematics (or other 'academic' subjects) is one which is valid only from its understanding through the use of English. Understanding achieved through the use of BSL is largely ignored or devalued. Children in the charge of these teachers and from research perspectives are often seen as having problems learning mathematics because of difficulties associated with using English. For example, Barham and Bishop (1991) list structures in English that have been found to create difficulties in learning mathematical ways of thinking. They list these as; conditionals, comparatives, negatives, inferentials, 'low information pronouns' and 'lengthy passages.' (Barham and Bishop p181). This exhibits an attitude of ignorance at the very least towards signed language. The whole approach of these and other authors is to take a blinkered look at learning through English as having difficulties because of deafness. Rarely if ever is learning through using sign language considered as valuable (invaluable) in its own right. '... the child is introduced to new and potentially confusing words, e.g. 'multiply' and rectangle.', Often there is confusion between words which might sound similar, especially to a child who is employing lip-reading, e.g. 'ten' and 'tenths,' 'sixty' and 'sixteen.' (ibid р 181) More recent research by Nunes and Moreno (1998) shows some evidence of how young BSL users can develop ways of thinking mathematically through the use of BSL but still conclude that,'...the nowadays common belief that the use of BSL in the home has compensatory effects on children's learning cannot be accepted without further investigation; (p253). Nunes and Moreno do, however, show that children using BSL do develop mathematical ways of thinking at a similar rate to children whose first language is spoken English even though they may be well behind as a group. Their focus is on cognition rather than language. The assessments they used were given in either English or translations into BSL or English with the use of gestures (which they term 'Sign Supported English'). But the actual use of BSL from a linguistic perspective is not questioned or a focus of the research. There is no record of what is signed to refer to, as there are records of English. BSL does not have a commonly used written form. They do not look into the way BSL grammatical constructions are linked to mathematical reasoning. They do not look into the way gestures used with spoken English may only aid communication in English. They have no interest in developing an understanding of BSL: the way numbers are signed, the way base ten counting can be achieved comprehensively, the way the spatial grammar of location and direction leads to the development of reasoning which includes addition, subtraction, multiplication and division. I present a description of assessment questions in BSL in linguistic terms and discuss the grammatical structures in terms of their connections to mathematical ways of thinking (for example, as they relate to addition and multiplication and shapes) and therefore how fluency in and linguistic knowledge of BSL is desirable for teaching children whose preferred language is signed
Translation error annotation : building an annotation module for east asian languages
In this thesis it is proposed an annotation module to be applied in the context of Machine
Translation (MT) concerning the East Asian languages of Japanese, Korean and Mandarin for the
purpose of assessing MT output quality through annotation. The annotation module was created
based on a data-driven analysis over Customer Support content in these languages previously
annotated with the Unbabel Error Typology, which is a general typology in the sense that it is not
conceived for any specific groups of languages. As such, this work also explores how applying
translation error typologies inadequate to certain languages or content types can have an impact
on how annotation reflects the quality of a translation.
For the purpose of testing the effectiveness of the proposed annotation module, an
annotation experiment for the languages under analysis was conducted. This experiment
consisted of, for each language, annotating the same content using three different error
typologies: the Unbabel Error Typology, the MQM-compliant error taxonomy for the translation
direction of English to Chinese proposed by Ye and Toral (2020) and the annotation module
proposed on this thesis. Furthermore, each dataset was annotated by two annotators. This
allowed a comparison of Inter-annotator agreement (IAA) scores, which constitutes an important
metric in terms of evaluating the effectiveness of an error typology.
In light of this, each of the tested typologies was analyzed based on the obtained IAA
scores and a further in-depth analysis of concrete annotations which lead to an understanding
over their strengths and limitations.
With this work it was possible to demonstrate that, if on one hand using error typologies
inadequate for the content annotated has a negative impact on the quality of said annotations, on
the other hand applying an error typology specific to the content being annotated can result in
more consistent annotations.O trabalho desenvolvido no âmbito desta tese teve como objetivo principal a criação de
um módulo de anotação para erros de tradução no contexto da Tradução Automática (TA) que
fosse aplicável a Japonês, Coreano e Mandarim e compatível com o Multidimensional Quality
Metrics (MQM) framework (Lommel et al., 2014). Este módulo foi criado com base numa
análise de dados reais sobre traduções previamente anotadas dentro da empresa Unbabel
seguindo uma tipologia geral concebida para anotação de vários pares linguísticos sem foco em
grupos de línguas específicos. Ao mesmo tempo que permitiu verificar as consequências de
anotar erros com uma tipologia pouco adequada à língua ou ao conteúdo traduzido, esta análise
constituiu um ponto de partida importante para a criação do módulo de anotação proposto nesta
tese.
A Secção 2 desta tese concentrou-se em apresentar a Unbabel como instituição e os
processos de qualidade em vigor dentro da empresa. A Secção 3 focou-se em apresentar o estado
da arte em TA e processos de qualidade, com atenção especial às línguas sob análise nesta tese,
bem como as tipologias de anotação de erros de tradução utilizadas para comparação de
resultados.
A análise dos dados disponíveis, descrita na Secção 4, foi feita em duas fases principais.
Na primeira fase foi analisado um conjunto de 342 segmentos correspondentes ao par linguístico
Inglês-Chinês (Simplificado), previamente anotados com a Unbabel Error Typology, a tipologia
para anotação de erros de tradução utilizada para todos os pares linguísticos até junho de 2022.
Esta análise demonstrou que uma percentagem significativa dos erros cometidos durante o
processo de anotação podiam ser atribuídos não só à falta de claridade das diretrizes de anotação
relativamente a características específicas presentes neste par linguístico como também à falta de
alguns tipos de erros na tipologia. Na segunda fase de análise de dados foi possível confirmar e
fundamentar a existência destes problemas. Nesta fase foi analisada uma amostra de dados mais
abrangente que incluiu quatro pares linguísticos: Inglês-Japonês, Inglês-Coreano, Inglês-Chinês
(Simplificado) e Inglês-Chinês (Tradicional). Para cada par linguístico foi analisado um total de
cerca de 570 a 1900 segmentos e, com a exceção de Inglês-Coreano, todos os dados
correspondiam às anotações de mais de um anotador. Esta análise permitiu concluir que os
anotadores de todos os pares linguísticos mencionados cometeram vários erros, em especial no processo de escolha da categoria certa para cada erro de tradução mas também relativamente à
seleção dos erros e atribuição da severidade certa a cada um.
Através dos dados analisados foi possível determinar que tipos de erros seria necessário
incluir numa tipologia de anotação de erros de tradução adaptada às línguas mencionadas e que
tipo de instruções deveriam ser clarificadas nas diretrizes de anotação. Deste modo, após a
conclusão da segunda fase de análise de dados foi possível começar a criar o módulo de anotação
proposto nesta tese, denominado East Asian Languages Annotation Module for the Unbabel
Quality Framework.
O East Asian Languages Annotation Module for the Unbabel Quality Framework foi
criado à imagem da Unbabel Error Typology e adaptado às características da nova versão que
entrou em vigor na empresa em junho de 2022. No entanto, devido ao facto de ser um módulo de
anotação adaptado às línguas asiáticas previamente mencionadas, várias categorias de erros
existentes na Unbabel Error Typology foram removidos devido a corresponderem a componentes
linguísticos que não fazem parte das línguas em questão. Do mesmo modo, foi adicionado um
total de cinco novos tipos de erros ao módulo com base no que foi julgado necessário durante a
fase de análise de dados. A versão final do East Asian Languages Annotation Module for the
Unbabel Quality Framework conta com um total de 39 tipos de erros, em contraste com os 47
que fazem parte da Unbabel Error Typology. De forma complementar à criação do módulo de
anotação foram também elaboradas diretrizes específicas para o módulo que, para além da
definição de cada tipo de erro com exemplos, incluem também uma secção dedicada a casos
difíceis (Tricky Cases) e esquemas (Decision Trees) para auxiliar na escolha da severidade e tipo
de erro adequado para cada caso.
Após a criação do módulo de anotação foi necessário testar se o mesmo pode ser aplicado
com sucesso. Para este fim foi levado a cabo um estudo de comparação entre o East Asian
Languages Annotation Module for the Unbabel Quality Framework e duas outras tipologias,
descrito na Secção 5. Assim, foram conduzidas três fases de anotação com cerca de um mês de
intervalo entre cada. Para cada tipologia dois anotadores por par linguístico anotaram entre 1100
e 4900 palavras cada um e, de modo a obter uma comparação precisa, dentro de cada par
linguístico o conteúdo anotado com cada tipologia manteve-se o mesmo.
A primeira fase de anotações foi efetuada utilizando a Unbabel Error Typology. Devido
ao facto de os anotadores já estarem familiarizados com esta tipologia e já possuírem as diretrizes de anotação relativas à mesma, não foi necessário prestar apoio adicional aos
anotadores nesta fase.
A segunda ronda de anotações foi levada a cabo com a tipologia para anotação de erros
de tradução para o par linguístico Inglês-Mandarim proposta por Ye e Toral (2020). Para esta
fase de anotação foram criadas diretrizes específicas para esta tipologia com base no trabalho
desenvolvido por Ye e Toral (2020) de modo a facilitar o processo de anotação. É importante
referir que, apesar de esta tipologia ter sido criada para anotação de erros de tradução para o par
linguístico Inglês-Mandarim, durante a fase de teste das tipologias esta foi utilizada para anotar
todos os quatro pares linguísticos a serem analisados. Além disso, devido ao facto de ser uma
tipologia nova, durante esta fase foi mantida a comunicação com os anotadores para
esclarecimento de dúvidas. É necessário salientar que esta tipologia também foi importante na
criação do East Asian Languages Annotation Module devido ao facto de conter tipos de erros
específicos em relação à anotação do par linguístico para o qual foi criada e que serviram de base
para novos tipos de erros propostos no módulo de anotação.
A terceira e última fase de anotação foi feita com o East Asian Languages Annotation
Module for the Unbabel Quality Framework proposto nesta tese. Nesta fase foram fornecidas aos
anotadores as diretrizes que foram criadas de forma complementar ao módulo e, tal como
durante a segunda fase, foi dada aos anotadores a possibilidade de comunicar as suas dúvidas.
Os resultados das três fases de anotação descritas acima foram analisados da perspetiva
do nível de acordo entre os anotadores, medido através da metodologia de Inter-annotator
Agreement (IAA), em contraste com os valores equivalentes da métrica manual de qualidade
MQM (Lommel et al., 2014), bem como através de uma análise detalhada das anotações de
ambos anotadores para todos os pares linguísticos. No contexto da testagem de tipologias de
anotação de erros de tradução uma análise dos valores de IAA obtidos, pois um elevado nível de
concordância entre os anotadores reflete a clareza de uma tipologia. Adicionalmente, a análise
detalhada das anotações em consonância com os valores de IAA permite avaliar que fatores
influenciam a flutuação dos mesmos. Adicionalmente, o feedback que os anotadores forneceram
em relação a cada tipologia também foi alvo de reflexão em contraste com os resultados obtidos.
Deste modo, com a combinação de todos estes dados foi possível determinar os pontos fortes e
as fraquezas de cada tipologia bem como entender que direção deverá seguir o trabalho futuro em torno do East Asian Languages Annotation Module for the Unbabel Quality Framework em
termos do seu aperfeiçoamento.
Com este trabalho foi possível demonstrar o impacto negativo de utilizar uma tipologia
de erros pouco adequada ao conteúdo a ser anotado bem como provar que, por outro lado, uma
tipologia criada para a anotação de um grupo específico de línguas pode melhorar a consistência
das anotações relativas a componentes linguísticos próprios das línguas para as quais a tipologia
é direcionada
Traducir géneros, crear transgéneros: Los espacios intermedios textuales como innovaciones sistémicas enraizadas en las situaciones
Este artículo trabaja la noción de transgénero (Monzó-Nebot 2001a, 2002a, b), sus usos y posibilidades en el estudio de la traducción como mediadora en la cooperación intercultural. Los transgéneros son patrones discursivos que se desarrollan en situaciones interculturales recurrentes y son reconocidos y utilizados por una comunidad. Sobre la base de la reiteración de los propósitos comunicativos y las funciones de los individuos en las situaciones traducidas, las interacciones se convencionalizan para racionalizar la cooperación entre los grupos culturales y sociales, lo que genera un conjunto distintivo de supuestos asumidos, signos y mecanismos de creación de significado que son particulares de una situación traducida. En el artículo se argumentará en primer lugar que este concepto va más allá de las propuestas existentes de los enfoques culturales, sociales y lingüísticos, especialmente el tercer espacio, los modelos de normas y leyes de la traducción, y los universales y el lenguaje de la traducción (translationese), al centrarse en el carácter arraigado en una situación de las pautas textuales, de interacción y culturales; por ello, proporciona un medio para modelar y medir el desarrollo de la traducción como práctica discursiva, influida por cuestiones históricas, culturales, sociales, cognitivas, ideológicas y lingüísticas. A continuación, se identifican y exponen las aplicaciones existentes del concepto y nuevas posibilidades. Los resultados de los estudios existentes muestran que las traducciones construyen un tercer espacio de prácticas discursivas interculturales que muestran las tensiones con los sistemas de origen y de destino. En ese tercer espacio, resultante de sus propias prácticas culturales vinculadas a la función específica de los traductores en un sistema multicultural más amplio, el traductor jurídico se siente en su propio medio.This paper works on the notion of transgenre (Monzó-Nebot 2001a, 2002a, b), its uses and
possibilities in the study of translation as mediating intercultural cooperation. Transgenres are discursive
patterns that develop in recurring intercultural situations and are recognized and used by a community.
Based on the reiteration of communicative purposes and individuals’ roles in translated situations,
interactions are conventionalized to streamline cooperation between cultural and social groups, thereby
engendering a distinctive set of taken-for-granted assumptions and meaning-making mechanisms and
signs which are particular to a translated event. The paper will first argue how this concept takes a step
beyond the existing proposals from cultural, social, and linguistic approaches, especially the third space,
the models of norms and laws of translation, and universals and the language of translation (translationese),
by focusing on the situatedness of textual, interactional, and cultural patterns and providing a
means to model and measure the development of translation as a discursive practice, as such influenced
by historical, cultural, social, cognitive, ideologic, and linguistic issues. Then existing applications of
the concept and new possibilities will be identified and discussed. The results of existing studies show
translations build a third space of intercultural discursive practices showing tensions with both source
and target systems. The legal translator is at home in this third space, resulting from their own cultural
practices, which are linked to translators’ specific function in a broader multicultural system
CaSPiS: A Calculus of Sessions, Pipelines and Services
Service-oriented computing is calling for novel computational models and languages with well
disciplined primitives for client-server interaction, structured orchestration and unexpected events handling. We present CaSPiS, a process calculus where the conceptual abstractions of sessioning and pipelining play a central role for modelling service-oriented systems. CaSPiS sessions are two-sided, uniquely named and can be nested. CaSPiS pipelines permit orchestrating the flow of data produced by different sessions. The calculus is also equipped with operators for handling (unexpected) termination of the partner’s side of a session. Several examples are presented to provide evidence of the flexibility of the chosen set of primitives. One key contribution is a fully abstract encoding of Misra et al.’s orchestration language Orc. Another main result shows that in CaSPiS it is possible to program a “graceful termination” of nested sessions, which guarantees that no session is forced to hang forever after the loss of its partner
- …