7,512 research outputs found

    A Process Calculus for Molecular Interaction Maps

    Full text link
    We present the MIM calculus, a modeling formalism with a strong biological basis, which provides biologically-meaningful operators for representing the interaction capabilities of molecular species. The operators of the calculus are inspired by the reaction symbols used in Molecular Interaction Maps (MIMs), a diagrammatic notation used by biologists. Models of the calculus can be easily derived from MIM diagrams, for which an unambiguous and executable interpretation is thus obtained. We give a formal definition of the syntax and semantics of the MIM calculus, and we study properties of the formalism. A case study is also presented to show the use of the calculus for modeling biomolecular networks.Comment: 15 pages; 8 figures; To be published on EPTCS, proceedings of MeCBIC 200

    The sonnets of Seamus Heaney in Spanish

    Get PDF
    This paper seeks to offer a more nuanced and further-reaching exploration of the translation of all of Seamus Heaney’s sonnets into a Spanish ‘collected’, lead by the Mexican poet Pura López-Colomé. Taking in critical thinking on creativity and the ‘post-colonial’ sonnet as well as Heaney’s and López-Colomé’s own views and metaphorics relating to literary translation, this paper asks not only what Sonetos brings to the originals, but what they bring also to poetry and translation. The paper argues that Sonetos offers a distinct insight into questions of semantic faithfulness and the translator’s visibility, but also that whilst we must eschew metaphysical or essentialist language in analysis, the project of Sonetos has also been to communicate not just original poetry’s, but also translation’s qualities as a strategy of (secular) revelation

    Paraphrase or parasite? The Semiotic Stories of Translation

    Get PDF
    Translation, for Saussure, assumed the codified rule of language respecting the difference between synchronic and diachronic linguistics. Translation may be regarded as a theoretical possibility, though impossible for the creative speech of language speakers. Peirce’s logical semiotics reasoned the linguistic-and-cultural (linguïcultural) interpretants of received signs. Semiotranslation is a semiotic game to change the symbiosis of two languages into one language. Identified with both Saussure and Peirce, Jakobson’s intralingual, interlingual, and intersemiotic forms of translation propose rewording, translation proper, and transmutation. Peirce’s semiosis creates simple and complex symbols but navigates between translation, semiotranslation, and transduction. Translation derives from the para-functions of replicas in “paraphrase” and “parasite” to signify the multiplicity of ideas and trends in biotranslation. The source text can be re-organized into the iconic activity of Saussurean paraphrase; or the target text can be indexically recontextualized in the parasitical evolution of Peirce’s instinct and facts of life applied to arts — neither approaching pure science.publishedVersio

    Text-to-Text Extraction and Verbalization of Biomedical Event Graphs

    Get PDF
    Biomedical events represent complex, graphical, and semantically rich interactions expressed in the scientific literature. Almost all contributions in the event realm orbit around semantic parsing, usually employing discriminative architectures and cumbersome multi-step pipelines limited to a small number of target interaction types. We present the first lightweight framework to solve both event extraction and event verbalization with a unified text-to-text approach, allowing us to fuse all the resources so far designed for different tasks. To this end, we present a new event graph linearization technique and release highly comprehensive event-text paired datasets, covering more than 150 event types from multiple biology subareas (English language). By streamlining parsing and generation to translations, we propose baseline transformer model results according to multiple biomedical text mining benchmarks and NLG metrics. Our extractive models achieve greater state-of-the-art performance than single-task competitors and show promising capabilities for the controlled generation of coherent natural language utterances from structured data

    Young children learning and understanding number and mathematical reasoning using BSL

    Get PDF
    Deaf children whose preferred language is BSL are being taught mathematics and assessed in English (a second language for them). If deaf children are underachieving in mathematics, it is likely related to the fact that they are (often) not taught mathematics in their native/preferred language, BSL, or assessed in their native/preferred language. These children are either taught through spoken English, 'signs supporting English' (spoken English with the use of gestures and sign vocabulary borrowed from BSL but impoverished grammatically), or impoverished BSL. Some of these children are fortunate to be taught by teachers fluent in BSL, by Deaf native users of the language or fluent 2L BSL users. The majority of these children have parents who did not have knowledge of BSL when they were born and who often do not develop fluent BSL after their children are recognised as deaf. These children who are biologically suited to visual language development often acquire BSL through impoverished parental input, through contact with other children, from teachers (impoverished for some) BSL. Some of these children will be fortunate in having Deaf, native BSL user contact pre-school and through formal schooling. 40 years of research have shown sign languages of the world to be linguistically comparable to spoken languages: they are true languages. My hypothesis is that the children’s knowledge of BSL does support the development of the kinds of abstract reasoning involved in learning mathematics but that this is often not recognised or valued. This research focuses on children's use of BSL for counting and mathematical reasoning. I do this by looking at the literature and research on this area and use a recently developed BSL translation of a primary school assessment of mathematics. G. Tate, J. Collins and P. Tymms (2003). The approach of this study of learning mathematics by the use of BSL is from a linguistics perspective. Using randomly selected examples from previously translated (written English to BSL) assessment questions, this research explores the issues involved in translating such questions, and takes a detailed look at the linguistic features of BSL in relation to mathematics concepts. The dominant educational perspective for the education of deaf children is that success in the learning of mathematics (or other 'academic' subjects) is one which is valid only from its understanding through the use of English. Understanding achieved through the use of BSL is largely ignored or devalued. Children in the charge of these teachers and from research perspectives are often seen as having problems learning mathematics because of difficulties associated with using English. For example, Barham and Bishop (1991) list structures in English that have been found to create difficulties in learning mathematical ways of thinking. They list these as; conditionals, comparatives, negatives, inferentials, 'low information pronouns' and 'lengthy passages.' (Barham and Bishop p181). This exhibits an attitude of ignorance at the very least towards signed language. The whole approach of these and other authors is to take a blinkered look at learning through English as having difficulties because of deafness. Rarely if ever is learning through using sign language considered as valuable (invaluable) in its own right. '... the child is introduced to new and potentially confusing words, e.g. 'multiply' and rectangle.', Often there is confusion between words which might sound similar, especially to a child who is employing lip-reading, e.g. 'ten' and 'tenths,' 'sixty' and 'sixteen.' (ibid р 181) More recent research by Nunes and Moreno (1998) shows some evidence of how young BSL users can develop ways of thinking mathematically through the use of BSL but still conclude that,'...the nowadays common belief that the use of BSL in the home has compensatory effects on children's learning cannot be accepted without further investigation; (p253). Nunes and Moreno do, however, show that children using BSL do develop mathematical ways of thinking at a similar rate to children whose first language is spoken English even though they may be well behind as a group. Their focus is on cognition rather than language. The assessments they used were given in either English or translations into BSL or English with the use of gestures (which they term 'Sign Supported English'). But the actual use of BSL from a linguistic perspective is not questioned or a focus of the research. There is no record of what is signed to refer to, as there are records of English. BSL does not have a commonly used written form. They do not look into the way BSL grammatical constructions are linked to mathematical reasoning. They do not look into the way gestures used with spoken English may only aid communication in English. They have no interest in developing an understanding of BSL: the way numbers are signed, the way base ten counting can be achieved comprehensively, the way the spatial grammar of location and direction leads to the development of reasoning which includes addition, subtraction, multiplication and division. I present a description of assessment questions in BSL in linguistic terms and discuss the grammatical structures in terms of their connections to mathematical ways of thinking (for example, as they relate to addition and multiplication and shapes) and therefore how fluency in and linguistic knowledge of BSL is desirable for teaching children whose preferred language is signed

    Translation error annotation : building an annotation module for east asian languages

    Get PDF
    In this thesis it is proposed an annotation module to be applied in the context of Machine Translation (MT) concerning the East Asian languages of Japanese, Korean and Mandarin for the purpose of assessing MT output quality through annotation. The annotation module was created based on a data-driven analysis over Customer Support content in these languages previously annotated with the Unbabel Error Typology, which is a general typology in the sense that it is not conceived for any specific groups of languages. As such, this work also explores how applying translation error typologies inadequate to certain languages or content types can have an impact on how annotation reflects the quality of a translation. For the purpose of testing the effectiveness of the proposed annotation module, an annotation experiment for the languages under analysis was conducted. This experiment consisted of, for each language, annotating the same content using three different error typologies: the Unbabel Error Typology, the MQM-compliant error taxonomy for the translation direction of English to Chinese proposed by Ye and Toral (2020) and the annotation module proposed on this thesis. Furthermore, each dataset was annotated by two annotators. This allowed a comparison of Inter-annotator agreement (IAA) scores, which constitutes an important metric in terms of evaluating the effectiveness of an error typology. In light of this, each of the tested typologies was analyzed based on the obtained IAA scores and a further in-depth analysis of concrete annotations which lead to an understanding over their strengths and limitations. With this work it was possible to demonstrate that, if on one hand using error typologies inadequate for the content annotated has a negative impact on the quality of said annotations, on the other hand applying an error typology specific to the content being annotated can result in more consistent annotations.O trabalho desenvolvido no âmbito desta tese teve como objetivo principal a criação de um módulo de anotação para erros de tradução no contexto da Tradução Automática (TA) que fosse aplicável a Japonês, Coreano e Mandarim e compatível com o Multidimensional Quality Metrics (MQM) framework (Lommel et al., 2014). Este módulo foi criado com base numa análise de dados reais sobre traduções previamente anotadas dentro da empresa Unbabel seguindo uma tipologia geral concebida para anotação de vários pares linguísticos sem foco em grupos de línguas específicos. Ao mesmo tempo que permitiu verificar as consequências de anotar erros com uma tipologia pouco adequada à língua ou ao conteúdo traduzido, esta análise constituiu um ponto de partida importante para a criação do módulo de anotação proposto nesta tese. A Secção 2 desta tese concentrou-se em apresentar a Unbabel como instituição e os processos de qualidade em vigor dentro da empresa. A Secção 3 focou-se em apresentar o estado da arte em TA e processos de qualidade, com atenção especial às línguas sob análise nesta tese, bem como as tipologias de anotação de erros de tradução utilizadas para comparação de resultados. A análise dos dados disponíveis, descrita na Secção 4, foi feita em duas fases principais. Na primeira fase foi analisado um conjunto de 342 segmentos correspondentes ao par linguístico Inglês-Chinês (Simplificado), previamente anotados com a Unbabel Error Typology, a tipologia para anotação de erros de tradução utilizada para todos os pares linguísticos até junho de 2022. Esta análise demonstrou que uma percentagem significativa dos erros cometidos durante o processo de anotação podiam ser atribuídos não só à falta de claridade das diretrizes de anotação relativamente a características específicas presentes neste par linguístico como também à falta de alguns tipos de erros na tipologia. Na segunda fase de análise de dados foi possível confirmar e fundamentar a existência destes problemas. Nesta fase foi analisada uma amostra de dados mais abrangente que incluiu quatro pares linguísticos: Inglês-Japonês, Inglês-Coreano, Inglês-Chinês (Simplificado) e Inglês-Chinês (Tradicional). Para cada par linguístico foi analisado um total de cerca de 570 a 1900 segmentos e, com a exceção de Inglês-Coreano, todos os dados correspondiam às anotações de mais de um anotador. Esta análise permitiu concluir que os anotadores de todos os pares linguísticos mencionados cometeram vários erros, em especial no processo de escolha da categoria certa para cada erro de tradução mas também relativamente à seleção dos erros e atribuição da severidade certa a cada um. Através dos dados analisados foi possível determinar que tipos de erros seria necessário incluir numa tipologia de anotação de erros de tradução adaptada às línguas mencionadas e que tipo de instruções deveriam ser clarificadas nas diretrizes de anotação. Deste modo, após a conclusão da segunda fase de análise de dados foi possível começar a criar o módulo de anotação proposto nesta tese, denominado East Asian Languages Annotation Module for the Unbabel Quality Framework. O East Asian Languages Annotation Module for the Unbabel Quality Framework foi criado à imagem da Unbabel Error Typology e adaptado às características da nova versão que entrou em vigor na empresa em junho de 2022. No entanto, devido ao facto de ser um módulo de anotação adaptado às línguas asiáticas previamente mencionadas, várias categorias de erros existentes na Unbabel Error Typology foram removidos devido a corresponderem a componentes linguísticos que não fazem parte das línguas em questão. Do mesmo modo, foi adicionado um total de cinco novos tipos de erros ao módulo com base no que foi julgado necessário durante a fase de análise de dados. A versão final do East Asian Languages Annotation Module for the Unbabel Quality Framework conta com um total de 39 tipos de erros, em contraste com os 47 que fazem parte da Unbabel Error Typology. De forma complementar à criação do módulo de anotação foram também elaboradas diretrizes específicas para o módulo que, para além da definição de cada tipo de erro com exemplos, incluem também uma secção dedicada a casos difíceis (Tricky Cases) e esquemas (Decision Trees) para auxiliar na escolha da severidade e tipo de erro adequado para cada caso. Após a criação do módulo de anotação foi necessário testar se o mesmo pode ser aplicado com sucesso. Para este fim foi levado a cabo um estudo de comparação entre o East Asian Languages Annotation Module for the Unbabel Quality Framework e duas outras tipologias, descrito na Secção 5. Assim, foram conduzidas três fases de anotação com cerca de um mês de intervalo entre cada. Para cada tipologia dois anotadores por par linguístico anotaram entre 1100 e 4900 palavras cada um e, de modo a obter uma comparação precisa, dentro de cada par linguístico o conteúdo anotado com cada tipologia manteve-se o mesmo. A primeira fase de anotações foi efetuada utilizando a Unbabel Error Typology. Devido ao facto de os anotadores já estarem familiarizados com esta tipologia e já possuírem as diretrizes de anotação relativas à mesma, não foi necessário prestar apoio adicional aos anotadores nesta fase. A segunda ronda de anotações foi levada a cabo com a tipologia para anotação de erros de tradução para o par linguístico Inglês-Mandarim proposta por Ye e Toral (2020). Para esta fase de anotação foram criadas diretrizes específicas para esta tipologia com base no trabalho desenvolvido por Ye e Toral (2020) de modo a facilitar o processo de anotação. É importante referir que, apesar de esta tipologia ter sido criada para anotação de erros de tradução para o par linguístico Inglês-Mandarim, durante a fase de teste das tipologias esta foi utilizada para anotar todos os quatro pares linguísticos a serem analisados. Além disso, devido ao facto de ser uma tipologia nova, durante esta fase foi mantida a comunicação com os anotadores para esclarecimento de dúvidas. É necessário salientar que esta tipologia também foi importante na criação do East Asian Languages Annotation Module devido ao facto de conter tipos de erros específicos em relação à anotação do par linguístico para o qual foi criada e que serviram de base para novos tipos de erros propostos no módulo de anotação. A terceira e última fase de anotação foi feita com o East Asian Languages Annotation Module for the Unbabel Quality Framework proposto nesta tese. Nesta fase foram fornecidas aos anotadores as diretrizes que foram criadas de forma complementar ao módulo e, tal como durante a segunda fase, foi dada aos anotadores a possibilidade de comunicar as suas dúvidas. Os resultados das três fases de anotação descritas acima foram analisados da perspetiva do nível de acordo entre os anotadores, medido através da metodologia de Inter-annotator Agreement (IAA), em contraste com os valores equivalentes da métrica manual de qualidade MQM (Lommel et al., 2014), bem como através de uma análise detalhada das anotações de ambos anotadores para todos os pares linguísticos. No contexto da testagem de tipologias de anotação de erros de tradução uma análise dos valores de IAA obtidos, pois um elevado nível de concordância entre os anotadores reflete a clareza de uma tipologia. Adicionalmente, a análise detalhada das anotações em consonância com os valores de IAA permite avaliar que fatores influenciam a flutuação dos mesmos. Adicionalmente, o feedback que os anotadores forneceram em relação a cada tipologia também foi alvo de reflexão em contraste com os resultados obtidos. Deste modo, com a combinação de todos estes dados foi possível determinar os pontos fortes e as fraquezas de cada tipologia bem como entender que direção deverá seguir o trabalho futuro em torno do East Asian Languages Annotation Module for the Unbabel Quality Framework em termos do seu aperfeiçoamento. Com este trabalho foi possível demonstrar o impacto negativo de utilizar uma tipologia de erros pouco adequada ao conteúdo a ser anotado bem como provar que, por outro lado, uma tipologia criada para a anotação de um grupo específico de línguas pode melhorar a consistência das anotações relativas a componentes linguísticos próprios das línguas para as quais a tipologia é direcionada

    Traducir géneros, crear transgéneros: Los espacios intermedios textuales como innovaciones sistémicas enraizadas en las situaciones

    Get PDF
    Este artículo trabaja la noción de transgénero (Monzó-Nebot 2001a, 2002a, b), sus usos y posibilidades en el estudio de la traducción como mediadora en la cooperación intercultural. Los transgéneros son patrones discursivos que se desarrollan en situaciones interculturales recurrentes y son reconocidos y utilizados por una comunidad. Sobre la base de la reiteración de los propósitos comunicativos y las funciones de los individuos en las situaciones traducidas, las interacciones se convencionalizan para racionalizar la cooperación entre los grupos culturales y sociales, lo que genera un conjunto distintivo de supuestos asumidos, signos y mecanismos de creación de significado que son particulares de una situación traducida. En el artículo se argumentará en primer lugar que este concepto va más allá de las propuestas existentes de los enfoques culturales, sociales y lingüísticos, especialmente el tercer espacio, los modelos de normas y leyes de la traducción, y los universales y el lenguaje de la traducción (translationese), al centrarse en el carácter arraigado en una situación de las pautas textuales, de interacción y culturales; por ello, proporciona un medio para modelar y medir el desarrollo de la traducción como práctica discursiva, influida por cuestiones históricas, culturales, sociales, cognitivas, ideológicas y lingüísticas. A continuación, se identifican y exponen las aplicaciones existentes del concepto y nuevas posibilidades. Los resultados de los estudios existentes muestran que las traducciones construyen un tercer espacio de prácticas discursivas interculturales que muestran las tensiones con los sistemas de origen y de destino. En ese tercer espacio, resultante de sus propias prácticas culturales vinculadas a la función específica de los traductores en un sistema multicultural más amplio, el traductor jurídico se siente en su propio medio.This paper works on the notion of transgenre (Monzó-Nebot 2001a, 2002a, b), its uses and possibilities in the study of translation as mediating intercultural cooperation. Transgenres are discursive patterns that develop in recurring intercultural situations and are recognized and used by a community. Based on the reiteration of communicative purposes and individuals’ roles in translated situations, interactions are conventionalized to streamline cooperation between cultural and social groups, thereby engendering a distinctive set of taken-for-granted assumptions and meaning-making mechanisms and signs which are particular to a translated event. The paper will first argue how this concept takes a step beyond the existing proposals from cultural, social, and linguistic approaches, especially the third space, the models of norms and laws of translation, and universals and the language of translation (translationese), by focusing on the situatedness of textual, interactional, and cultural patterns and providing a means to model and measure the development of translation as a discursive practice, as such influenced by historical, cultural, social, cognitive, ideologic, and linguistic issues. Then existing applications of the concept and new possibilities will be identified and discussed. The results of existing studies show translations build a third space of intercultural discursive practices showing tensions with both source and target systems. The legal translator is at home in this third space, resulting from their own cultural practices, which are linked to translators’ specific function in a broader multicultural system

    CaSPiS: A Calculus of Sessions, Pipelines and Services

    Get PDF
    Service-oriented computing is calling for novel computational models and languages with well disciplined primitives for client-server interaction, structured orchestration and unexpected events handling. We present CaSPiS, a process calculus where the conceptual abstractions of sessioning and pipelining play a central role for modelling service-oriented systems. CaSPiS sessions are two-sided, uniquely named and can be nested. CaSPiS pipelines permit orchestrating the flow of data produced by different sessions. The calculus is also equipped with operators for handling (unexpected) termination of the partner’s side of a session. Several examples are presented to provide evidence of the flexibility of the chosen set of primitives. One key contribution is a fully abstract encoding of Misra et al.’s orchestration language Orc. Another main result shows that in CaSPiS it is possible to program a “graceful termination” of nested sessions, which guarantees that no session is forced to hang forever after the loss of its partner
    corecore