Search CORE

475 research outputs found

Open Information Extraction: A Review of Baseline Techniques, Approaches, and Applications

Author: Benameur-El Zineb
Dreslinski Ronald
Fayazi Morteza
Kamp Serafina
Yu Shuyan
Publication venue
Publication date: 17/10/2023
Field of study

With the abundant amount of available online and offline text data, there arises a crucial need to extract the relation between phrases and summarize the main content of each document in a few words. For this purpose, there have been many studies recently in Open Information Extraction (OIE). OIE improves upon relation extraction techniques by analyzing relations across different domains and avoids requiring hand-labeling pre-specified relations in sentences. This paper surveys recent approaches of OIE and its applications on Knowledge Graph (KG), text summarization, and Question Answering (QA). Moreover, the paper describes OIE basis methods in relation extraction. It briefly discusses the main approaches and the pros and cons of each method. Finally, it gives an overview about challenges, open issues, and future work opportunities for OIE, relation extraction, and OIE applications.Comment: 15 pages, 9 figure

arXiv.org e-Print Archive

Unifying context with labeled property graph: A pipeline-based system for comprehensive text representation in NLP

Author: Ahmed Mohiuddin
Hur Ali
Janjua Naeem
Publication venue: Edith Cowan University, Research Online, Perth, Western Australia
Publication date: 01/01/2024
Field of study

Extracting valuable insights from vast amounts of unstructured digital text presents significant challenges across diverse domains. This research addresses this challenge by proposing a novel pipeline-based system that generates domain-agnostic and task-agnostic text representations. The proposed approach leverages labeled property graphs (LPG) to encode contextual information, facilitating the integration of diverse linguistic elements into a unified representation. The proposed system enables efficient graph-based querying and manipulation by addressing the crucial aspect of comprehensive context modeling and fine-grained semantics. The effectiveness of the proposed system is demonstrated through the implementation of NLP components that operate on LPG-based representations. Additionally, the proposed approach introduces specialized patterns and algorithms to enhance specific NLP tasks, including nominal mention detection, named entity disambiguation, event enrichments, event participant detection, and temporal link detection. The evaluation of the proposed approach, using the MEANTIME corpus comprising manually annotated documents, provides encouraging results and valuable insights into the system\u27s strengths. The proposed pipeline-based framework serves as a solid foundation for future research, aiming to refine and optimize LPG-based graph structures to generate comprehensive and semantically rich text representations, addressing the challenges associated with efficient information extraction and analysis in NLP

Research Online @ ECU

Proceedings of the Second Workshop on Annotation of Corpora for Research in the Humanities (ACRH-2). 29 November 2012, Lisbon, Portugal

Author
Publication venue: place:Lisbona
Publication date: 01/01/2012
Field of study

Proceedings of the Second Workshop on Annotation of Corpora for Research in the Humanities (ACRH-2), held in Lisbon, Portugal on 29 November 2012

PubliCatt

Word meaning in context : a probabilistic model and its application to question answering

Author: Dinu Georgiana
Publication venue: Fakultät 4 - Philosophische Fakultät II. Fachrichtung 4.7 - Allgemeine Linguistik
Publication date: 01/01/2011
Field of study

The need for assessing similarity in meaning is central to most language technology applications. Distributional methods are robust, unsupervised methods which achieve high performance on this task. These methods measure similarity of word types solely based on patterns of word occurrences in large corpora, following the intuition that similar words occur in similar contexts. As most Natural Language Processing (NLP) applications deal with disambiguated words, words occurring in context, rather than word types, the question of adapting distributional methods to compute sense-speciﬁc or context-sensitive similarities has gained increasing attention in recent work. This thesis focuses on the development and applications of distributional methods for context-sensitive similarity. The contribution made is twofold: the main part of the thesis proposes and tests a new framework for computing similarity in context, while the second part investigates the application of distributional paraphrasing to the task of question answering.Die Notwendigkeit der Beurteilung von Bedeutungsähnlichkeit spielt für die meisten sprachtechnologische Anwendungen eine wesentliche Rolle. Distributionelle Verfahren sind solide, unbeaufsichtigte Verfahren, die für diese Aufgabe sehr eﬀektiv sind. Diese Verfahren messen die Ähnlichkeit von Wortarten lediglich auf Basis von Mustern, nach denen die Wörter in großen Korpora vorkommen, indem sie der Erkenntnis folgen, dass ähnliche Wörter in ähnlichen Kontexten auftreten. Da die meisten Anwendungen im Natural Language Processing (NLP) mit eindeutigen Wörtern arbeiten, also eher Wörtern, die im Kontext vorkommen, als Wortarten, hat die Frage, ob distributionelle Verfahren angepasst werden sollten, um bedeutungsspeziﬁsche oder kontextabhängige Ähnlichkeiten zu berechnen, in neueren Arbeiten zunehmend an Bedeutung gewonnen. Diese Dissertation konzentriert sich auf die Entwicklung und Anwendungen von distributionellen Verfahren für kontextabhängige Ähnlichkeit und liefert einen doppelten Beitrag: Den Hauptteil der Arbeit bildet die Präsentation und Erprobung eines neuen framework für die Berechnung von Ähnlichkeit im Kontext. Im zweiten Teil der Arbeit wird die Anwendung des distributional paraphrasing auf die Aufgabe der Fragenbeantwortung untersucht

Universaar

Acronym

Unsupervised Induction of Frame-Based Linguistic Forms

Author: Ferraro Francis
Publication venue: 'The Busan Gyeongnam Mathematical Society'
Publication date: 22/05/2018
Field of study

This thesis studies the use of bulk, structured, linguistic annotations in order to perform unsupervised induction of meaning for three kinds of linguistic forms: words, sentences, and documents. The primary linguistic annotation I consider throughout this thesis are frames, which encode core linguistic, background or societal knowledge necessary to understand abstract concepts and real-world situations. I begin with an overview of linguistically-based structured meaning representation; I then analyze available large-scale natural language processing (NLP) and linguistic resources and corpora for their abilities to accommodate bulk, automatically-obtained frame annotations. I then proceed to induce meanings of the different forms, progressing from the word level, to the sentence level, and finally to the document level. I first show how to use these bulk annotations in order to better encode linguistic- and cognitive science backed semantic expectations within word forms. I then demonstrate a straightforward approach for learning large lexicalized and refined syntactic fragments, which encode and memoize commonly used phrases and linguistic constructions. Next, I consider two unsupervised models for document and discourse understanding; one is a purely generative approach that naturally accommodates layer annotations and is the first to capture and unify a complete frame hierarchy. The other conditions on limited amounts of external annotations, imputing missing values when necessary, and can more readily scale to large corpora. These discourse models help improve document understanding and type-level understanding

JScholarship

Variation and change in the syntax of relative clauses: new evidence from Portuguese

Author: Cardoso Maria Adriana Príncipe, 1975-
Publication venue
Publication date: 01/01/2010
Field of study

Tese de doutoramento, Linguística (Linguística Histórica), Universidade de Lisboa, Faculdade de Letras, 2011This dissertation sheds light on language variation and change from a generative syntactic perspective, based on a case study of relative clause constructions in Portuguese and other languages. The research methodology adopted involves comparative syntax (see, e.g., Cinque and Kayne 2005), both in the diachronic and the synchronic dimensions: contemporary European Portuguese is systematically compared with earlier stages of Portuguese; moreover, Portuguese is compared with other languages, in particular Latin, English, Dutch, and Italian. Furthermore, the present research contributes to the theoretical debate on the structural analysis of three different phenomena: restrictive relatives, appositive relatives, and extraposition. Two important findings are (i) that competing theoretical analyses need not be either false or true universally, but could be instrumental in explaining language variation (both diachronically and synchronically); and (ii) simple lexical changes concerning the availability of (abstract) functional items can have dramatic consequences in the behavior of certain 'construction types' in a particular language. As for the structural analyses of relative clauses and extraposition, both Kayne’s (1994) raising analysis and De Vries’ (2006b) specifying coordination analysis proved to be central to the understanding of the issues dealt with in this dissertation. Ultimately, this dissertation demonstrates that cross-linguistic and diachronic contrasts offer invaluable means of enhancing our understanding of various linguistic phenomena, thereby contributing also to our understanding of the interaction between principles and parameters.A presente dissertação visa contribuir para a compreensão dos fenómenos de variação e mudança linguísticas, centrando-se no estudo de construções de relativização em português e em outras línguas. A perspectiva adoptada neste estudo insere-se na área de investigação que tem sido designada de sintaxe comparada (cf., a título de exemplo, Cinque e Kayne 2005). Esta opção metodológica manifesta-se em dois planos distintos. Por um lado, é estabelecida uma comparação entre os dados de estádios anteriores do português e do português europeu contemporâneo. Por outro lado, estes dados são confrontados com dados de outras línguas, nomeadamente do latim, inglês, holandês e italiano. Esta metodologia foi determinante para o desenvolvimento do presente estudo. Permitiu, por exemplo, mostrar que as construções de relativização não exibem um comportamento uniforme no decurso da história do português. Permitiu ainda concluir que, no que diz respeito a algumas das construções investigadas, há uma clara coincidência entre os dados diacrónicos do português e os dados de línguas germânicas contemporâneas (com particular ênfase para o inglês e holandês). O enquadramento conceptual e os instrumentos associados à investigação comparativa possibilitaram assim ultrapassar algumas das limitações inerentes à investigação em linguística histórica, nomeadamente no que diz respeito à natureza limitada das fontes escritas e à impossibilidade de manipular dados. A análise apresentada toma como referência o quadro da Teoria de Princípios e Parâmetros (Chomsky 1981 e trabalhos posteriores), na sua versão minimalista (Chomsky 1993, 1995 e trabalhos subsequentes). A variação e mudança linguísticas são interpretadas com base no modelo proposto por Lightfoot (1991, 1999 e trabalhos posteriores), que estabelece uma relação clara entre a mudança linguística e a aquisição da linguagem. A explicação dos fenómenos de variação linguística beneficia ainda dos contributos de Kroch (1989, 1994, 2001) e da investigação em sintaxe comparada paramétrica (cf., e.g., Holmberg and Roberts 2010). A este respeito, cumpre referir que a adopção de um modelo teórico foi fundamental para os resultados alcançados neste trabalho. Para mencionar apenas algumas das mais valias obtidas, o enquadramento teórico foi decisivo na organização, descrição e explicação dos dados. Permitiu ainda fazer predições importantes, que orientaram a pesquisa de corpora numa fase adiantada dos trabalhos. Parafraseando a epígrafe desta dissertação, não pode haver teoria sem dados e, sem teoria, dificilmente há compreensão. A investigação que se apresenta assenta em fundamentação empírica proveniente de diversas fontes, em função dos diferentes objectivos delineados. No que concerne aos dados da história do português, o período compreendido entre os séculos XIII e a primeira metade do século XVI é estudado com base nos textos editados em Martins (2001), em Documentos Portugueses do Noroeste e da Região de Lisboa. Os dados recolhidos são complementados por outras fontes, em particular por textos disponíveis no Corpus Informatizado do português Medieval (Xavier, Coord.) e no Corpus Histórico do Português Tycho Brahe (Galves, Coord.). São também consideradas algumas edições de documentos da época, nomeadamente: Crónica do Conde D. Pedro de Meneses (ed. Brocardo 1997); Livro de Linhagens do Conde D. Pedro (ed. Brocardo 2006); Demanda do Santo Graal (ed. Piel and Nunes 1988); Livro dos Ofícios (ed. Piel 1948); Crónica de D. Fernando (ed. Macchi 1975); Gil Vicente: todas as obras (coord. Camões 1999). Para o período compreendido entre a segunda metade do século XVI e o século XIX, a fundamentação empírica é proveniente do Corpus Histórico do Português Tycho Brahe (Galves, Coord.), bem como dos textos disponibilizados em CARDS - Cartas Desconhecidas (Marquilhas, Coord.) e Corpus do Português – CdP - (Davies and Ferreira 2006-). Tal como para o período anterior, são igualmente consideradas edições de outros documentos da época: Os Autos do Processo de Vieira na Inquisição (ed. Muhana 1995); Documentos para a História da Inquisição em Portugal (ed. Pereira 1987); Inquisição de Évora: dos Primórdios a 1668 (ed. Coelho 1987). Para o português europeu contemporâneo, para além das minhas próprias intuições e dos juízos de outros falantes nativos, são tidos em conta textos provenientes de diversas fontes. Os corpora consultados são: Corpus de Extractos de Textos Electrónicos MCT/Público (Rocha e Santos 2000), Corpus de Referência do Português Contemporâneo (Bacelar do Nascimento, Coord.), Corpus do Português Oral (Bacelar do Nascimento, Portuguese Coord. 2005), Corpus Dialectal para o Estudo da Sintaxe (Martins, Coord.). No que diz respeito à evidência empírica relativa a outras línguas, para além de dados recolhidos em textos da especialidade, são considerados dados dos seguintes corpora: Corpus of Contemporary American English (see Davies 2008-), Penn Parsed Corpus of Modern British English (Kroch et al. 2010), Penn-Helsinki Parsed Corpus of Early Modern English (Kroch et al. 2004). Os dados do holandês, italiano e latim são maioritariamente provenientes de estudos sobre construções de relativização (com excepção do holandês, língua para a qual se apresentam também produções de vários falantes). Do ponto de vista teórico, a presente dissertação contribui para o debate que se tem gerado em torno da análise sintáctica das orações relativas restritivas, orações relativas apositivas e extraposição. Duas conclusões gerais podem ser destacadas: (i) as diferentes análises apresentadas na literatura para dar conta destes fenómenos linguísticos não têm necessariamente de ser consideradas verdadeiras ou falsas (ou correctas/incorrectas), podendo constituir instrumentos fundamentais para a compreensão da variação linguística (sincrónica e diacrónica); (ii) simples mudanças no léxico relativas à presença de itens funcionais abstractos (i.e., sem realização fonética) podem ter um impacto bastante significativo nas propriedades e estrutura sintáctica das tradicionais ‘construções linguísticas’. A dissertação é constituída por três estudos principais, que se descrevem de seguida. O primeiro estudo apresenta e discute o fenómeno de remnant-internal relativization (RIR). Este termo é usado para referir os contextos de não adjacência entre o núcleo de uma oração relativa restritiva e o seu modificador/complemento, como se ilustra esquematicamente em (1): (1) [S-matrix ... [N [RC ... modificador/complemento ... ]] ...] Dois padrões de ordem de palavras são identificados na história do português: • RIR com o modificador/complemento em posição final (no interior da oração relativa): (2) os livros que eu compus da philosaphia (D. Pedro, Livro dos Ofícios, séc. XV, in Pádua 1960: 70, cit. em Martins 2004) (3) e pasarã hu! rrio que perhy core dagoa doce (Carta de Pero Vaz de Caminha, fol. 3v., séc. XV, cit. em Martins 2004) (4) eram sobrinhas da molher que faleseo de lamsarote rodrigues (Coelho 1987; Inquisição de Évora: dos primórdios a 1668; 1612) (5) como eu me encontro num estado miseravel pella falta que há do vinho (CARDS 4002; 1890) • RIR com o modificador/complemento na periferia esquerda da oração relativa: (6) e qualquer que de nos primeiro morer (Martins 2001; Doc. Portugueses do Noroeste e da Região de Lisboa; 1266) (7) e esto por prool e verdade de h!a Licença que do dito senhor pera ello tenho (Martins 2001; Doc. Portugueses do Noroeste e da Região de Lisboa; 1540) (8) e o deradeiro que delas fiquar posa amte de sua morte nomear a terçeira (Martins 2001; Doc. Portugueses do Noroeste e da Região de Lisboa; 1528) (9) Nas bombas que de fogo estão queimando (Ramos 1982; L. de Camões, Os Lusíadas, V, 90; séc. XVI) Estes padrões coexistem com o padrão mais frequente, que envolve adjacência entre o núcleo e o seu modificador/complemento, como em (10): (10) [S-matrix ... [N modificador/complemento [RC ... t ... ]] ...] O objectivo central do presente estudo é demonstrar que a construção RIR constitui evidência para a elevação para as orações relativas restritivas por elevação (raising analysis), proposta originalmente por Schachter (1973) e Vergnaud (1974, 1985) e recentemente adoptada (e actualizada) por Kayne (1994), Bianchi (1999) e De Vries (2002). Numa primeira etapa do estudo, mostra-se que a análise clássica por adjunção (cf. Chomsky 1977, Brito 1991, entre outros) não permite explicar a presença de modificadores/complementos no interior da oração relativa. Dois argumentos são apresentados para justificar esta impossibilidade: (i) assumindo que os modificadores/complementos do nome são compostos com o nome numa posição externa à oração relativa, os contextos de RIR teriam de envolver a descida (lowering) dos modificadores/complementos para uma posição que não c-comanda o seu vestígio; (ii) se o núcleo e o seu modificador/complemento fossem gerados em posições distintas (o núcleo numa posição externa à oração relativa e o modificador/complemento numa posição interna), ficaria por explicar a existência de uma dependência semântica e de uma relação de selecção entre estes elementos. Numa segunda etapa, mostra-se que a construção RIR pode ser derivada pela combinação da análise de elevação das orações relativas com o apagamento de cópias em PF (Bo!kovi" e Nunes 2007). De forma esquemática, propõe-se que os casos de RIR e os casos de adjacência entre o núcleo e o seu modificador/complemento são derivados por uma estrutura como em (11), implementada em termos da teoria do movimento como cópia: (11) [os [ livros da philosaphia]i [que eu compus [livros da philosaphia] i]] Em função da estrutura informacional e de requisitos relacionados com a satisfação dos traços EPP de algumas categorias funcionais, mais do que uma cadeia de movimento pode ter lugar e podem ocorrer diversos tipos de apagamento de cópia (incluindo apagamento de cópias mais baixas e apagamento de partes distintas de diferentes cópias - scattered deletion), de forma a derivar os diferentes padrões de ordem de palavras identificados nestas construções. Os dados relativos à construção RIR são ainda integrados no contexto mais geral de ocorrência de sintagmas nominais descontínuos na história do português. O segundo estudo apresentado nesta dissertação discute a extraposição de orações relativas restritivas. Neste âmbito, o termo extraposição é usado para referir os contextos em que não existe adjacência entre a oração relativa e o seu antecedente, ocorrendo entre ambos material lexical da matriz, como se observa no esquema em (12). De forma a facilitar a leitura, o material da matriz que ocorre entre o antecedente e a oração relativa é destacado graficamente (sublinhado). (12) [ ... [antecedente] ... OR...] Em português europeu contemporâneo, as orações relativas restritivas podem ocorrer extrapostas, como se ilustra em (13)-(16): (13) Ainda por cima, dá-se conta de que as obras não têm licença camarária e faz diligências na Câmara das Caldas da Rainha que levam ao seu embargo (CETEMPúblico -Primeiro milhão) (14) Não havia ontem nenhum aluno na minha aula que estivesse concentrado. (15) Encontrei uma pessoa ontem que não via há muito tempo. (http://coisasbelasesujas.blogspot. com/2004_09_01_ archive.html) (16) Houve alguém no meio da noite que decidiu agarrar uma cana que supostamente seria do Aranha (...) (exemplo recolhido em: http://www.pescador.com.pt/livre/ viewtopic.php?f= 9&t=1772) Tal possibilidade também se regista na história do português. Contudo, em fases anteriores do português, a extraposição de orações relativas restritivas é mais permissiva do que em português europeu contemporâneo. O mesmo tipo de contraste se observa em diferentes línguas contemporâneas. A este respeito, é interessante notar que as línguas germânicas (em particular o inglês e o holandês) exibem possibilidade de extraposição generalizada, opondo-se desta forma ao português europeu contemporâneo (mas aproximando-se claramente da situação observada na diacronia do português). Os contrastes observados, quer na dimensão sincrónica quer na diacrónica, podem ser descritos de acordo com os seguintes parâmetros: (i) efeito de definitude; (ii) extraposição a partir de posições encaixadas; (iii) extraposição a partir de constituintes pré-verbais. Considerando, a título de exemplo, a situação do português contemporâneo, verifica-se que: (i) o antecedente de uma oração restritiva extraposta pode ser um sintagma nominal ‘fraco’, mas não um sintagma nominal ‘forte’ (Milsark 1974) (cf. (17)-(18)); (ii) o antecedente da oração restritiva extraposta não pode ser um constituinte encaixado, como é o caso do complemento de uma preposição (cf. exemplo (19) e (20); note-se que no último caso há um nível adicional de encaixe); (iii) o antecedente da relativa extraposta pode ser um sujeito pré-verbal, mas não um sujeito pós-verbal (cf. (21)-(22)). (17) a. Encontrei um rapaz no cinema que perguntou por ti. b. *Encontrei o rapaz no cinema que perguntou por ti. (18) a. Foram publicados dois livros recentemente que vale a pena ler. b. *Foram publicados aqueles livros recentemente que vale a pena ler. (19) a. Agradeci no jantar a alguns amigos que me ajudaram nesta fase difícil. b. *Agradeci a alguns amigos no jantar que me ajudaram nesta fase difícil. (20) a. Vi ontem a filha de um rapazi quei joga no Benfica. b. *Vi a filha de um rapazi ontem quei joga no Benfica. (21) a. Ontem explodiu uma bomba em Israel que causou 5 mortos. b. *Ontem uma bomba explodiu em Israel que causou 5 mortos. (22) a. Chegou um senhor ontem que fez muitas perguntas sobre ti. b. *Um senhor chegou ontem que fez muitas perguntas sobre ti. Ainda no que diz respeito à extraposição a partir de outros antecedentes pré-verbais, verifica-se que o antecedente de uma oração restritiva extraposta pode ser um constituinte wh-, um foco contrastivo ou um constituinte enfático/avaliativo, mas não um tópico. Quando analisados à luz de uma perspectiva comparativa, estes resultados tornam-se particularmente interessantes. Por um lado, as restrições acima apresentadas não se observam em fases anteriores do português. Por outro lado, línguas germânicas como o inglês e o holandês não exibem as restrições identificadas em português contemporâneo, apresentando antes a extraposição generalizada documentada na diacronia do português. Do ponto de vista teórico, estes contrastes são explicados pelo facto de a extraposição de orações restritivas poder envolver diferentes estruturas: uma estrutura que envolve coordenação especificante (e elipse), como em (23), (cf. De Vries 2002) e uma estrutura que envolve abandono (stranding) da oração relativa na sua posição básica, como em (24) (cf. Kayne 1994). (23) ... [CoP [XP1 antecedente YP] [ Co [XP2 [antecedente OR] YP]]] (coord. especificante) (24) ... [antecedentei YP [ ti OR]] (abandono da OR) As diferentes propriedades observadas resultam assim da estrutura sintáctica que gera as orações relativas restritivas extrapostas. Do ponto de vista diacrónico, propõe-se que a extraposição de restritivas é gerada por coordenação especificante em fases anteriores do português, sendo gerada por abandono da oração relativa em português europeu contemporâneo. Do ponto de vista inter-linguístico, coloca-se a hipótese de línguas como o inglês e o holandês gerarem a extraposição por coordenação especificante, em contraste com o português europeu contemporâneo (e possivelmente o italiano, o castelhano e o francês), que derivam a extraposição por abandono da oração relativa. Sugere-se, por fim, que a variação encontrada neste domínio decorre da presença de um núcleo coordenativo restritivo abstracto no léxico de diferentes línguas (ou de diferentes estádios de uma mesma língua). Salienta-se, ainda, que parece haver uma correlação entre a perda de extraposição por coordenação especificante e a possibilidade de extrapor membros coordenados em contextos tradicionais de coordenação. O terceiro e último estudo apresentado investiga um caso de (micro-)variação que envolve relativas apositivas introduzidas pelo morfema o qual. Do ponto de vista descritivo, existe um contraste marcado entre as propriedades das relativas apositivas com o qual na sincronia e diacronia do português. Este contraste pode ser descrito tendo em conta os seguintes parâmetros: (i) núcleo interno; (ii) extraposição; (iii) pied-piping; (iv) antecedentes oracionais; (v) antecedentes descontínuos; (vi) coordenação do morfema wh com outro sintagma nominal; (vii) força ilocutória; (viii) conjunção coordenativa. Considere-se, a título de exemplo, as propriedades referidas em (i), (iv) e (vi). Em português europeu contemporâneo, as relativas apositivas introduzidas por o qual não podem ocorrer com um núcleo interno (cf. (25)), não permitem antecedentes oracionais (cf. (26)), nem a coordenação do morfema-wh com outro sintagma nominal (cf. (27)). Estas estruturas encontram-se, porém, documentadas na história do português, como se ilustra em (25)-(28). (25) *Existem argumentos fortes a favor dessa análise, os quais argumentos apresentarei de seguida. (26) *O João chegou a horas, o qual muito me surprendeu. (27) *O presidente elogiou o João, o qual e a sua mulher têm desenvolvido um óptimo trabalho naquela instituição. (28) entrego e outorgo. ao Mosteiro de san Saluador de Moreyra. h!u casal que e en Rial de Pereyra. o qual casal a dita dona Mayor u"egas [...] mandou ao dito Mosteiro. (Martins 2001; Doc. Portugueses do Noroeste e da Região de Lisboa; 1282) (29) e se obrygou de paguar os dytos duzemtos Reaes e dous fframguãos e a dyta galinha de fforo despoys do ffaleçimemto da dyta molher do dito alluaro fernandez em cada h!u Ano pelo dito dia de natall pera o qual loguo obrygou seus b"es (Martins 2001; Doc. Portugueses do Noroeste e da Região de Lisboa; 1540) (30) filho de hum seu filho chamado per nome dom Henrrique, o qual era lidimo e, segundo conta a cronica, era o primeiro filho que o dito rei de Ungria ouve. O qual dom Henrrique e hum seu tio, irmão de sua madre,[...] se vierão a Castela aa corte, donde o dito rei dom Affonsso estava (CdP; Cronica de Portugal; 1419) Tomando em consideração estes e outros contrastes, propõe-se que as orações apositivas introduzidas por o qual não envolvem apenas uma estrutura sintáctica, podendo ser geradas por coordenação especificante (cf. De Vries 2006b) ou por elevação do núcleo (cf. Kayne 1994). Assim, defende-se que em estádios anteriores do português as orações apositivas introduzidas por o qual são geradas por coordenação especificante, enquanto em português europeu contemporâneo são geradas por elevação do núcleo. Tal hipótese deriva as propriedades contrastivas acima mencionadas, bem como os contrastes observados entre diversas línguas contemporâneas (e.g., entre o português europeu contemporâneo e o inglês contemporâneo). Por fim, é de salientar o facto de esta proposta de uma análise não unitária das orações apositivas assentar em evidência empírica sólida e bem controlada. Tomando como objecto uma construção muito específica – orações relativas apositivas introduzidas pelo morfema relativo o qual –, analisada em diferentes fases de uma mesma língua, este estudo envolveu um elevado grau de controlo de variáveis, muitas vezes inviável em estudos que comparam línguas historica e tipologicamente distantes. Com base nos dois últimos estudos, é possível concluir que a organização tradicional dos fenómenos linguísticos em torno dos tradicionais tipos de ‘construção’ (e.g., orações relativas apositivas e extraposição) pode facilmente induzir em erro. De facto, apesar de a classificação tradicional apontar para um comportamento uniforme das construções abrangidas sob determinada designação, nem sempre tal s

Universidade de Lisboa: Repositório.UL

Adapting a relation extraction pipeline for the BioCreAtIvE II task

Author: Grover Claire
Haddow Barry
Klein Ewan
Matthews Michael
Nielsen Leif Arda
Tobin Richard
Wang Xinglong
Publication venue
Publication date: 01/01/2007
Field of study

Edinburgh Research Explorer