6 research outputs found

    The PAIS? Corpus of Italian Web Texts

    Get PDF
    PAISA\u27 is a Creative Commons licensed, large web corpus of contemporary Italian. We describe the design, harvesting, and processing steps involved in its creation

    Proceedings

    Get PDF
    Proceedings of the Ninth International Workshop on Treebanks and Linguistic Theories. Editors: Markus Dickinson, Kaili Müürisep and Marco Passarotti. NEALT Proceedings Series, Vol. 9 (2010), 268 pages. © 2010 The editors and contributors. Published by Northern European Association for Language Technology (NEALT) http://omilia.uio.no/nealt . Electronically published at Tartu University Library (Estonia) http://hdl.handle.net/10062/15891

    Developing a large scale FrameNet for Italian - The IFrameNet experience

    Get PDF
    In this thesis we present the development and the current status of the IFrameNet project, aimed at the construction of a large-scale lexical semantic resource for the Italian language based on Frame Semantics theories. We will begin by contextualizing our work in the wider context of Frame Semantics and of the FrameNet project, which, since 1997, has attempted to apply these theories to lexicography. We will then analyse and discuss the applicability of the structure of the American resource to Italian and more specifically we will focus on the domain of fear, worry, and anxiety. We will finally propose some modifications aimed at improving this domain of the resource in relation to its coherence, its ability to accurately represent the linguistic reality and in particular in order to make it possible to apply it to Italian

    Populating Legal Ontologies using Information Extraction based on Semantic Role Labeling and Text Similarity

    Get PDF
    This thesis seeks to address the problem of the 'resource consumption bottleneck' of creating (legal) semantic technologies manually. It builds on research in legal theory, ontologies and natural language processing in order to semi-automatically normalise legislative text, extract definitions and structured norms, and link normative provisions to recitals. The output is intended to help make laws more accessible, understandable, and searchable in a legal document management system. Key contributions are: - an analysis of legislation and structured norms in legal ontologies and compliance systems in order to determine the kind of information that individuals and organisations require from legislation to understand their rights and duties; - an analysis of the semantic and structural challenges of legislative text for machine understanding; - a rule-based normalisation module to transform legislative text into regular sentences to facilitate natural language processing; - a Semantic Role Labeling based information extraction module to extract definitions and norms from legislation and represent them as structured norms in legal ontologies; - an analysis of the impact of recitals on the interpretation of legislative norms; - a Cosine Similarity based text similarity module to link recitals to relevant normative provisions; - a description of important challenges that have emerged from this research which may prove useful for future work in the extraction and linking of information from legislative text

    Enriching the ISST-TANL Corpus with Semantic Frames

    No full text
    The paper describes the design and the results of a manual annotation methodology devoted to enrich the ISST–TANL Corpus with Semantic Frames information. The main issues encountered in applying the English FrameNet annotation criteria to a corpus of Italian language are discussed together with the choice of anchoring the semantic annotation layer to the underlying dependency syntactic structure. We also describe an experiment to measure inter-annotator agreement and a first case study to extend and specialise FrameNet annotation to a corpus of legislative texts

    UFO-L: UMA ONTOLOGIA NÚCLEO DE ASPECTOS JURÍDICOS CONSTRUÍDA SOB A PERSPECTIVA DAS RELAÇÕES JURÍDICAS

    Get PDF
    Nas últimas décadas, o Direito tem se voltado para a Computação em busca de soluções para a representação do domínio jurídico, para o armazenamento de grandes volumes de informação e para a recuperação dessas informações com o intuito de gerar conhecimento para apoio a tomadas de decisões. Dentre as diversas soluções propostas para a representação do domínio jurídico, destacam-se as ontologias jurídicas, que propõem a representação de uma conceitualização compartilhada de conceitos jurídicos e suas relações. As ontologias jurídicas, que representam conceitos jurídicos genéricos passíveis de serem usados e reutilizados na construção de outras ontologias ou em linguagens de modelagem do domínio jurídico, são denominadas Legal Core Ontologies (LCOs) ou Ontologia Núcleo Jurídica. A abordagem da maioria das LCOs é a da representação do Direito focado nas normas jurídicas. No entanto, nesta pesquisa, optou-se por uma abordagem focada nas relações jurídicas para a investigação e para a construção de uma ontologia núcleo jurídica. Embora ambas as abordagens tragam benefícios, a vantagem dessa última é a possibilidade da explicitação de outros conceitos e relacionamentos que não ficam evidenciados na primeira. Em particular, o entendimento da relação jurídica como relação entre sujeitos que desempenham papéis jurídicos, com posições jurídicas inerentes a estes papéis, as quais estão dispostas de tal forma a influenciar os demais sujeitos/papéis jurídicos envolvidos. Neste contexto, o problema a ser atacado está na seara da lacuna entre Computação e Direito, ou seja, no problema de modelagem conceitual aplicada ao recorte da realidade jurídica e como ela é representada. A base teórica desta tese é composta por duas teorias: a Teoria dos Direitos Constitucionais de Robert Alexy e a Teoria dos Fundamentos Ontológicos para Modelos Conceituais Estruturais de Giancarlo Guizzardi. O resultado dessa investigação é um artefato denominado UFO-L e seu catálogo de padrões de modelagem, aplicado em análises ontológicas, na modelagem de domínios jurídicos e na construção de linguagens visuais de domínio jurídico
    corecore