386 research outputs found

    VerbAtlas: a novel large-scale verbal semantic resource and its application to semantic role labeling

    Get PDF
    We present VerbAtlas, a new, hand-crafted lexical-semantic resource whose goal is to bring together all verbal synsets from WordNet into semantically-coherent frames. The frames define a common, prototypical argument structure while at the same time providing new concept-specific information. In contrast to PropBank, which defines enumerative semantic roles, VerbAtlas comes with an explicit, cross-frame set of semantic roles linked to selectional preferences expressed in terms of WordNet synsets, and is the first resource enriched with semantic information about implicit, shadow, and default arguments. We demonstrate the effectiveness of VerbAtlas in the task of dependency-based Semantic Role Labeling and show how its integration into a high-performance system leads to improvements on both the in-domain and out-of-domain test sets of CoNLL-2009. VerbAtlas is available at http://verbatlas.org

    Le politiche abitative della Roma fascista: l’esempio della Borgata Popolarissima di Tormarancia

    Get PDF
    L’elaborato si pone come obiettivo la ricostruzione delle vicende che diedero vita ad una delle borgate popolarissime della Roma degli anni Trenta, Tormarancia. Le demolizioni dovute al nuovo piano regolatore fascista, il tentativo di rilancio dell’immagine di Roma attraverso vaste operazioni di decoro mirate ad abbattere insediamenti abusivi e baracche: l’emergenza abitativa diviene materia di complessa gestione ed una vera piaga per la Capitale. Grazie all’Archivio Storico Capitolino è possibile ricostruire lestorie e le condizioni di vita degli “ultimi” che popolavano Roma: le schede personali di ogni nuovo inquilino della borgata risultano essere un vero e proprio “tesoro d’archivio”, ricco di informazioni preziose per un’indagine socio - antropologica dei primi abitanti delle borgate roman

    Gli archivi raccontano la genesi di un quartiere: Garbatella, la Tenuta di Monte Bagnaia e le proprietà Armellini

    Get PDF
    Gli archivi possono essere strumenti di analisi e studio dei fenomeni che l'uomo guida per modificare il territorio: la stretta relazione tra i lavori pubblici e le amministrazioni competenti, tra queste ultime ed i proprietari dei terreni, mette gli archivi degli enti locali e quelli familiari nelle condizioni di poter narrare la storia dei luoghi, essere specchio di ciò che era, del percorso che è stato svolto dall'uomo nel plasmare a suo piacimento il territorio. Si può conoscere quindi la genesi di un quartiere popolare, costruito in zone di campagna, spesso malsane e acquitrinose, come la Garbatella, attraverso le carte dell'Archivio Storico Capitolino per quanto riguarda la Ripartizione V (Lavori pubblici ed Agro Romano), dell'Archivio di Stato di Roma con il Catasto Gregoriano (Collezione Disegni e Mappe) e dell'Archivio dell'Amministrazione Torlonia conservato presso l'Archivio Centrale dello Stato, nel quale possiamo studiare piante, mappe e mutui di bonifica. Le carte relative alla Tenuta di Monte Bagnaia e alle proprietà della famiglia Armellini sono dunque esempi chiari di come gli archivi possano svolgere il ruolo di guida attraverso la storia delle città, del loro passato rurale e del loro svilupp

    Generic Structure and Copy Elements in Indonesian Cosmetics Copy Ads on Instagram

    Get PDF
    The study aims to elaborate the generic structure of Indonesian cosmetics advertisements on Instagram and copy elements distribution in the generic structure. Theoretical framework in the study is based on Hasan's (1989a) theory of analyzing genre to elaborate the genre of copy ads on Instagram. Moreover, the copy elements proposed by Maslen (2007) which include feature, benefit, and call to action are also utilized to examine the generic structure in depth using the perspective of copywriting. Qualitative method is used in current research employing descriptive statistics to analyze data. Data collection comprises 32 copy ads from 8 Indonesian-written Instagram accounts which specify in promoting cosmetics products on Instagram. Results show that the genre of Indonesian cosmetics copy ads on Instagram manifested three types of generic components including 'opening', 'product description', and 'closing'. As for the copy elements distribution in the generic structure, benefit and call to action are found mostly in 'opening', feature and benefit are in 'product description', and call to action is found mostly in 'closing'. Further research can be conducted to analyze the data obtained from diverse sources and languages in order to increase the credibility of results in current research. Keywords: Generic structure, generic components, copy elements, copy ads, Instagra

    Bridging the Gap in Multilingual Semantic Role Labeling: A Language-Agnostic Approach

    Get PDF
    Recent research indicates that taking advantage of complex syntactic features leads to favorable results in Semantic Role Labeling. Nonetheless, an analysis of the latest state-of-the-art multilingual systems reveals the difficulty of bridging the wide gap in performance between high-resource (e.g., English) and low-resource (e.g., German) settings. To overcome this issue, we propose a fully language-agnostic model that does away with morphological and syntactic features to achieve robustness across languages. Our approach outperforms the state of the art in all the languages of the CoNLL-2009 benchmark dataset, especially whenever a scarce amount of training data is available. Our objective is not to reject approaches that rely on syntax, rather to set a strong and consistent language-independent baseline for future innovations in Semantic Role Labeling. We release our model code and checkpoints at https://github.com/SapienzaNLP/multi-srl

    Conception: Multilingually-Enhanced, Human-Readable Concept Vector Representations

    Get PDF
    To date, the most successful word, word sense, and concept modelling techniques have used large corpora and knowledge resources to produce dense vector representations that capture semantic similarities in a relatively low-dimensional space. Most current approaches, however, suffer from a monolingual bias, with their strength depending on the amount of data available across languages. In this paper we address this issue and propose Conception, a novel technique for building language-independent vector representations of concepts which places multilinguality at its core while retaining explicit relationships between concepts. Our approach results in high-coverage representations that outperform the state of the art in multilingual and cross-lingual Semantic Word Similarity and Word Sense Disambiguation, proving particularly robust on low-resource languages. Conception – its software and the complete set of representations – is available at https://github.com/SapienzaNLP/conception

    Biases in Large Language Models: Origins, Inventory and Discussion

    Get PDF

    Ascesa e declino della petrolchimica in Italia. Il caso sardo. Una guida alle fonti archivistiche

    Get PDF
    La tesi di dottorato frutto dell’attività di ricerca svolta negli ultimi tre anni è stata immaginata come una guida alle fonti archivistiche per la storia della SIR, azienda petrolchimica attiva principalmente in Sardegna tra i primi anni Sessanta del ‘900 e l’inizio degli anni Ottanta. Le vicende fulcro di questo studio rappresentano un caso di studio indagato per poter esaminare diverse problematiche proprie della disciplina archivistica, fortemente intrecciate con la ricerca in campo contemporaneo. La struttura della guida ha imposto un’organizzazione dell’elaborato su tre capitoli volti ad offrire al lettore la complessità della tematica da più punti di osservazione. In primis si è ritenuto fondamentale contestualizzare le vicende oggetto di studio, che hanno fatto da sfondo allo sviluppo e al declino della SIR, dettagliando tali eventi attraverso l’esame e l’approfondimento delle fonti bibliografiche e archivistiche ad oggi a disposizione degli studiosi. Il primo capitolo, La petrolchimica e la Sardegna. Ascesa e declino della SIR di Nino Rovelli, si va a suddividere in cinque paragrafi, incentrati sulla narrazione degli eventi intercorsi tra gli anni Cinquanta e gli anni Ottanta nel settore chimico e in particolare nel sassarese, partendo dalle prime esperienze imprenditoriali di Nino Rovelli. Il racconto della genesi del terzo polo chimico, che insieme ad ENI e Montedison si è reso partecipe della cosiddetta “guerra chimica”, parte da Solbiate Olona, in Lombardia, terra natia di Rovelli. Da una piccola azienda familiare iniziò il percorso che portò alla nascita dalla Sarda Industria Resine e delle molteplici imprese di servizio nate per trainare fondi pubblici sugli stabilimenti di Porto Torres, cittadina del nord della Sardegna che diverrà uno dei principali poli petrolchimici italiani. I cinque paragrafi uniscono la storia dell’azienda e del suo patron alle vicende politico – sindacali di cui i protagonisti sono gli operai, le molteplici voci che hanno raccontato vent’anni di petrolchimica e che hanno dato vita a tante azioni volte a difendere diritti e interessi dei lavoratori e della loro terra. Di sfondo c’è la lotta tutta politica di cui la chimica è stata prima protagonista negli anni Settanta, un quadro nazionale del quale non si può non tener conto e che è raccontato attraverso le carte d’archivio e le ricostruzioni giornalistiche. La storia della SIR è anche processi, inchieste, scandali: per raccontare in modo dettagliato ed esaustivo il completo percorso della petrolchimica in Sardegna bisognerebbe arrivare agli anni duemila, consultare le carte dell’azienda requisite per le numerose indagini partite dal 1979 e scavare negli archivi giudiziari alla ricerca di documenti utili per raggiungere una completezza di informazioni. Questo, ad oggi, non è possibile. Perciò si è ritenuto di mettere un limite temporale alla presente ricerca ponendo come data ultima il 1980, alla creazione del consorzio di salvataggio del colosso di Rovelli, non entrando nelle maglie del processo IMI – SIR. I tempi recenti delle vicende trattate e la difficoltà di accesso alle fonti archivistiche più contemporanee hanno reso complessa la stesura di questo elaborato e la ricerca delle carte, in particolare quelle prodotte negli anni Settanta. Per questi motivi protrarre la ricerca oltre la data scelta non sarebbe stato utile e fruttuoso, ma dispersivo e di difficile realizzazione. Il secondo capitolo, Un’isola e un arcipelago di fonti. Come costruire la Guida, già nel titolo offre uno spaccato di cosa è stata la ricerca archivistica che ha portato alla realizzazione di questa guida alle fonti. Si è partiti dall’assunto per cui, mancando l’archivio proprio del soggetto di cui si stava indagando la storia, era fondamentale andare a costruire un percorso reticolare tra le fonti che rendesse evidente la possibilità di ricostruire le vicende accadute anche attraverso fonti secondarie e supplementari. Partendo proprio dalle difficoltà incontrate e dalla complessità del panorama delle fonti archivistiche contemporanee, si è cercato di offrire un panorama ampio delle tipologie di carte alle quali la storia può attingere per narrare la contemporaneità, tutte fonti presenti nella guida ed indagate per offrile al lettore. I molteplici percorsi di ricerca intrapresi nei tre anni di dottorato hanno offerto vicoli ciechi, strade chiuse, ma anche proficui bacini informativi da cui poter attingere per aggiungere elementi alla ricerca storica su questi fatti. L’obiettivo di questo secondo capitolo, anch’esso suddiviso in più paragrafi, è quello di dar conto di queste diversissime linee di ricerca, contestualizzarle e far emergere le problematiche archivistiche ad esse connesse. Dopo un primo racconto del lavoro di ricerca e studio svolto, il capitolo approfondisce i molteplici campi in cui si può addentrare la ricerca archivistica in campo contemporaneo, cercando di offrire, attraverso la letteratura edita in materia, un quadro chiaro. Infine, il cuore del lavoro svolto è la guida, terzo capitolo della tesi, che istituto per istituto da conto di tutte le fonti consultate e disponibili alla ricerca sulla storia della SIR. In questo strumento di ricerca le fonti sono rappresentate in forma gerarchica: dapprima la documentazione conservata dagli istituti propri del panorama archivistico statale quali l’Archivio Centrale dello Stato e gli archivi di Stato di Sassari e Cagliari, di seguito le carte conservate dall’Archivio Storico della Camera dei Deputati. Successivamente si ritrovano elencati gli archivi economici, dalla Banca d’Italia alla Camera di Commercio della Provincia di Sassari, dalle preziose carte dell’Istituto Mobiliare Italiano a quelle della Banca Europea degli Investimenti. Il percorso seguita attraverso fondazioni, carte della politica, archivi d’azienda, carte dei sindacati, archivi museali e fonti audiovisive, con una descrizione a livello di fascicolo ed un breve approfondimento riguardo il soggetto conservatore ed il fondo nel quale si ritrova la documentazione. L’elenco delle fonti potrebbe essere ben più ricco e potrà esserlo, quando molteplici fonti ad oggi non consultabili saranno a disposizione della ricerca, aggiungendo tasselli importanti alle vicende come ad oggi le conosciamo

    Universal Semantic Annotator: the First Unified API for WSD, SRL and Semantic Parsing

    Get PDF
    In this paper, we present the Universal Semantic Annotator (USeA), which offers the first unified API for high-quality automatic annotations of texts in 100 languages through state-of-the-art systems for Word Sense Disambiguation, Semantic Role Labeling and Semantic Parsing. Together, such annotations can be used to provide users with rich and diverse semantic information, help second-language learners, and allow researchers to integrate explicit semantic knowledge into downstream tasks and real-world applications

    A Tour of Explicit Multilingual Semantics: Word Sense Disambiguation, Semantic Role Labeling and Semantic Parsing

    Get PDF
    The recent advent of modern pretrained language models has sparked a revolution in Natural Language Processing (NLP), especially in multilingual and cross-lingual applications. Today, such language models have become the de facto standard for providing rich input representations to neural systems, achieving unprecedented results in an increasing range of benchmarks. However, questions that often arise are: firstly, whether current language models are, indeed, able to capture explicit, symbolic meaning; secondly, if they are, to what extent; thirdly, and perhaps more importantly, whether current approaches are capable of scaling across languages. In this cutting-edge tutorial, we will review recent efforts that have aimed at shedding light on meaning in NLP, with a focus on three key open problems in lexical and sentence-level semantics: Word Sense Disambiguation, Semantic Role Labeling, and Semantic Parsing. After a brief introduction, we will spotlight how state-of-the-art models tackle these tasks in multiple languages, showing where they excel and where they fail. We hope that this tutorial will broaden the audience interested in multilingual semantics and inspire researchers to further advance the field
    corecore