    Modeling and querying spatio-temporal clinical databases with multiple granularities

    In molti campi di ricerca, i ricercatori hanno la necessit\ue0 di memorizzare, gestire e interrogare dati spazio-temporali. Tali dati sono classici dati alfanumerici arricchiti per\uf2 con una o pi\uf9 componenti temporali, spaziali e spazio-temporali che, con diversi possibili significati, li localizzano nel tempo e/o nello spazio. Ambiti in cui tali dati spazio-temporali devono essere raccolti e gestiti sono, per esempio, la gestione del territorio o delle risorse naturali, l'epidemiologia, l'archeologia e la geografia. Pi\uf9 in dettaglio, per esempio nelle ricerche epidemiologiche, i dati spazio-temporali possono servire a rappresentare diversi aspetti delle malattie e delle loro caratteristiche, quali per esempio la loro origine, espansione ed evoluzione e i fattori di rischio potenzialmente connessi alle malattie e al loro sviluppo. Le componenti spazio-temporali dei dati possono essere considerate come dei "meta-dati" che possono essere sfruttati per introdurre nuovi tipi di analisi sui dati stessi. La gestione di questi "meta-dati" pu\uf2 avvenire all'interno di diversi framework proposti in letteratura. Uno dei concetti proposti a tal fine \ue8 quello delle granularit\ue0. In letteratura c'\ue8 ampio consenso sul concetto di granularit\ue0 temporale, di cui esistono framework basati su diversi approcci. D'altro canto, non esiste invece un consenso generale sulla definizione di un framework completo, come quello delle granularit\ue0 temporali, per le granularit\ue0 spaziali e spazio-temporali. Questa tesi ha lo scopo di riempire questo vuoto proponendo un framework per le granularit\ue0 spaziali e, basandosi su questo e su quello gi\ue0 presente in letteratura per le granularit\ue0 temporali, un framework per le granularit\ue0 spazio-temporali. I framework proposti vogliono essere completi, per questo, oltre alle definizioni dei concetti di granularit\ue0 spaziale e spazio-temporale, includono anche la definizione di diversi concetti legati alle granularit\ue0, quali per esempio le relazioni e le operazioni tra granularit\ue0. Le relazioni permettono di conoscere come granularit\ue0 diverse sono legate tra loro, costruendone anche una gerarchia. Tali informazioni sono poi utili al fine di conoscere se e come \ue8 possibile confrontare dati associati e rappresentati con granularit\ue0 diverse. Le operazioni permettono invece di creare nuove granularit\ue0 a partire da altre granularit\ue0 gi\ue0 definite nel sistema, manipolando o selezionando alcune loro componenti. Basandosi su questi framework, l'obiettivo della tesi si sposta poi sul mostrare come le granularit\ue0 possano essere utilizzate per arricchire basi di dati spazio-temporali gi\ue0 esistenti al fine di una loro migliore e pi\uf9 ricca gestione e interrogazione. A tal fine, proponiamo qui una base di dati per la gestione dei dati riguardanti le granularit\ue0 temporali, spaziali e spazio-temporali. Nella base di dati proposta possono essere rappresentate tutte le componenti di una granularit\ue0 come definito nei framework proposti. La base di dati pu\uf2 poi essere utilizzata per estendere una base di dati spazio-temporale esistente aggiungendo alle tuple di quest'ultima delle referenze alle granularit\ue0 dove quei dati possono essere localizzati nel tempo e/o nel spazio. Per dimostrare come ci\uf2 possa essere fatto, nella tesi introduciamo la base di dati sviluppata ed utilizzata dal Servizio Psichiatrico Territoriale (SPT) di Verona. Tale base di dati memorizza le informazioni su tutti i pazienti venuti in contatto con l'SPT negli ultimi 30 anni e tutte le informazioni sui loro contatti con il servizio stesso (per esempio: chiamate telefoniche, visite a domicilio, ricoveri). Parte di tali informazioni hanno una componente spazio-temporale e possono essere quindi analizzate studiandone trend e pattern nel tempo e nello spazio. Nella tesi quindi estendiamo questa base di dati psichiatrica collegandola a quella proposta per la gestione delle granularit\ue0. A questo punto i dati psichiatrici possono essere interrogati anche sulla base di vincoli spazio-temporali basati su granularit\ue0. L'interrogazione di dati spazio-temporali associati a granularit\ue0 richiede l'utilizzo di un linguaggio d'interrogazione che includa, oltre a strutture, operatori e funzioni spazio-temporali per la gestione delle componenti spazio-temporali dei dati, anche costrutti per l'utilizzo delle granularit\ue0 nelle interrogazioni. Quindi, partendo da un linguaggio d'interrogazione spazio-temporale gi\ue0 presente in letteratura, in questa tesi proponiamo anche un linguaggio d'interrogazione che permetta ad un utente di recuperare dati da una base di dati spazio-temporale anche sulla base di vincoli basati su granularit\ue0. Il linguaggio viene introdotto fornendone la sintassi e la semantica. Inoltre per mostrare l'effettivo ruolo delle granularit\ue0 nell'interrogazione di una base di dati clinica, mostreremo diversi esempi di interrogazioni, scritte con il linguaggio d'interrogazione proposto, sulla base di dati psichiatrica dell'SPT di Verona. Tali interrogazioni spazio-temporali basate su granularit\ue0 possono essere utili ai ricercatori ai fini di analisi epidemiologiche dei dati psichiatrici.In several research fields, temporal, spatial, and spatio-temporal data have to be managed and queried with several purposes. These data are usually composed by classical data enriched with a temporal and/or a spatial qualification. For instance, in epidemiology spatio-temporal data may represent surveillance data, origins of disease and outbreaks, and risk factors. In order to better exploit the time and spatial dimensions, spatio-temporal data could be managed considering their spatio-temporal dimensions as meta-data useful to retrieve information. One way to manage spatio-temporal dimensions is by using spatio-temporal granularities. This dissertation aims to show how this is possible, in particular for epidemiological spatio-temporal data. For this purpose, in this thesis we propose a framework for the definition of spatio-temporal granularities (i.e., partitions of a spatio-temporal dimension) with the aim to improve the management and querying of spatio-temporal data. The framework includes the theoretical definitions of spatial and spatio-temporal granularities (while for temporal granularities we refer to the framework proposed by Bettini et al.) and all related notions useful for their management, e.g., relationships and operations over granularities. Relationships are useful for relating granularities and then knowing how data associated with different granularities can be compared. Operations allow one to create new granularities from already defined ones, manipulating or selecting their components. We show how granularities can be represented in a database and can be used to enrich an existing spatio-temporal database. For this purpose, we conceptually and logically design a relational database for temporal, spatial, and spatio-temporal granularities. The database stores all data about granularities and their related information we defined in the theoretical framework. This database can be used for enriching other spatio-temporal databases with spatio-temporal granularities. We introduce the spatio-temporal psychiatric case register, developed by the Verona Community-based Psychiatric Service (CPS), for storing and managing information about psychiatric patient, their personal information, and their contacts with the CPS occurred in last 30 years. The case register includes both clinical and statistical information about contacts, that are also temporally and spatially qualified. We show how the case register database can be enriched with spatio-temporal granularities both extending its structure and introducing a spatio-temporal query language dealing with spatio-temporal data and spatio-temporal granularities. Thus, we propose a new spatio-temporal query language, by defining its syntax and semantics, that includes ad-hoc features and constructs for dealing with spatio-temporal granularities. Finally, using the proposed query language, we report several examples of spatio-temporal queries on the psychiatric case register showing the ``usage'' of granularities and their role in spatio-temporal queries useful for epidemiological studies

    Lean office negli approvvigionamenti. Analisi di un caso aziendale

    Progetto di analisi delle inefficienze di processo in un ufficio acquisti e implementazione soluzioniope


    Este artigo apresenta um projeto de pesquisa , cuja intenção é descrever e analisar as consoantes africadas de um dialeto do PB, como um processo gradiente de relevância sociofonética. Os questionamentos surgiram da necessidade de explicar o fenômeno em distinções mínimas, mas de importância lingüística. O estudo preliminar com uma informante mostrou um ruído “leve??? em /t/ e /d/ diante da vogal /i/, devido à interação com falantes que produziam africadas plenas. O estudo adota a perspectiva da Fonologia Articulatória (FAR), que relativiza a caracterização da fala como tradução de seqüências de símbolos em um processo dinâmico. Tenta-se determinar como a evocação e implementação dos gestos articulatórios se dão a partir de requisitos que extrapolam as configurações fonéticas habituais do falante. As reestruturações do sistema fonológico, decorrentes do uso e da repetição criativa, introduzem variações que são indícios de mudanças lentas em progresso. Palavras-chave: Fonética e Fonologia, Fonologia Articulatória, Africadas, Processos gradientes

    An inference system for relationships between spatio-temporal granularities

    Temporal, spatial, and spatio-temporal granularities allow one to qualify classical data locating them in time and space. In order to compare data qualified with different granularities and associate data to different granularities, it is necessary to know how the involved granularities are related. However, the explicit calculation of these relationships may be heavy from a computational point of view. Thus, in this paper, we propose an inference system for inferring definitely valid relationships starting from a set of already known valid relationships without to calculate them explicitly. We will prove the soundness and completeness of the system

    Alveolar stops allophonic gradients of a dialect in contact

    Orientador: Eleonora Cavalcante AlbanoDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Estudos da LinguagemResumo: Esta pesquisa descreve aspectos gradientes de uma alofonia do português brasileiro (PB); trata-se da palatalização das oclusivas alveolares /t/ e /d/, que diante de /i/ passam a ser produzida preferencialmente como /t/ e /d/. As chamadas africadas ocorrem categoricamente em certos dialetos do PB, mas em outros estão em processo de implementação, já que são tidas como uma variedade de prestígio. São consideradas sons que apresentam certa instabilidade em suas fronteiras, além de uma estrutura temporal complexa. Sendo assim, a meta é descrever as nuances dos processos fonéticos das africadas em um grupo de falantes de Jundiaí-SP que passa pelo processo da variação, pelo fato de viajarem, diariamente, para Campinas-SP. Segundo estudos de Leite (2004, 2010), o falar da população de Campinas é considerado menos estigmatizado, e mais "intermediário" em relação ao dialeto da capital do que o modo de falar apresentado na maioria das cidades do interior de São Paulo. A partir da análise da fala de cinco estudantes do sexo masculino, verificou-se que a variação não é categórica ou irreversível, apresentando aspectos gradientes. As gravações foram feitas a partir da leitura, em diferentes taxas de elocução, de um conjunto de textos com palavras que apresentavam as oclusivas alveolares diante da vogal anterior. Além disso, também foram gravadas amostras de palavras em uma tarefa de repetição, em que controlamos as seguintes variáveis: freqüência de ocorrência na língua e posição silábica da consoante estudada. Para a análise, foram computadas as medidas de momentos espectrais (Forrest et. al. 1988). A partir da comparação dos momentos espectrais das africadas com os momentos espectrais de um conjunto de fricativas alveolares e pós-alveolares dos próprios sujeitos, estabeleceu-se, em um estudo transversal, o local de articulação das primeiras e a instabilidade das produções do grupo dos cinco sujeitos. A metodologia estatística utilizada foi a Análise de Variância (ANOVA) para medidas repetidas, seguida do teste post-hoc de Tukey, para discriminação das diferenças de local. Pelas análises estatísticas do conjunto de dados, pôde-se observar como cada parâmetro espectral se comporta e, assim, entender a mudança de lugar de articulação. Realizou-se também uma análise longitudinal com dois dos sujeitos, ao longo de um ano. Neste caso, a estatística descritiva de três coletas de dados mostrou que os dois sujeitos observados podem estar em estágios diferentes da implantação e que as estratégias de "reparar" a própria fala podem ser mais ou menos consistentes. Também foi possível verificar, pela análise da mudança de taxa de elocução, que, num caso, há mais controle do uso da variável inovadora na leitura normal do que na rápida. Para complementar as análises fonéticas, também foram feitas entrevistas com os sujeitos, a fim de verificar suas atitudes em relação ao próprio dialeto. Os resultados que investigaram a frequência de ocorrência não foram significativos e aqueles que investigaram posição tônica mostraram apenas alguns resultados com significância estatística. A Fonologia Gestual (Browman e Goldstein, 1992, 1995; Goldstein e Fowler, 2003) mostra-se adequada à descrição e ao modelamento de processos gradientes como este, porque suas postulações teóricas dão especial importância à dinâmica dos processos fonológicos. Além disso, incorporam com sucesso os fatores tempo e magnitude, diretamente relacionados à idéia de movimento dos articuladoresAbstract: The aim of this study is to investigate palatalization of alveolar stops before [i] in a Brazilian Portuguese dialect, namely, that spoken in Jundiaí, a town in the state of São Paulo. Affricates occur in many dialects of Brazilian Portuguese as allophonic variation in such a context, while in others dialects alveolar stops are undergoing change towards them, as they are considered a prestige variety. Affricates present some instability in their borders, and a complex temporal structure. Thus, our goal is to describe phonetic detail in the affrication process, in a group of speakers who are implementing such a linguistic change, due to daily travels to Campinas. Studies by Leite (2004, 2010) show the dialect spoken in Campinas is considered less stigmatized and more "intermediate" than others from the same state. Encouraged by these results, we conducted five case studies with speakers from Jundiaí. Preliminary data of this five male students showed that affricates have continuous characteristics between alveolar stops and their post-alveolar counterparts. First recordings were made in a reading task. At different speech rates, subjects read a set of texts with words that had alveolar stops before the front high vowel. In addition, samples were also recorded in a word repetition task, with the following controlled variables: word frequency of occurrence in the language and syllabic stress. We measured spectral moments (FORREST et. al. 1988) and compared those measures to the spectral moments of a set of alveolar and post-alveolar fricatives. Conservative speakers were expected to prefer the alveolar productions, and less conservative ones were expected to prefer either post-alveolar or an intermediate production. The analyses were divided as follows. At first, we conducted a cross-sectional study, in witch we compared fricatives and affricates articulation of the five subjects using Analysis of variance (ANOVA) for repeated measures, followed by post-hoc test Tukey for discrimination of articulation place. Statistical analysis showed the behavior of each spectral parameter. Secondly, we conducted a longitudinal analysis of two subjects over a year. Descriptive statistics of spectral moments of three data session showed their speech at different stages, using different "repair" strategies; it also showed sufficient variation so as to indicate instability in affricate implementation. It also was observed, by changes in speaking rate, which subject were more consistent in the uses of innovation. To complement the phonetic analysis, interviews were conducted, in order to gather some of their attitudes toward their own dialect. Gestural Phonology (BROWMAN & GOLDSTEIN, 1992, 1995, GOLDSTEIN & FOWLER, 2003) has proven to be adequate for describing and modeling the gradient processes involved this variation. Since its theoretical postulates capture the dynamics of speech production over small stretches of time, we hope they also help illuminate the dynamics of language changeMestradoLinguisticaMestre em Linguístic

    Normalizing Spontaneous Reports into MedDRA: some Experiments with MagiCoder

    Text normalization into medical dictionaries is useful to support clinical task. A typical setting is Pharmacovigilance (PV). The manual detection of suspected adverse drug reactions (ADRs) in narrative reports is time consuming and Natural Language Processing (NLP) provides a concrete help to PV experts. In this paper we carry on experiments for testing performances of MagiCoder, an NLP application designed to extract MedDRA terms from narrative clinical text. Given a narrative description, MagiCoder proposes an automatic encoding. The pharmacologist reviews, (possibly) corrects, and then validates the solution. This drastically reduces the time needed for the validation of reports with respect to a completely manual encoding. In previous work we mainly tested MagiCoder performances on Italian written spontaneous reports. In this paper, we include some new features, change the experiment design, and carry on more tests about MagiCoder. Moreover, we do a change of language, moving to English documents. In particular, we tested MagiCoder on the CADEC dataset, a corpus of manually annotated posts about ADRs collected from social media

    From narrative descriptions to MedDRA: automagically encoding adverse drug reactions

    The collection of narrative spontaneous reports is an irreplaceable source for the prompt detection of suspected adverse drug reactions (ADRs). In such task qualified domain experts manually revise a huge amount of narrative descriptions and then encode texts according to MedDRA standard terminology. The manual annotation of narrative documents with medical terminology is a subtle and expensive task, since the number of reports is growing up day-by-day. Natural Language Processing (NLP) applications can support the work of people responsible for pharmacovigilance. Our objective is to develop NLP algorithms and tools for the detection of ADR clinical terminology. Efficient applications can concretely improve the quality of the experts\u2019 revisions. NLP software can quickly analyze narrative texts and offer an encoding (i.e., a list of MedDRA terms) that the expert has to revise and validate. MagiCoder, an NLP algorithm, is proposed for the automatic encoding of free-text descriptions into MedDRA terms. MagiCoder procedure is efficient in terms of computational complexity. We tested MagiCoder through several experiments. In the first one, we tested it on a large dataset of about 4500 manually revised reports, by performing an automated comparison between human and MagiCoder encoding. Moreover, we tested MagiCoder on a set of about 1800 reports, manually revised ex novo by some experts of the domain, who also compared automatic solutions with the gold reference standard. We also provide two initial experiments with reports written in English, giving a first evidence of the robustness of MagiCoder w.r.t. the change of the language. For the current base version of MagiCoder, we measured an average recall and precision of and , respectively. From a practical point of view, MagiCoder reduces the time required for encoding ADR reports. Pharmacologists have only to review and validate the MedDRA terms proposed by the application, instead of choosing the right terms among the 70\u202fK low level terms of MedDRA. Such improvement in the efficiency of pharmacologists\u2019 work has a relevant impact also on the quality of the subsequent data analysis. We developed MagiCoder for the Italian pharmacovigilance language. However, our proposal is based on a general approach, not depending on the considered language nor the term dictionary

    Tracking the evolution of riverbed morphology on the basis of uav photogrammetry

    Unmanned aerial vehicle (UAV) photogrammetry has recently become a widespread technique to investigate and monitor the evolution of different types of natural processes. Fluvial geomorphology is one of such fields of application where UAV potentially assumes a key role, since it allows for overcoming the intrinsic limits of satellite and airborne-based optical imagery on one side, and in situ traditional investigations on the other. The main purpose of this paper was to obtain extensive products (digital terrain models (DTMs), orthophotos, and 3D models) in a short time, with low costs and at a high resolution, in order to verify the capability of this technique to analyze the active geomorphic processes on a 12 km long stretch of the French–Italian Roia River at both large and small scales. Two surveys, one year apart from each other, were carried out over the study area and a change detection analysis was performed on the basis of the comparison of the obtained DTMs to point out and characterize both the possible morphologic variations related to fluvial dynamics and modifications in vegetation coverage. The results highlight how the understanding of different fluvial processes may be improved by appropriately exploiting UAV-based products, which can thus represent a low-cost and non-invasive tool to crucially support decisionmakers involved in land management practices


    Este artigo tem como objetivo central expor o modelo teórico da Fonologia Articulatória (FAR), através da apresentação de seus pressupostos teóricos e de dois estudos de caso dos autores. Na primeira seção, apresentaremos os conceitos basilares, as motivações e alguns dos principais trabalhos de referência, no exterior e no Brasil. Na seção dois, exploraremos dados do português, de modo a mostrar as vantagens de eleger um modelo como a FAR para explicar tanto certos fenômenos clássicos como outros não contemplados por outros modelos de descrição fonológica. Em três, apresentaremos dois estudos de caso: um processo de africação no Português e a classe rótica em Rikbaktsa, e na seção quatro faremos algumas considerações finais

    Autoria e contradição no processo discursivo de reformulação de livros

    How can we discursively think about the revised edition and its writing? Discourse Analysis Theory (as it is specially developed by Pêcheux, Orlandi and Indursky) sustains this discussion about the discursive process of books reformulation and, by this way, about the reformulation of knowledge domains. Once we are interested on scientific internal reconfigurations, we observe the authorship work on the linguistic-historical materiality of pairs of editions, in order to examine, on the one hand, the relations established between the subject-author and the two versions of a book of him, and, on the other hand, the discursive statute of the revised edition.Como pensar discursivamente a edição revista e seu processo de escrita? A Teoria da Análise do Discurso (tal como desenvolvida especialmente por Pêcheux, Orlandi e Indursky) sustenta esta discussão a respeito do processo discursivo de reformulação de livros e, por aí, acerca da reformulação de domínios de saber. Interessando-nos as reconfigurações científicas internas, observamos o trabalho de autoria na materialidade linguístico-histórica de pares de edições, a fim de examinar, de um lado, as relações entre o sujeito-autor e as duas versões de um livro seu, e, de outro lado, o estatuto discursivo da edição revista