429 research outputs found
Segmentazione delle serie temporali nellâanalisi dei dati: un esempio di applicazione a dati sismo-vulcanici.
Il presente report descrive quanto sviluppato dagli autori per lâanalisi delle serie temporali utilizzate
per il monitoraggio sismo-vulcanico del vulcano Etna. La necessitĂ di ottenere una rappresentazione ridotta
delle serie temporali ha portato alla ricerca ed alla implementazione degli algoritmi di segmentazione oggetto
del presente lavoro.
Le metodologie introdotte nel paragrafo 2, largamente applicate nella disciplina del data mining su
serie temporali, costituiscono ad oggi lo stato dellâarte per quanto riguarda le tecniche di approssimazione di
serie temporali. In particolare, lâapplicazione dellâalgoritmo bottom-up ha permesso una compressione
elevata dei dati, consentendo quindi una rappresentazione con un numero di punti inferiore rispetto a quello
delle serie temporali di partenza. In questo contesto la scelta delle soglie errore, legata indirettamente al
numero di segmenti con cui si approssima la serie temporale, è stata scelta in modo empirico. Questa scelta è
stata vincolata alla dimensione dei buffer di dati da impiegare per scopi di visualizzazione ed elaborazione.
Future implementazioni riguarderanno lâottimizzazione in linea degli algoritmi Sliding Window in modo da
operare in real-time sugli streaming di dati ed ottimizzarne lâarchiviazione e la visualizzazione
Progetto di una banca dati multidisciplinare: il progetto europeo VOLUME come caso di studio
Il presente lavoro si pone come obiettivo la realizzazione di una banca dati multi-parametrica in grado
di archiviare diverse tipologie di dato strumentale. Il sistema proposto, accessibile dal portale dellâINGV
della sezione di Catania al link âaltre INGV-CTâ del menĂš âBanche datiâ, studiato e collaudato allâinterno
del progetto europeo VOLUME (http://www.volume-project.net/), consente la fruizione dei dati messi a
disposizione dalle diverse unitĂ funzionali dellâINGV della sezione di Catania coinvolte nel progetto. I dati,
disponibili ai partner del progetto, sono accessibili previa registrazione e successiva validazione dellâutente.
Lâobiettivo principale di tale progetto è quello di studiare le dinamiche vulcaniche in modo da
identificare e caratterizzare fenomeni che possano essere interpretati come possibili precursori di eruzioni.
Per perseguire tale obiettivo occorre analizzare ed integrare diverse tipologie di misure, da quelle geofisiche
a quelle geochimiche, con il fine di raggiungere una migliore comprensione dei processi in atto allâinterno
delle aree caratterizzate da vulcanismo attivo. Sebbene i dati archiviati siano relativi al solo vulcano Etna ed
il periodo analizzato è relativo agli anni 2002-2003 , il sistema proposto può essere impiegato per la gestione
di dati relativi ad altri vulcani e attinenti a qualsiasi intervallo temporale. Il sistema è stato realizzato in modo
da fornire una interfaccia web user friendly che permetta agli utenti la navigazione, la visualizzazione e il
download dei dati memorizzati allâinterno della banca dati.
Nei paragrafi successivi verrĂ presentata una panoramica delle funzionalitĂ implementate per la
navigazione del database. In particolare, i dati trattati nel presente report sono stati prodotti e forniti dalle
unitĂ funzionali dellâINGV della sezione di Catania (http://www.ct.ingv.it) che hanno partecipato al progetto
VOLUME:
⢠Unità Funzionale Sismologia;
⢠Unità Funzionale Vulcanologia e Geochimica;
⢠Unità Funzionale Gravimetria e Magnetismo;
⢠Unità Funzionale Deformazione e Geodesia
Evaluation of mechanical and interfacial properties of bio-composites based on poly(lactic acid) with natural cellulose fibers
The circular economy policy and the interest for sustainable material are inducing a constant expansion of the bio-composites market. The opportunity of using natural fibers in bio-based and biodegradable polymeric matrices, derived from industrial and/or agricultural waste, represents a stimulating challenge in the replacement of traditional composites based on fossil sources. The coupling of bioplastics with natural fibers in order to lower costs and promote degradability is one of the primary objectives of research, above all in the packaging and agricultural sectors where large amounts of non-recyclable plastics are generated, inducing a serious problem for plastic disposal and potential accumulation in the environment. Among biopolymers, poly(lactic acid) (PLA) is one of the most used compostable, bio-based polymeric matrices, since it exhibits process ability and mechanical properties compatible with a wide range of applications. In this study, two types of cellulosic fibers were processed with PLA in order to obtain bio-composites with different percentages of microfibers (5%, 10%, 20%). The mechanical properties were evaluated (tensile and impact test), and analytical models were applied in order to estimate the adhesion between matrix and fibers and to predict the material's stiffness. Understanding these properties is of particular importance in order to be able to tune and project the final characteristics of bio-composites
PYDBSCAN UN SOFTWARE PER IL CLUSTERING DI DATI
Con il termine clustering si indica il processo mediante il quale è possibile raggruppare oggetti in base
a caratteristiche comuni (features). Questo approccio, alla base dei processi di estrazione di conoscenza da
insiemi di dati (data mining), riveste notevole importanza nelle tecniche di analisi. Come verrĂ mostrato in
questo lavoro, lâapplicazione delle tecniche di clustering consente di analizzare dataset, con lâobiettivo di
ricercare strutture che possano fornire informazioni utili circa i dati oggetto dello studio. Gli ambiti in cui tali
algoritmi sono impiegati risultano essere eterogenei, a partire dalle analisi di dati biomedici, astrofisici,
biologici, fino ad arrivare a quelli geofisici. La letteratura è ricca di vari casi di studio, dai quali il ricercatore
può trarre spunto e adattare i differenti approcci alle proprie esigenze.
Il software PyDBSCAN, oggetto del presente lavoro, permette di applicare tecniche di clustering basate
sul concetto di densitĂ , applicate ad oggetti (o punti) appartenenti ad insiemi definiti in uno spazio metrico.
Lâalgoritmo di base è il DBSCAN (Density Based Spatial Clustering on Application with Noise) [Ester et al.,
1996], di cui viene riportata una implementazione ottimizzata al fine di migliorare la qualitĂ del
processamento dei dati. Schematicamente, il sistema proposto può essere rappresentato come in Fig. 1. Il
software, sviluppato in Python 2.6 [Python ref.], utilizza le librerie scientifiche Numpy [Numpy ref.],
Matplotlib [matplotlib ref.] e la libreria grafica PyQt [PyQt ref.] impiegata nella realizzazione dellâinterfaccia
utente. Python è un linguaggio di programmazione che permette la realizzazione di applicazioni crossplatform
in grado di funzionare su diversi sistemi operativi quali Windows, Unix, Linux e Mac OS.
Nella prima parte del lavoro verranno brevemente descritte le tecniche oggetto del software presentato,
mentre nella seconda parte verrĂ descritto un esempio di applicazione su dati reali
A real-time framework for fast data retrieval in an image database of volcano activity scenarios
Explosive Activity at Stromboli Volcano (Aeolian Islands) is continuously monitored by INGV-OE in order to
analyze its eruptive dynamics and specific scenarios. In particular, the images acquired from thermal cameras
represent a big collection of data. In order to extract useful information from thermal image sequences, we need
an efficient way to explore and retrieve information from a huge amount of data. In this work, a novel framework
capable of fast data retrieval, using the "metric space" concept, is shown. In the light of it, we implemented an
indexing algorithm related to similarity laws. The focal point is finding objects of a set that are âcloseâ in relation
to a given query, according to a similarity criterion. In order to perform this task, we performed morphological
image processing techniques to each video frame, in order to map the shape area of each explosion into a closed
curve, representing the explosion contour itself. In order to constitute a metric space, we chose a certain number of
features obtained from parameters related to this closed curve and used them as objects of this metric space where
similarity can be evaluated, using an appropriate âmetricâ function to calculate the distances. Unfortunately, this
approach has to deal with an intrinsic issue involving the complexity and the number of distance functions to be
calculated on a large amount of data. To overcome this drawback, we used a novel abstract data structure called
"K-Pole Tree", having the property of minimizing the number of distances to be calculated among objects. Our
method allows for fast retrieval of similar objects using an euclidean distance function among the features of the
metric space. Thus, we can cluster explosions related to different kinds of volcanic activity, using "pivot" items.
For example, given a known image sequence related to a particular type of explosion, it is possible to quickly and
easily find all the image sequences that contain only similar explosions. Our framework is able to both classify
each new explosion and dynamically insert the corresponding object into our tree data structure. This approach is
able to cluster the entire data space, ensuring that objects with similar features are grouped and classified together
Software applicativo per la gestione delle stazioni della rete sismica mobile in dotazione allâIstituto Nazionale di Geofisica e Vulcanologia - Sezione di Catania
A Dynamic Bayesian Network for Mt. Etna Volcano State Assessment
Nowadays, the real-time monitoring of Mt. Etna volcano is mostly delegated to one or more human experts in
volcanology, who interpret the data coming from different kind of monitoring networks. Among their duties, the
evaluation of the volcano state is one of the most critical task for civil protection purposes. Unfortunately, the
coupling of highly non-linear and complex volcanic dynamic processes leads to measurable effects that can show a
large variety of different behaviors. Moreover, due to intrinsic uncertainties and possible failures in some recorded
data the volcano state needs to be expressed in probabilistic terms, thus making the fast volcano state assessment
sometimes impracticable for the personnel on duty at the 24h control room. With the aim of aiding the personnel
on duty in volcano monitoring, here we present an expert system approach based on Bayesian networks to estimate
automatically the ongoing volcano state from all the available different kind of measurements. A Bayesian network
is a static probabilistic graphical model that represents a set of random variables and their conditional dependencies
via a directed acyclic graph. We consider model variables both the measurements and the possible states of the
volcano. In order to include the time in the model, we use a Dynamic Bayesian Network (DBN) which relates
variables to each other over adjacent time steps. The model output consists of an estimation of the probability
distribution of the feasible volcano states. We build the model by considering the long record of data from 2011 to
2014 and we cross-validate it by considering 3 years for parameter estimation and 1 year for testing in simulated real-time mode
Measurement of the 18Ne(a,p_0)21Na reaction cross section in the burning energy region for X-ray bursts
The 18Ne(a,p)21Na reaction provides one of the main HCNO-breakout routes into
the rp-process in X-ray bursts. The 18Ne(a,p_0)21Na reaction cross section has
been determined for the first time in the Gamow energy region for peak
temperatures T=2GK by measuring its time-reversal reaction 21Na(p,a)18Ne in
inverse kinematics. The astrophysical rate for ground-state to ground-state
transitions was found to be a factor of 2 lower than Hauser-Feshbach
theoretical predictions. Our reduced rate will affect the physical conditions
under which breakout from the HCNO cycles occurs via the 18Ne(a,p)21Na
reaction.Comment: 5 pages, 3 figures, accepted for publication on Physical Review
Letter
Data mining in the context of monitoring Mt Etna, Italy
The persistent volcanic activity of Mt Etna makes the continuous monitoring of multidisciplinary data a ďŹrst-class
issue. Indeed, the monitoring systems rapidly accumulate huge quantity of data, arising speciďŹc problems of an-
dling and interpretation. In order to respond to these problems, the INGV staff has
developed a number of software tools for data mining. These tools have the scope of identifying structures in the
data that can be related to volcanic activity, furnishing criteria for the identiďŹcation of precursory scenarios. In
particular, we use methods of clustering and classiďŹcation in which data are divided into groups according to a-
priori-deďŹned measures of similarity or distance. Data groups may assume various shapes, such as convex clouds
or complex concave bodies.The âKKAnalysisâ software package is a basket of clustering methods. Currently, it is
one of the key techniques of the tremor-based automatic alarm systems of INGV Osservatorio Etneo. It exploits
both Self-Organizing Maps and Fuzzy Clustering. Beside seismic data, the software has been applied to the geo-
chemical composition of eruptive products as well as a combined analysis of gas-emission (radon) and seismic
data.
The âDBSCANâ package exploits a concept based on density-based clustering. This method allows discovering
clusters with arbitrary shape. Clusters are deďŹned as dense regions of objects in the data space separated by re-
gions of low density. In DBSCAN a cluster grows as long as the density within a group of objects exceeds some
threshold. In the context of volcano monitoring, the method is particularly promising in the recognition of ash par-
ticles as they have a rather irregular shape. The âMOTIFâ software allows us to identify typical waveforms in time
series, outperforming methods like cross-correlation that entail a high computational effort. MOTIF can recognize
the non-imilarity of two patterns on a small number of data points without going through the whole length of data
vectors.
All the developments aforementioned come along with modules for feature extraction and post-processing. Spe-
ciďŹc attention is devoted to the obustness of the feature extraction to avoid misinterpretations due to the presence
of disturbances from environmental noise or other undesired signals originating from the source, which are not
relevant for the purpose of volcano surveillance
- âŚ