Search CORE

47 research outputs found

Diabetic foot ulcers monitoring by employing super resolution and noise reduction deep learning techniques

Author: Davradou Agapi
Doulamis Anastasios
Doulamis Nikolaos
Kaselimi Maria
Protopapadakis Eftychios
Publication venue
Publication date: 20/09/2022
Field of study

Diabetic foot ulcers (DFUs) constitute a serious complication for people with diabetes. The care of DFU patients can be substantially improved through self-management, in order to achieve early-diagnosis, ulcer prevention, and complications management in existing ulcers. In this paper, we investigate two categories of image-to-image translation techniques (ItITT), which will support decision making and monitoring of diabetic foot ulcers: noise reduction and super-resolution. In the former case, we investigated the capabilities on noise removal, for convolutional neural network stacked-autoencoders (CNN-SAE). CNN-SAE was tested on RGB images, induced with Gaussian noise. The latter scenario involves the deployment of four deep learning super-resolution models. The performance of all models, for both scenarios, was evaluated in terms of execution time and perceived quality. Results indicate that applied techniques consist a viable and easy to implement alternative that should be used by any system designed for DFU monitoring

arXiv.org e-Print Archive

Performance-aware NILM model optimization for edge deployment

Author: Athanasoulias Sotirios
Doulamis Anastasios
Doulamis Nikolaos
Kaselimi Maria
Stankovic Lina
Stankovic Vladimir
Sykiotis Stavros
Publication venue
Publication date: 26/01/2023
Field of study

Non-Intrusive Load Monitoring (NILM) describes the extraction of the individual consumption pattern of a domestic appliance from the aggregated household consumption. Nowadays, the NILM research focus is shifted towards practical NILM applications, such as edge deployment, to accelerate the transition towards a greener energy future. NILM applications at the edge eliminate privacy concerns and data transmission-related problems. However, edge resource restrictions pose additional challenges to NILM. NILM approaches are usually not designed to run on edge devices with limited computational capacity and therefore model optimization is required for better resource management. Recent works have started investigating NILM model optimization, but they utilize compression approaches arbitrarily, without considering the trade-off between model performance and computational cost. In this work, we present a NILM model optimization framework for edge deployment. The proposed edge optimization engine optimizes a NILM model for edge deployment depending on the edge device’s limitations and includes a novel performance-aware algorithm to reduce the model’s computational complexity. We validate our methodology on three edge application scenarios for four domestic appliances and four model architectures. Experimental results demonstrate that the proposed optimization approach can lead up to 36.3% average reduction of model computational complexity and 75% reduction of storage requirements

University of Strathclyde Institutional Repository

Game theory and port economics: a survey of recent research.

Author: Anderson
Basso
Borger
Brooks
Carlin
Chang
Cheon
Czerny
de Voorde
Dekker
Eisenmann
Haralambides
Ishii
Jong
Kaselimi
Leibenstein
Levine
Luo
Matsushima
Midoro
Pallis
Reeven
Reynaerts
Rochet
Rodal
Saeed
Song
Soppé
Suykens
Tongzon
Wan
Wang
Xiao
Yang
Yang
Yang
Yip
Yu
Yuen
Zhang
Zhang
Zheng
Zhuang
Publication venue: 'Wiley'
Publication date: 01/01/2016
Field of study

The last decade has seen a significant upsurge of studies seeking to examine the impacts of port agents’ strategic decisions. The outcome has been a wide range of results and conclusions. The aim of this work is to provide a review of this recent research in the port industry that uses strategic interaction approaches from industrial organization and game theory. The paper concentrates on five topics: ownership, relationship between ports and their hinterlands, port authorities and port operators’ relations, capacity investment decisions, and port specialization. We present the objectives, methodologies and results of the papers reviewed, with special emphasis on how models are developed. The results are not always consistent between the works analyzed. On the one hand, this could be due to the complexity of the port industry and the high number of agents that intervene. Researchers need to simplify reality to build their models by imposing restrictive assumptions. On the other hand, results could be very sensitive to the techniques used or to the differences on the port environment of the countries of study. However, some conclusions can be extracted and they present a good starting point to develop more sophisticated models. Finally, we also propose avenues for future research

Crossref

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

UCrea

STAMINA: Bioinformatics Platform for Monitoring and Mitigating Pandemic Outbreaks

Author: Anagnostopoulos T
Anagnostou A
Bakalos N
Bimpas M
Bonavita I
Davradou A
Despotopoulou AM
Doulamis A
Doulamis N
Fotopoulos A
Groen D
Ham CVD
Ignjatović D
Kaleta P
Kalogeras D
Karalis A
Kaselimi M
Mintram K
Pelepes L
Petersen K
Plakia M
Rossi L
Saha A
Taylor SJE
Tsekeridou S
Vlachostergiou A
Voumvourakis L
Publication venue: 'MDPI AG'
Publication date: 01/05/2022
Field of study

Data Availability Statement: All data driven applications used the our world in data COVID-19 datasets, complimented by proprietary datasets share by the STAMINA consortium.Copyright © 2022 by the authors. This paper presents the components and integrated outcome of a system that aims to achieve early detection, monitoring and mitigation of pandemic outbreaks. The architecture of the platform aims at providing a number of pandemic-response-related services, on a modular basis, that allows for the easy customization of the platform to address user’s needs per case. This customization is achieved through its ability to deploy only the necessary, loosely coupled services and tools for each case, and by providing a common authentication, data storage and data exchange infrastructure. This way, the platform can provide the necessary services without the burden of additional services that are not of use in the current deployment (e.g., predictive models for pathogens that are not endemic to the deployment area). All the decisions taken for the communication and integration of the tools that compose the platform adhere to this basic principle. The tools presented here as well as their integration is part of the project STAMINA.The paper presented is based on research undertaken as part of the European Commission-funded project STAMINA (Grant Agreement 883441)

Directory of Open Access Journals

Brunel University Research Archive

Essays on the relationship between terminal scale and port competition

Author: Kaselimi Vicky
Publication venue
Publication date: 01/01/2013
Field of study

Institutional Repository Universiteit Antwerpen

Machine learning methods for modelling and analysis of time series signals in geoinformatics

Author: Kaselimi Maria
Κασελίμη Μαρία
Publication venue
Publication date: 16/02/2022
Field of study

DSpace at NTUA

Τεχνικές μηχανικής μάθησης για τη μοντελοποίηση και ανάλυση χρονοσειρών σε εφαρμογές γεωπληροφορικής

Author: Kaselimi Maria
Κασελίμη Μαρία
Publication venue: 'National Documentation Centre (EKT)'
Publication date: 01/01/2021
Field of study

The analysis of experimental data that have been observed at different points in time leads to new and unique problems in statistical modeling and inference. The obvious correlation introduced by the sampling of adjacent points in time can severely restrict the applicability of the many conventional statistical methods traditionally dependent on the assumption that these adjacent observations are independent andidentically distributed. The systematic approach by which one goes about answering the mathematical and statistical questions posed by these time correlations is commonly referred to as time series analysis (TSA).Time series modeling (TSM) plays a key role in a wide range of real-life problems that have a temporal component. Modern time series problems often pose significant challenges for the existing techniques both in terms of their complexity, structure and size. While traditional methods have focused on parametric models informed by domain expertise, modern machine learning (ML) methods provide a means to learn temporal dynamics in a purely data-driven manner. With the increasing data availability and computing power in recent times, machine learning has become a vital part of the next generation of time series models. Thus, there is both a great need and an exciting opportunity for the machine learning community to develop theory, models and algorithms specifically for the purpose of processing and analyzing time series data.The impact of time series modelling and analysis on scientific applications can be partially documented by analysing problems of various diverse fields in which important time series problems may arise. Modern time series problems are characterized by complexity. Also, since real-world systems often evolve under transient conditions, the signals/time series tend to exhibit various forms of non-stationarity. As far as mathematical models are concerned, they can be categorized in many different ways. They can be linear or non-linear, static or dynamic, continuous distinct in time, deterministic or contemplative. The proper model selection to accurately describe a system depends on the system under study, on whether the operation of the system is a-priory known or not, as well as on the purpose of the implementation. This dissertation presents developments in nonlinear and non-static time series models under a machine learning framework, comparing their performance in real-life application scenarios related to geoinformatics as well as environmental applications.In this dissertation is provided a comparative analysis that evaluates the performance of several deep learning (DL) architectures on a large number of time series datasets of different nature and for different applications. Two main fruitful research fields are discussed here which were strategically chosen in order to address current cross-disciplinary research priorities attracting the interest of geoinformatics communities. The first problem is related to ionospheric Total Electron Content (TEC) modeling which is an important issue in many real-time Global Navigation System Satellites (GNSS) applications. Reliable and fast knowledge about ionospheric variations becomes increasingly important. GNSS users of single-frequency receivers and satellite navigation systems need accurate corrections to remove signal degradation effects caused by the ionosphere. Ionospheric modeling using signal-processing techniques is the subject of discussion in the present contribution. The next problem under discussion is energy disaggregation which is an important issue for energy efficiency and energy consumption awareness. Reliable and fast knowledge about residential energy consumption at appliance level becomes increasingly important nowadays and it is an important mitigation measure to prevent energy wastage. Energy disaggregation or Non-intrusive load monitoring (NILM) is a single channel blind source separation problem where the task is to estimate the consumption of each electrical appliance given the total energy consumption. For both problems various deep learning models (DL) are proposed that cover various aspects of the problem under study, whereas experimental results indicate the proposed methods' superiority compared to the current state of the art.Η ανάλυση χρονοσειρών στηρίζεται σε δεδομένα που δίνονται με χρονική διάταξη και περιλαμβάνει την προσπάθεια διερεύνησης μέσω διάφορων μεθόδων του μηχανισμού που παράγει τη χρονοσειρά και εκτίμησης των χαρακτηριστικών της. Σκοπός είναι η ανάπτυξη ενός προτεινόμενου υποδείγματος (μοντελοποίηση) για να την περιγράψει και στη συνέχεια να επιδιώξει την πρόβλεψη της εξέλιξης της, δηλαδή την πρόβλεψη των επόμενων τιμών της χρονοσειράς. Η μοντελοποίηση και η ανάλυση των χρονοσειρών (times series modelling and analysis) έχουν αποκτήσει αυξημένο ενδιαφέρον κατά τη διάρκεια των τελευταίων δεκαετιών σε εφαρμογές γεωδαισίας, γεωπληροφορικής και περιβάλλοντος.Τα μαθηματικά μοντέλα αποτελούν ένα πολύτιμο εργαλείο ερευνητικά για τη μοντελοποίηση και ανάλυση χρονοσειρών. Η ραγδαία εξέλιξη της τεχνολογίας τα τελευταία χρόνια, η οποία έχει προσφέρει τεράστια υπολογιστική δύναμη και ισχύ, συνεισφέρει στην ανάπτυξη σύνθετων μοντέλων, τα οποία είναι ικανά να εξηγήσουν περίπλοκους φυσιολογικούς μηχανισμούς. Επιπροσθέτως, εκτός από την αύξηση υπολογιστικής ισχύος, έχουν αυξηθεί και οι τρόποι απόκτησης δεδομένων, προσφέροντας έτσι περισσότερο χώρο για δοκιμή των μοντέλων, αλλά και την καλύτερη «εκπαίδευσή» τους. Οι πρόσφατες εξελίξεις στην τεχνολογία αισθητήρων (sensors) και η συνακόλουθη διαθεσιμότητα άφθονων πηγών δεδομένων με τη μορφή χρονοσειρών μπορούν να μεταμορφώσουν τον τρόπο παρακολούθησης και ελέγχου των πολύπλοκων συστημάτων στον πραγματικό κόσμο. Κατά συνέπεια τα σύγχρονα προβλήματα χρονοσειρών χαρακτηρίζονται από πολυπλοκότητα (complexity). Επίσης, δεδομένου ότι τα συστήματα του πραγματικού κόσμου συχνά εξελίσσονται υπό παροδικές συνθήκες, τα σήματα/χρονοσειρές (signals/time series) που λαμβάνονται, τείνουν να εμφανίζουν διάφορες μορφές μη στατικότητας (non-stationarity). Όσον αφορά στα μαθηματικά μοντέλα, μπορούν να κατηγοριοποιηθούν με πολλούς διαφορετικούς τρόπους. Μπορούν να είναι γραμμικά ή μη-γραμμικά, στατικά ή δυναμικά, συνεχή ή διακριτά στον χρόνο, ντετερμινιστικά ή στοχαστικά. Το μοντέλο που επιλέγεται για την περιγραφή ενός συστήματος, εξαρτάται από το ίδιο το σύστημα υπό μελέτην, από το αν η λειτουργία του συστήματος μας είναι γνωστή ή όχι, όπως και από τον σκοπό της εφαρμογής του μοντέλου. Η παρούσα διατριβή προτείνει σε μη γραμμικά και μη στατικά μοντέλα χρονοσειρών σε ένα πλαίσιο που βασίζεται στη μηχανική μάθηση κάνοντας σύγκριση των επιδόσεών τους σε ορισμένες πραγματικές περιβαλλοντικές εφαρμογές και εφαρμογές που σχετίζονται με τη γεωπληροφορική και τη γεωδαισία.Σε περιπτώσεις επιβλεπόμενης μηχανικής μάθησης (supervised learning), οι χρονοσειρές μετατρέπονται σε παραδείγματα εκπαίδευσης. Αυτό γίνεται με την έμμεση ενσωμάτωσή της μεταβλητής του χρόνου στα παραδείγματα μέσω επιπλέον χαρακτηριστικών. Για παράδειγμα μπορεί να προστεθεί σαν χαρακτηριστικό η τιμή της μεταβλητής προς πρόβλεψη της προηγούμενης χρονικής στιγμής. Η χρονική στιγμή αυτή μπορεί να είναι λεπτό, ώρα, ημέρα, και εξαρτάται αναλόγως της φύσης των παραδειγμάτων. Ακόμη, μπορούν να προστεθούν πεδία τα οποία να μοντελοποιούν την τάση και την εποχικότητα των δεδομένων. Μετά από αυτή την μετατροπή, εφαρμόζονται αλγόριθμοι Μηχανικής Μάθησης για την εκπαίδευση του μοντέλου. Τα περισσότερα από αυτά τα μοντέλα αξιοποιούν τα παραδείγματα ανεξάρτητα το ένα με το άλλο υπάρχουν όμως και μοντέλα που αξιοποιούν την αλληλοδιαδοχή αυτών, όπως τα Αναδρομικά Νευρωνικά Δίκτυα (Recurrent Neural Networks - RNN) και η επέκταση αυτών, τα Δίκτυα Μακράς Βραχυπρόθεσμης Μνήμης (Long Short-Term Memory Networks - LSTM). Η μεγάλη διαφορά των μοντέλων αυτών είναι πως μπορούν να εκμεταλλευτούν και άλλες πληροφορίες και να τις ενσωματώσουν στον μηχανισμό πρόβλεψής τους. Η προσέγγιση αυτή στην ανάλυση και πρόβλεψη χρονοσειρών συνήθως αποτελεί μια πιο δυνατή και ευέλικτη μέθοδο από τις κλασικές στατιστικές τεχνικές, όπως τα αυτοπαλινδρομούμενα μοντέλα κινητού μέσου όρου (Autoregressive Moving Average – ARMA) και τα αυτοπαλινδρομούμενα μοντέλα ενσωματωμένου κινητού μέσου όρου (Autoregressive Integrated Moving Average -ARIMA). Ωστόσο, είναι σημαντικό να αναφερθεί ότι ένα μοντέλο μηχανικής μάθησης που προσαρμόζεται επιτυχώς για δεδομένα χρονοσειρών πρέπει να διατηρεί τη χρονική δυναμική μεταβολή του φαινομένου, με την έννοια ότι οι νέες τιμές που προκύπτουν από το μοντέλο υπακούουν στη χρονική συσχέτιση (temporal correlation) μεταξύ των μεταβλητών με την πάροδο του χρόνου. Οι τεχνικές αυτές χρησιμοποιούνται στη μοντελοποίηση ακολουθιών (sequence modelling) και εχουν εφαρμοστεί στα πλαίσια της παρούσας έρευνας. Εκτός των αναδρομικών νευρωνικών δικτύων, έγινε προσπάθεια να αξιοποιηθούν και τα ευρέως γνωστά Συνελικτικά Νευρωνικά Δίκτυα (Convolutional Neural Networks-CNN) στην πρόβλεψη της ιονόσφαιρας. Αυτό πραγματοποιήθηκε προτείνοντας μονοδιάστατα δίκτυα CNN που παρουσιάζουν μεταβολές στη διάσταση του χρόνου. H ιδιότητες της αιτιότητας (causality) και της διαστολής (dilation) αποτέλεσαν σημαντικές παραμέτρους ώστε το κλασσικό μοντέλο CNN να αποκτήσει ιδιότητες αυτοπαλινδρόμησης (autoregressive). Επιπλέον, στα πλαίσια της διατριβής προτείνονται και υβριδικά μοντέλα μηχανικής μάθησης (hybrid) που συνδυάζουν ιδιότητες των συνελικτικών και των αναδρομικών νευρωνικών δικτύων.Επιπρόσθετα, έγινε εφαρμογή των Γεννητικών Aνταγωνιστικών Δικτύων (Generative Adversarial Networks – GAN). Πρόκειται για μια μέθοδο μηχανικής μάθησης, κατά την οποία ένα γεννητικό (generative) μοντέλο εκπαιδεύεται να παράγει παραδείγματα που «εξαπατούν» έναν ταξινομητή (discriminator), ο οποίος εκπαιδεύεται συγχρόνως να διαχωρίζει τα παραδείγματα που παράγει το παραγωγικό μοντέλο και τα πραγματικά παραδείγματα μιας κατανομής. Έτσι, το παραγωγικό μοντέλο μαθαίνει να παράγει ρεαλιστικά παραδείγματα που δεν μπορούν να διαχωριστούν από πραγματικά δεδομένα. Στους αλγορίθμους GAN, η χρονική συνιστώσα των δεδομένων αποτελεί μια μοναδική πρόκληση για την παραγωγική μοντελοποίηση, καθώς το μοντέλο πρέπει να συλλάβει την πολύπλοκη δυναμική των μεταβλητών με την πάροδο του χρόνου.Σε αυτή τη διατριβή παρέχεται μια συγκριτική ανάλυση που αξιολογεί την απόδοση πολλών αρχιτεκτονικών βαθιάς μηχανικής μάθησης (Deep Learning – DL) σε μεγάλο αριθμό συνόλου δεδομένων χρονοσειρών διαφορετικής φύσης και για διαφορετικές εφαρμογές. Δύο βασικοί ερευνητικοί τομείς εξετάζονται:Εφαρμογή στη γεωδαισία: Στη δορυφορική γεωδαισία, στο πρόβλημα εντοπισμού θέσης ένα σημαντικό σφάλματος αποτελεί το ιονοσφαιρικό σφάλμα. Σημειώνεται ότι η αξιόπιστη και γρήγορη γνώση σχετικά με τις ιονοσφαιρικές διαταραχές καθίσταται ολοένα και πιο σημαντική στον ακριβή εντοπισμό θέσης. Ο προσδιορισμός των ιονοσφαιρικών διαταραχών μέσω της μοντελοποίησης των τιμών της πυκνότητας των ηλεκτρονίων TEC (Total Electron Content) της ιονόσφαιρας, αποτελεί σημαντικό ζήτημα σε πολλές εφαρμογές για τη βελτίωση της θέσης με δέκτες GNSS σε εφαρμογές πραγματικού χρόνου (Real Time – RT). Οι χρήστες GNSS δεκτών μίας συχνότητας χρειάζονται ακριβείς διορθώσεις για να απομακρύνουν την υποβάθμιση του σήματος που προκαλείται από την ιονόσφαιρα. Η μοντελοποίηση των τιμών TEC της ιονόσφαιρας με τη χρήση τεχνικών επεξεργασίας σήματος και τεχνικών μηχανικής μάθησης αποτελεί αντικείμενο συζήτησης στην παρούσα διατριβή. Εφαρμογή στην ενέργεια και το περιβάλλον: Η αξιόπιστη και γρήγορη γνώση σχετικά με την οικιακή κατανάλωση ενέργειας σε επίπεδο οικιακών συσκευών γίνεται ολοένα και πιο σημαντική σήμερα και αποτελεί σημαντικό μέτρο μετριασμού για την πρόληψη της ενεργειακής σπατάλης. Ο ενεργειακός επιμερισμός (energy disaggregation) είναι ένα πρόβλημα διαχωρισμού τις συνολικής καταναλισκόμενης ενέργειας, στις επιμέρους συνιστώσες και τον προσδιορισμό της ενέργειας που καταναλώνει η εκάστοτε ηλεκτρική οικιακή συσκευή δεδομένης της συνολικής κατανάλωσης ενέργειας.Η υπό εξέταση διατριβή αναπτύσσεται σε 8 κεφάλαια:Στο Κεφάλαιο 1 γίνεται μία εισαγωγή στις τεχνικές μοντελοποίησης χρονοσειρών. Παρουσιάζονται τα προβλήματα που θα αντιμετωπιστούν, οι γενικότεροι περιορισμοί των υφιστάμενων μεθόδων στη βιβλιογραφία και τα κίνητρα για την ενασχόληση με το συγκεκριμένο αντικείμενο της διατριβής. Στη συνέχεια, σημειώνονται οι γενικοί και ειδικοί στόχοι της διατριβής και παραθέτονται οι πρωτότυπες συνεισφορές. Τέλος, δίνεται η δομή της διατριβής.Στο Κεφάλαιο 2 παρατίθεται το θεωρητικό υπόβαθρο για την ανάπτυξη τοπικών μοντέλων για τη χαρτογράφηση της ιονόσφαιρας και περιγράφεται η συνεισφορά των παρατηρήσεων GNSS στην εκτίμηση των παραμέτρων TEC της ιονόσφαιρας. Αρχικά, παρουσιάζεται η σχετική βιβλιογραφία. Συγκεκριμένα, ύστερα από εκτεταμένη έρευνα που πραγματοποιήθηκε, περιγράφονται οι πιο σημαντικές βιβλιογραφικές αναφορές που σχετίζονται με τις μεθόδους για τη μοντελοποίηση των τιμών TEC της ιονόσφαιρας. Επίσης, μοντελοποιείται μαθηματικά το υπό μελέτη πρόβλημα, η επίλυση του οποίου αποτελεί έναν από τους κύριους στόχους της παρούσης διατριβής. Στο Κεφάλαιο 3 παρουσιάζεται η προτεινόμενη μέθοδος για τη μοντελοποίηση των τιμών TEC της ιονόσφαιρας χρησιμοποιώντας μοντέλα βαθιάς μηχανικής μάθησης προσαρμοσμένα σε χρονοσειρές και παρατηρήσεις GNSS. Η μελέτη επικεντρώθηκε στη χρήση τεχνικών μάθησης με επίβλεψη για την πρόβλεψη της ιονοσφαιρικής υστέρησης από μετρήσεις GNSS και την παραγωγή μοντέλων ιονόσφαιρας τοπικού χαρακτήρα. Βασική δομή δικτύων που χρησιμοποιήθηκε για την ανάλυση είναι τα αναδρομικά νευρωνικά δίκτυα (Recurrent Neural Networks -RNN). Τα αναδρομικά νευρωνικά δίκτυα είναι δυναμικά συστήματα που μπορούν να μοντελοποιήσουν και να αναπαραστήσουν χρονικά μεταβαλλόμενα φαινόμενα. Συγκεκριμένα έγινε χρήση της δομής LSTM. Τα δίκτυα LSTM θεωρούνται κατάλληλα για τη μοντελοποίηση δεδομένων χρονοσειρών καθώς είναι δίκτυα με μνήμη και οι είσοδοι του παρελθόντος επηρεάζουν τις προβλέψεις του μέλλοντος. Ένα από τα χαρακτηριστικά των δικτύων LSTM, που τα έχει καταστήσει πολύ δημοφιλή στην κοινότητα της μηχανικής μάθησης, είναι ότι έχουν τη δυνατότητα να συνδυάζουν πληροφορίες από προηγούμενα δεδομένα εκμάθησης και να τις χρησιμοποιούν κατά την εκπαίδευση των τωρινών δειγμάτων. Η αναλύση πραγματοποιήθηκε σε ένα σύνολο σταθμών της IGS, και για την αξιολόγηση της προτεινόμενης μεθόδου LSTM για την πρόβλεψη τιμών VTEC της ιονόσφαιρας έγινε σύγκριση με τις παραδοσιακές μεθόδους Autoregressive (AR) και Autoregressive Moving Average (ARMA), ανά δορυφόρο. Το προτεινόμενο μοντέλο επιτυγχάνει μέσο σφάλμα μικρότερο από 1,5 TECU. Στο Κεφάλαιο 4 η αρχική αδυναμία κατάλληλης χρήσης των ευρέως γνωστών δικτύων CNN για προβλήματα χρονοσειρών άρθηκε με την εισαγωγή στο πρόβλημα μονοδιάστατων χρονικών δικτύων CNN και με την εισαγωγή των ιδιοτήτων της αιτιότητας (causality) και της διαστολής (dilation). Η προτεινόμενη μέθοδος βασίζεται στα μοντέλα ακολουθιών (sequence-to-sequence ή seq2seq). Σύμφωνα με την προτεινόμενη μέθοδο, το μοντέλο είναι κατάλληλο για την πρόβλεψη της ιονοσφαιρικής υστέρησης σε διαφορετικές θέσεις σταθμών GNSS, χρησιμοποιώντας ένα χρονικό μοντέλο 1D συνελικτικού νευρικού δικτύου (CNN). Το μοντέλο CNN μπορεί να αντιμετωπίσει βέλτιστα τη μη γραμμικότητα και να μοντελοποιήσει πολύπλοκα δεδομένα μέσω της δημιουργίας αναπαραστάσεων σε διάφορα ιεραρχικά επίπεδα. Για την πρόβλεψη των τιμών της παραμέτρου TEC της ιονόσφαιρας για κάθε ορατό δορυφόρο σε έναν δεδομένο σταθμό, εισάγονται μοντέλα ακολουθίας (seq2seq). Αυτά τα μοντέλα χρησιμοποιούνται συνήθως για την επίλυση δυναμικών προβλημάτων. Στα μοντέλα seq2seq, η είσοδος στο μοντέλο αποτελεί μια ακολουθία διαδοχικών τιμών (χρονοσειρά ορισμένου χρονικού παραθύρου) και η έξοδος έχει επίσης τη μορφή ακολουθίας. Η υιοθέτηση αυτής της δομής βοηθά στην πρόβλεψη των τιμών της ιονόσφαιρας για όλους τους δορυφόρους που προβάλλονται σε κάθε εποχή. Ως πειραματικά δεδομένα, έγινε χρήση παρατηρήσεων από το παγκόσμιο δορυφορικό σύστημα πλοήγησης (GNSS) από επιλεγμένους σταθμούς στην κεντρική Ευρώπη, του παγκόσμιου διεθνούς δικτύου GNSS (IGS). Τα δεδομένα που χρησιμοποιούνται είναι μέρος του έργου πειράματος πολλαπλών GNSS (MGEX), το οποίο παρέχει παρατηρήσεις από πολλαπλά δορυφορικά συστήματα πλοήγησης. Μετά την επεξεργασία με τεχνική ακριβούς εντοπισμού θέσης (PPP) όπως υλοποιήθηκε με λογισμικό GAMP, ελήφθησαν οι τιμές TEC που χρησιμοποιήθηκαν ως σημεία αναφοράς στο μοντέλο (ground truth). Στο Κεφάλαιο 5 η ανάλυση επικεντρώθηκε και αυτή τη φορά στη χρήση τεχνικών μάθησης με επίβλεψη για την πρόβλεψη της ιονοσφαιρικής υστέρησης από μετρήσεις GNSS και την παραγωγή μοντέλων ιονόσφαιρας τοπικού χαρακτήρα. Στο κεφάλαιο αυτό δόθηκε έμφαση στην αναγκαιότητα πρόβλεψης του χωρο-χρονικού φαινομένου της ιονοσφαιρικής μεταβλητότητας που σχετίζεται με την απαίτηση πολλών χρηστών να εντοπίσουν τη θέση τους με ακρίβεια αλλά με εξοπλισμό χαμηλού κόστους. Ο σκοπός της εργασίας είναι να προτείνει έναν ακριβή υπολογισμό TEC από δεδομένα GNSS, ξεπερνώντας τα προβλήματα που σχετίζονται με την ακανόνιστη συμπεριφορά της ιονόσφαιρας σε τοπικό επίπεδο. Με το προτεινόμενο μοντέλο TEC γίνεται εκτίμηση των ιονοσφαιρικών μεταβολών σε διαφορετικές γεωγραφικές τοποθεσίες (χωρικές), για διαφορετικές χρονικές περιόδους (χρονικές) και υπό διάφορες ηλιακές και γεωμαγνητικές συνθήκες. Στην παρούσα έρευνα, προτείνουμε μια προσέγγιση που βασίζεται στη μηχανική μάθηση για ιονοσφαιρική μοντελοποίηση. Αυτή η μέθοδος εκμεταλλεύεται τα πλεονεκτήματα των αναδρομικών επιπέδων για τη μοντελοποίηση των χρονοσειρών και των συνελικτικών επιπέδων για τη βελτίωση της ακρίβειας του μοντέλου στη χωρική διάσταση. Όσον αφορά στα αναδρομικά επίπεδα, πραγματοποιήθηκε σύγκριση μεταξύ των διαφόρων δομών των RNN μοντέλων, όπως των Long Short-Term Memory Networks (LSTM), των Bidirectional LSTM και των Gated Recurrent Units (GRU). Τα δίκτυα LSTM θεωρούνται κατάλληλα για τη μοντελοποίηση δεδομένων χρονοσειρών καθώς είναι δίκτυα με μνήμη και οι είσοδοι του παρελθόντος επηρεάζουν τις προβλέψεις του μέλλοντος. Επιπρόσθετα, η χρήση δικτύων BiLSTM στα οποία η έξοδος του δικτύου εξαρτάται και από μελλοντικές τιμές εξόδου, αυξάνει την ακρίβεια των αποτελεσμάτων. Με βάση την έρευνα και τα πειραματικά αποτελέσματα, η μέθοδος που εφαρμόζεται καλύτερα στα δεδομένα και επιτυγχάνει τα καλύτερα αποτελέσματα είναι η δομή GRU. Το μοντέλο GRU έχει κοινά χαρακτηριστικά με αυτά της δομής LSTM, με τη διαφορά ότι η δομή GRU είναι πιο εξελιγμένη και όχι τόσο πολύπλοκη όσο η LSTM. Αυτό έχει σαν αποτέλεσμα, το μοντέλο GRU να συγκλίνει γρηγορότερα, ενώ έπειτα από πειραματική διαδικασία αποδείχθηκε ότι επιτυγχάνει και τα καλύτερα αποτελέσματα. Η προτεινόμενη υβριδική μέθοδος CNN-GRU λαμβάνει υπόψη ηλιακές και γεωμαγνητικές παραμέτρους, ώστε να βελτιωθούν οι προβλέψεις TEC. Η ανάλυση πραγματοποιήθηκε σε ένα διάστημα τεσσάρων χρόνων (2014-2018), για σταθμούς της IGS σε διάφορα μήκη και πλάτη της Γης, ενώ πραγματοποιήθηκε αξιολόγηση του μοντέλου σε διαφορετικές εποχικές συνθήκες και συνθήκες όπου παρουσιάζονται ακραία ηλιακά και γεωμαγνητικά φαινόμενα. Η αξιολόγηση της προτεινόμενης επαναλαμβανόμενης μεθόδου για την πρόβλεψη των κατακόρυφων τιμών TEC (VTEC) συγκρίνεται με τις παραδοσιακές μεθόδους αυτοπαλινδρόμησης. Στο Κεφάλαιο 6 παρατίθεται το θεωρητικό πλαίσιο στη βάση του οποίου γίνεται μελέτη και ανάλυση του προβλήματος του ενεργειακού επιμερισμού. Ο ενεργειακός επιμερισμός, ή η μη παρεμβατική παρακολούθηση φορτίου (NILM), περιγράφει τη διαδικασία που στοχεύει στον προσδιορισμό του ποσοστού ενέργειας που καταναλώνει μια συσκευή ατομικά, στην συνολική ενέργεια που καταναλώνεται. Η ευαισθητοποίηση των ατόμων σχετικά με την προστασία και την αειφορία του περιβάλλοντος, είναι απαραίτητη προϋπόθεση για τον καθορισμό πολιτικών φιλικών προς το περιβάλλον, ή την εφαρμογή λύσεων για την κλιματική αλλαγή σε παγκόσμια κλίμακα. Υπάρχουν διάφοροι τρόποι με τους οποίους τα νοικοκυριά θα μπορούσαν να συμβάλουν στη βιώσιμη ζωή. Ένα από αυτά είναι η μείωση της κατανάλωσης ενέργειας. Για το σκοπό αυτό, απαιτείται αλλαγή της ενεργειακής συμπεριφοράς στο νοικοκυριό. Πρώτον, οι καταναλωτές πρέπει να γνωρίζουν την κατανάλωση ενέργειας. Ωστόσο, οι τελικοί καταναλωτές συχνά δεν διαθέτουν γνώσεις σχετικά με την πιθανή εξοικονόμηση ενέργειας, τα υφιστάμενα μέτρα πολιτικής και τις σχετικές τεχνολογίες. Οι περισσότεροι οικιακοί καταναλωτές γνωρίζουν συνήθως τις γενικές πληροφορίες που σχετίζονται με την κατανάλωσή τους μέσω μηνιαίων λογαριασμών ηλεκτρικής ενέργειας. Ωστόσο, οι πληροφορίες σχετικά με την κατανάλωση ενέργειας δεν μεταφράζονται σε καλές πρακτικές και προσαρμοσμένες συμβουλές για εξοικονόμηση ενέργειας. Στα επόμενα κεφάλαια προτείνονται μοντέλα και αλγόριθμοι για την επίλυση του προβλήματος του ενεργειακού επιμερισμού, με καθέναν από αυτούς να εντοπίζει και μια διαφορετική πλευρά του προβλήματος. Στο Κεφάλαιο 7 παρουσιάζεται η προτεινόμενη μέθοδος για την επίλυση του προβλήματος του ενεργειακού εντοπισμού, θεωρώντας το πρόβλημα ως ένα πρόβλημα χρονοσειρών στο οποίο ο αλγόριθμος καλείται να συσχετίσει και να αντιστοιχίσει μια-προς-μια τις τιμές μεταξύ μιας χρονοσειράς καθαρού σήματος της κατανάλωσης μιας συσκευής με το θορυβώδες σήμα της συνολικής κατανάλωσης. Το προτεινόμενο μοντέλο έχει ως βάση του τα δίκτυα LSTM διπλής κατεύθυνσης (bidirectional LSTM), εισάγοντας την ιδιότητα της μη-αιτιότητας (non-causality) και επιτυγχάνοντας έτσι μεγαλύτερη ακρίβεια στο μοντέλο. Στο μοντέλο εισάγονται δύο καινοτομίες που το καθιστούν καλύτερο σε σχέση με τα ήδη υπάρχοντα μοντέλα στη διεθνή βιβλιογραφία. Πρώτον, το γεγονός ότι οι υπερπαράμετροι του προτεινόμενου μοντέλου μηχανικής μάθησης έχουν επιλεχθεί ώστε η αρχιτεκτονική που δημιουργείται να παρουσιάζει το μικρότερο δυνατόν σφάλμα (βελτιστοποίηση του δικτύου). Οι περισσότεροι αλγόριθμοι μηχανική

Hellenic National Archive of Doctoral Dissertations

Απορρύθμιση της αντιγραφής του DNA και μηχανισμοί αντιμετώπισης του επαγόμενου γενοτοξικού στρες στο σχιζοσακχαρομύκητα

Author: Kaselimi Eirini
Κασελίμη Ειρήνη
Publication venue: 'National Documentation Centre (EKT)'
Publication date: 01/01/2022
Field of study

Eukaryotic sizable genomes start their replication by simultaneous activation of multiple, dispersed origins, which fire stochastically during the S phase. Initiation of DNA replication from each origin is a two-step process, which involves loading of the MCM replicative helicases in an inactive state (licensing) and activation of the helicase at a later step (firing). Licensing of DNA replication is pivotal for ensuring that each origin will fire only once during the S phase of the cell cycle, providing a molecular memory for which origins have been activated, and thus should not be re-activated until the next cell cycle, and which not. CDC6/Cdc18 and Cdt1 are the two evolutionarily conserved from yeast to mammals licensing factors that load the MCM2-7 complexes onto the DNA forming the pre-Replicative complexes, that will be activated towards the G1/S transition due to CDK activity increase. The significance of the licensing process for maintenance of genome stability is evident, since its deregulation is accompanied by profound DNA damage, genetic instability, and loss of viability, thus being considered as a source of genotoxic stress. In fission yeast, Cdc18 overexpression is sufficient to overcome the ‘only once per cell cycle’ origin licensing rule and induces re-replication, the generation of replicative bubbles within bubbles, which is known to cause fork collision and DNA breakage. In humans, CDC6/CDT1 overexpression has been reported in pre-malignant cells, highlighting their role as oncogenes. This thesis was dedicated to investigating cellular/molecular mechanisms that may have evolved to early sense aberrations in the licensing system, promoting early responses to safeguard genome stability. To this end, we focused on the ribosomal DNA, an evolutionarily conserved genomic locus with multiple, densely spaced origins of replication. We speculated that this locus, due to several innate characteristics with most prominent the accumulation of many origins in a defined space, would be extra-sensitive in re-replication events. We set out to assess this hypothesis by utilizing the model organism fission yeast as an experimental system. Our data show that the rDNA copy number gets destabilized from an early timepoint upon induction of Cdc18 overexpression, before an established amplification hotspot gets increased. Moreover, the nucleolus organized around the rDNA accumulates phospho-H2A and Rad22 foci, two-established DSB markers even when mild re-replication is induced. In the second part of this thesis, we analyzed checkpoint controls elicited by Cdc18 overexpression. By combining experiments with wt Cdc18/N-terminally truncated Cdc18 in a rad3+/rad3Δ background, we show that Rad3-independent and Rad3-dependent pathways, initiated by Cdc18 O/E, act in synergy to achieve robust mitotic block even under mild re-replication, hence outlining Cdc18 as a master protector of genome integrity.Τα ευμεγέθη ευκαρυωτικά γονιδιώματα εκκινούν την αντιγραφή τους από πολλές διαφορετικές, διάσπαρτες σε αυτά αφετηρίες, που ενεργοποιούνται με στοχαστικότητα κατά τη διάρκεια της φάσης S. Η διαδικασία εκκίνησης της αντιγραφής από κάθε αφετηρία είναι μία διαδικασία δύο σταδίων. Αρχικά, λαμβάνει χώρα αδειοδότηση της αφετηρίας κατά την οποία η ελικάση της αντιγραφής MCM2-7 φορτώνεται στην αφετηρία από τους αδειοδοτικούς παράγοντες CDC6/Cdc18 και Cdt1 σε αδρανή κατάσταση. Στο δεύτερο στάδιο, η ελικάση ενεργοποιείται με φωσφορυλίωση λόγω της αύξησης της CDK δραστηριότητας κατά τη G1/S μετάβαση, η οποία σε συνδυασμό με την ενεργοποίηση και άλλων βοηθητικών παραγόντων και τη στρατολόγηση της αντιγραφικής μηχανής πυροδοτεί το τοπικό ξετύλιγμα του DNA και τη σύνθεση του νέο-αντιγραφόμενου DNA. Απορρύθμιση του μηχανισμού αδειοδότησης της αντιγραφής σχετίζεται με γονιδιωματική αστάθεια και με την επαγωγή μονοπατιών κυτταρικού θανάτου. Στο σχιζοσακχαρομύκητα υπερέκφραση του αδειοδοτικού παράγοντα Cdc18 αρκεί για την κατάργηση του κανόνα για εκκίνηση της αντιγραφής μία και μόνο μία φορά σε κάθε κυτταρικό κύκλο, προκαλώντας επαναντιγραφή του DNA κατά την οποία αντιγραφικές φυσαλίδες γεννώνται μέσα σε ήδη υπάρχουσες φυσαλίδες. Σκοπός της παρούσας διδακτορικής διατριβής υπήρξε η διερεύνηση κυτταρικών «αισθητήρων» ειδικά για φαινόμενα απορρύθμισης του αδειοδοτικού μηχανισμού. Για το σκοπό αυτό διερευνήθηκε ο πιθανός ρόλος του ριβοσωματικού DNA (ribosomal DNA, rDNA) ως αισθητήρα βλαβών ειδικά κατά την επαγωγή του φαινομένου της επαναντιγραφής. Το ριβοσωματικό DNA αποτελείται από εκατοντάδες-χιλιάδες επαναλήψεις rRNA γονιδίων, η μεταγραφή των οποίων δίνει γένεση στον πυρηνίσκο. Σε κάθε επανάληψη εδράζεται μία αφετηρία της αντιγραφής με αποτέλεσμα τη συσσώρευση πολλών θέσεων έναρξης της αντιγραφής που βρίσκονται σε πυκνή διάταξη στο rDNA. Δεδομένης της ιδιαιτερότητας του rDNA ως προς τη συσσώρευση αφετηριών αλλά και άλλων εγγενών χαρακτηριστικών (συνεχής και έντονη μεταγραφή των γονιδίων του, περιοχές φραγμού της αντιγραφικής διχάλας, τεταρτογενείς δομές του DNA G4 κ.ά.) υποθέσαμε ότι θα μπορούσε να είναι ιδιαίτερα ευαίσθητο σε συνθήκες επαναδειοδότησης και επαναντιγραφής, δρώντας ως σηματοδότης της ύπαρξης ανισορροπίας στο σύστημα αδειοδότησης. Αξιοποιήσαμε το σχιζοσακχαρομύκητα ως πειραματικό σύστημα προκειμένου να διερευνήσουμε την παραπάνω υπόθεση. Τα αποτελέσματά μας δείχνουν ότι το rDNA εμφανίζει αύξηση του αριθμού αντιγράφων του πολύ νωρίς κατά την πρόκληση ήπιας επαναντιγραφής. Ακόμη, εστίες συσσώρευσης των δεικτών DNA βλάβης της φωσφορυλιωμένης ιστόνης 2Α και του Rad22 συγκεντρώνονται κυρίως στην περιοχή του πυρηνίσκου, που οργανώνεται γύρω από το rDNA, κατά την επαγωγή ήπιας επαναντιγραφής. Στο δεύτερο μέρος αυτής της διατριβής πραγματοποιήσαμε συνδυαστικά πειράματα με υπερέκφραση Cdc18 αγρίου τύπου ή μεταλλάγματος από το οποίο απουσιάζει το αμινοτελικό άκρο παρουσία ή απουσία της πρωτεΐνης Rad3, δείχνοντας ότι κατά την υπερέκφραση του Cdc18 τα επαγόμενα Rad3-εξαρτώμενα και μη μονοπάτια είναι αναγκαίο να δρουν σε συνέργεια για την πλήρη παρεμπόδιση της εισόδου σε μίτωση όταν το DNA των κυττάρων έχει υποστεί επαναντιγραφή. Έτσι, το Cdc18 αναδεικνύεται ως κομβικό μόριο για τη διατήρηση της γονιδιωματικής σταθερότητας

Hellenic National Archive of Doctoral Dissertations

The size distribution of container terminals : an inter-quartile range analysis

Author: Kaselimi Vicky
Notteboom Theo
Publication venue
Publication date: 01/01/2011
Field of study

Institutional Repository Universiteit Antwerpen