3 research outputs found

    Οπτικοποίηση και συγκριτική ανάλυση κοινοτήτων σε βιοϊατρικά δίκτυα

    Get PDF
    Ομαδοποίηση είναι η διαδικασία ομαδοποίησης διαφορετικών δεδομένων με βάση τις παρόμοιες ιδιότητες που εμφανίζουν. Η ομαδοποίηση έχει εφαρμογές σε διαφορετικές μελέτες που αφορούν διάφορους τομείς όπως στη θεωρία γραφημάτων, στην ανάλυση εικόνας, στην αναγνώριση προτύπων, στη στατιστική και άλλα. Σήμερα, υπάρχουν πολλοί αλγόριθμοι και εργαλεία ικανά να δημιουργήσουν αποτελέσματα ομαδοποίησης. Ωστόσο, διαφορετικοί αλγόριθμοι ή διαφορετική παραμετροποίηση αυτών μπορεί να οδηγήσει στον σχηματισμό πολύ διαφορετικών ομάδων. Με αυτόν τον τρόπο, ο χρήστης συχνά αναγκάζεται να φιλτράρει και να συγκρίνει χειροκίνητα αυτά τα αποτελέσματα, προκειμένου να αποφασίσει ποια από αυτές παράγει το ιδανικό σύμπλεγμα. Για την αυτοματοποίηση αυτής της διαδικασίας, σε αυτήν την εργασία, παρουσιάζουμε το VICTOR, την πρώτη πλήρως διαδραστική εφαρμογή οπτικής ανάλυσης που επιτρέπει τη σύγκριση και οπτικοποίηση διαφόρων αλγορίθμων ομαδοποίησης. Το VICTOR μπορεί να χειριστεί πολλαπλά αποτελέσματα συμπλέγματος ταυτόχρονα και να τα συγκρίνει χρησιμοποιώντας δέκα διαφορετικές μετρικές. Τα αποτελέσματα ομαδοποίησης μπορούν να φιλτραριστούν και να συγκριθούν μεταξύ τους με τη χρήση διαδραστικών heatmaps, bar plots, δικτύων συσχέτισης, sankey και circos plots. H λειτουργικότητα του VICTOR αναδεικνύεται χρησιμοποιώντας τρία παραδείγματα. Στην πρώτη περίπτωση, συγκρίνουμε πέντε διαφορετικούς αλγόριθμους σε ένα σύνολο δεδομένων αλληλεπίδρασης πρωτεΐνης-πρωτεΐνης, ενώ στο δεύτερο παράδειγμα, δοκιμάζουμε τέσσερις διαφορετικές παραμέτρους του ίδιου αλγορίθμου συμπλέγματος που εφαρμόζονται στο ίδιο σύνολο δεδομένων. Τέλος, ως τρίτο παράδειγμα, συγκρίνουμε τέσσερις διαφορετικές μετα-αναλύσεις με ιεραρχικά ομαδοποιημένα διαφορικά εκφρασμένα γονίδια που βρέθηκαν να εμπλέκονται στο έμφραγμα του μυοκαρδίου. Το VICTOR είναι διαθέσιμο στο http://bib.fleming.gr:3838/VICTOR.Clustering is the process of grouping different data based on the similar properties they display. Clustering has applications in different studies related to various fields such as graph theory, image analysis, pattern recognition, statistics and more. Nowadays, there are many algorithms and tools capable of generating clustering results. However, different algorithms or different parameterization may result in very different clusters. This way, the user is often forced to manually filter and compare these results in order to decide which of them produce the ideal clusters. To automate this process, in this study, we present VICTOR, the first fully interactive and dependency-free visual analytics application which allows the comparison and visualization of various clustering algorithms. VICTOR can handle multiple cluster results simultaneously and compare them using ten different metrics. Clustering results can be filtered and compared using interactive heatmaps, bar plots, correlation networks, sankey and circos plots. VICTOR’s functionality is demonstrated using three examples. In the first case, we compare five different algorithms on a protein-protein interaction dataset whereas in the second example, we test four different parameters of the same clustering algorithm applied on the same dataset. Finally, as a third example, we compare four different meta-analyses with hierarchically clustered differentially expressed genes found to be involved in myocardial infarction. VICTOR is available at http://bib.fleming.gr:3838/VICTOR

    Συγκριτική ανάλυση αλγορίθμων ομαδοποίησης σε βιοϊατρικά δίκτυα

    Get PDF
    Ως ομαδοποίηση/συσταδοποίηση (clustering) βιολογικών δικτύων χαρακτηρίζουμε τη διαδικασία σύμφωνα με την οποία οι κόμβοι ενός δικτύου μπορούν να καταταχθούν σε μια κοινή ομάδα σύμφωνα με κοινά τους χαρακτηριστικά. Για το σκοπό αυτό υπάρχει μια πληθώρα αλγορίθμων ομαδοποίησης οι οποίοι μπορούν να αυτοματοποιούν αυτή τη διαδικασία ακολουθώντας διαφορετικές στρατηγικές και μεθοδολογίες. Αξίζει να σημειωθεί ότι οι περισσότεροι από τους αλγόριθμους αυτούς λαμβάνουν υπόψη την τοπολογία του δικτύου. Ως εκ τούτου, διαφορετικοί αλγόριθμοι ομαδοποίησης, μπορεί συχνά να οδηγήσουν σε διαφορετικά αποτελέσματα ακόμα και για το ίδιο σύνολο δεδομένων. Στα πλαίσια της διπλωματικής αυτής, αρχικά συγκεντρώθηκαν πολλαπλά βιολογικά δίκτυα διαφορετικού τύπου από διάφορες βάσεις δεδομένων και μελετήθηκαν ως προς την τοπολογία τους. Οι κατηγορίες δικτύων που αναλύθηκαν είναι τα δίκτυα αλληλεπίδρασης πρωτεϊνών, τα δίκτυα συν-έκφρασης γονιδίων καθώς και τα δίκτυα ομοιότητας αλληλουχιών. Στη συνέχεια, εφαρμόστηκαν διαφορετικοί αλγόριθμοι ομαδοποίησης δεδομένων, τα αποτελέσματα των οποίων συγκρίθηκαν τόσο μεταξύ τους όσο και με ομάδες δεδομένων που προήλθαν ύστερα από εφαρμογή ροών που αφορούν το λειτουργικό εμπλουτισμό των κόμβων του εκάστοτε δικτύου. Επίσης, παρουσιάζεται το μέτρο conductance (αγωγιμότητα), με τη χρήση του οποίου φαίνεται μέσω ιστογραμμάτων, η ποιότητα της κάθε ομάδας (cluster) ενός δικτύου στο υπόλοιπο αρχικό δίκτυο. Τέλος, μέσω της δημιουργίας του εργαλείου VICTOR μπορούν να εφαρμοστούν οι διάφορες μετρικές ώστε να μελετηθούν τα αποτελέσματα των αλγορίθμων ομαδοποίησης μέσω της οπτικής ανάλυσης.As clustering of biological networks, it’s called the process according to which the nodes of a network can be classified in a common group according to their common features. In order to succeed this process automatically, there are a variety of clustering algorithms based on different strategies and methodologies. Note that most of these algorithms take into account the network topology. Therefore, different clustering algorithms can often bring out different results even for the same data set. In order to proceed with this Thesis, initially multiple biological networks of different types were collected from various databases. The collected biological networks that were analyzed are protein interaction networks, gene co-expression networks, and sequence similarity networks. Firstly, these networks were studied in terms of their topology. After that, different data clustering algorithms were applied, the results of which were compared both with each other and with data sets that came after the application of flows related to the functional enrichment of the nodes of each network. Also, as part of this Thesis, it’s presented the conductance measure which shows, through histograms, the quality of each cluster in the rest of the original network. Finally, through the development of the VICTOR tool, various comparison metrics can be applied through which the results of clustering algorithms can be compared via visual analysis
    corecore