    Semantic interoperability and retrieval of distributed knowledge on the semantic web

    No full text
    The Semantic Web is the application of advanced knowledge technologies to the Web and to distributed systems in general. It is considered as the extension of the Word Wide Web, where information is assigned a well-defined meaning. Semantic interoperability implies that systems are able to share and correlate heterogeneous information – even if the latter is unstructured in terms of meaning and comes from multiple resources – thus leading to the discovery of new knowledge. Having these in mind and given that syntactic interoperability has already been achieved to some extent, our research is focusing on knowledge discovery on the Semantic Web through the fulfilment of semantic interoperability. The primary objective of this thesis is to study the most recent developments in the field of knowledge search and retrieval as well as the use of effective techniques for knowledge sharing on the Semantic Web. We focus on digital libraries and more specifically on repositories that manage educational resources. In the first place, we review and evaluate existing approaches and then we propose a technique that provides an efficient way to perform semantic search and achieve semantic interoperability between heterogeneous data sources. To this end, we rely on fundamental Semantic Web standards, such as the Resource Description Framework (RDF), the OWL ontology language, the SKOS model for organizing controlled vocabularies, and on well-known educational metadata standards, used by Institutions worldwide for representing educational resources. Our goal is the implementation of a service that will correspond in the best possible way to the modern requirements of a semantically distributed world, such as the Semantic Web, through the application of ontologies and other widely adopted technologies and standards. An important characteristic of this service is that it takes advantage of the semantic implications in content’s metadata and tries to exploit them all in an attempt to extract new information. The proposed service is applied to a digital repository system, designed to mostly handle educational resources. By this way, digital repositories systems are enhanced with an advanced searching facility, as well as with the possibility to publish all of their stored information in the form of Linked Data. Finally, the proposed approach is studied and evaluated on the basis of some fundamental metrics and parameters, which are shown to play an essential role in large-scale data repositories, in accordance to the literature. These repositories are designated to handle high volume of data, i.e., in digital repositories systems of the real world.Ο Σημασιολογικός Ιστός (Semantic Web) αποτελεί εφαρμογή των προηγμένων τεχνολογιών γνώσης στον Παγκόσμιο Ιστό και σε άλλα κατανεμημένα συστήματα. Η ύπαρξη σημασιακής διαλειτουργικότητας υπονοεί τη δυνατότητα συνδιαλλαγής και διαπραγμάτευσης πληροφοριών μεταξύ συστημάτων, οι οποίες, ενώ μπορεί να είναι κατά βάση ετερογενείς, προερχόμενες από πολλαπλές πηγές και αδόμητες σημασιακά, μπορούν να συσχετιστούν και, βάσει συμπερασμών, να συνδυαστούν κατάλληλα με στόχο την ανακάλυψη νέας γνώσης. Δεδομένου, λοιπόν, ότι η συντακτική διαλειτουργικότητα έχει ως ένα βαθμό επιτευχθεί, στα πλαίσια της παρούσας έρευνας επικεντρωνόμαστε στη δυνατότητα ανακάλυψης νέας γνώσης στο Σημασιολογικό Ιστό μέσα από την υλοποίηση της σημασιακής διαλειτουργικότητας. Αρχικό στόχο της παρούσας έρευνας αποτελεί η μελέτη των τελευταίων εξελίξεων σε θέματα αναζήτησης κι ανάκτησης γνώσης στο Σημασιολογικό Ιστό καθώς και η αξιοποίηση αποτελεσματικών τεχνικών για το διαμοιρασμό γνώσης. Εστιάζουμε στο χώρο των ψηφιακών βιβλιοθηκών και ειδικότερα των αποθετηρίων που διαχειρίζονται μαθησιακούς πόρους. Επιδιώκουμε τη μελέτη και αξιολόγηση των ήδη υπαρχουσών τεχνικών και εν τέλει την πρόταση συγκεκριμένης τεχνικής που θα προσφέρει μια αποδοτική λύση στο ζήτημα της σημασιακής αναζήτησης και της επίτευξης διαλειτουργικότητας μεταξύ ετερογενών πηγών δεδομένων. Για το σκοπό αυτό βασιζόμαστε σε θεμελιώδη πρότυπα του Σημασιολογικού Ιστού που συνεισφέρουν προς αυτή την κατεύθυνση, όπως το Πλαίσιο Περιγραφής Πόρων RDF και ειδικότερα η γλώσσα περιγραφής οντολογιών OWL, το μοντέλο αναπαράστασης ελεγχόμενων λεξιλογίων SKOS, αλλά και πρότυπα αναπαράστασης εκπαιδευτικών μεταδεδομένων. Απώτερο στόχο της έρευνάς μας αποτελεί η παρουσίαση μιας ολοκληρωμένης υπηρεσίας που μέσα από την εφαρμογή των οντολογιών επιτυγχάνει την ανάκτηση γνώσης, υιοθετώντας εκείνα τα πρότυπα που ανταποκρίνονται αποτελεσματικότερα στις σύγχρονες απαιτήσεις ενός σημασιακά κατανεμημένου χώρου, όπως ο Σημασιολογικός Ιστός. Ουσιαστικό γνώρισμα της υπηρεσίας αυτής είναι ότι δεν αφήνει ανεκμετάλλευτους τους σημασιολογικούς υπαινιγμούς και αποσκοπεί στην εξαγωγή νέας πληροφορίας. Εν τέλει, η προτεινομένη υπηρεσία εφαρμόζεται σε ψηφιακά αποθετήρια εκπαιδευτικού υλικού, καθιστώντας εφικτή όχι μόνο τη δυνατότητα προηγμένης αναζήτησης σε αυτά αλλά παράλληλα επιτρέποντας τη διάθεση της ανακτώμενης πληροφορίας με τη μορφή Διασυνδεδεμένων Δεδομένων (Linked Data). Τέλος, όλα τα παραπάνω μελετώνται συναρτήσει ορισμένων βασικών μετρικών και παραμέτρων, που παίζουν ουσιαστικό ρόλο σε μεγάλου εύρους και όγκου (δηλαδή σε πραγματικά) αποθετήρια δεδομένων