28 research outputs found

    Towards Building a Link Set Backed by Domain Experts using the Alignment Tool

    Get PDF
    Discovering semantic relations between entities (entity linking) is one of the most important activity for both semantic web and linked data areas. Either we need link sets of instances or concepts we can rely on automatic systems only to a certain extent. As a result, an automatic linking is accompanied with a user interaction which enables to increase the quality of resulted link sets. Often, in order to reach as much quality of link set as possible the user should be a domain expert for an area of linking task. This user specifics should be considered by designers of interactive entity linking tools. This work presents an experience from an experiment of building a link set for two fiscal code lists where domain experts have been involved. The experiment has been done using the Alignment tool

    The Principles, Features and Techniques of Data Journalism

    Get PDF
    Digital and computational technology is steadily developing and continually bringing changes in the field of journalism, which faces a major crisis, as people’s trust in the media continues to decrease. This paper studies the subject of data journalism which is increasing in popularity and is considered to be at the forefront of these changes. This kind of journalism may be a way to re-establish and strengthen journalism’s value, as well as to reassure its sustainability. Datasets, tools, policies on Freedom of Information and transparency and professionals become constantly available for data journalism to flourish. However, there are still many challenges along with skepticism and confusion around its role and value in the field. In the near future, data journalism seems to gain more trust by the news organization and the public, as both start to comprehend its potentials

    Creating and Using Sports Linked Data: Applications and Analytics Panagiotis-Marios Philippides

    Get PDF
    ABSTRACT Linked data have made significant progress over the last few years and many kinds of datasets are transformed into this format at a highly increasing rate, contributing to the openness, connectivity and re-use of web data. However, this progress is not the case for a popular sport like basketball, at least as far as the raw statistics is concerned. This kind of data contains valuable information that can be used by fans, teams and coaches, statisticians and other scientists. In this work, statistical data from Euroleague are transformed into linked data, thereby filling the relevant gap in the LOD Cloud, while ways of exploitation of them are presented, from fascinating applications for the fans, like the Euroleague Timeline, to cases of complex processing, analysis and visualization of data through software like R

    Towards Budget Comparative Analysis: The Need for Fiscal Code Lists as Linked Data

    Get PDF
    ABSTRACT Code lists are a key part of budget datasets as they serve for the coding of fiscal concepts within them. However, the great diversity of classifications across countries and concepts does not allow to presume upon their actual value, as dimension properties. In this paper we discuss the need for creating code lists Linked Data for the classifications used in fiscal datasets, in three basic steps. First, code lists have to be extracted from fiscal datasets, especially if there are no relevant metadata in the budget description, which could easily identify them. Next, code lists from different datasets or sources have to be represented in the same way, with SKOS vocabulary, thus they can be linked with each other. Finally, linking of similar code lists will also allow the linking of the containing datasets, increasing their data analysis and knowledge extraction possibilities

    Knowledge management and semantic representation of medical computational problems

    No full text
    Medical Informatics is the outcome of prolonged research efforts in both fields of Medicine and Informatics. Lately, tighter bonds have been developed between the two sciences resulting in the deployment of information systems in the field of Medicine. Included in the scientific area of medical Informatics are, among others, the development of theoretical models as well as practical tools for the qualitative and scientific support of medical acts, medical education and organization of health services. Moreover, nowadays special concern is granted to issues like explanation, organization and management of medical knowledge. The result of the abovementioned issues has been the rapid development of medical algorithms with the aid of Informatics which constitutes a large part of contemporary research in the field of medical informatics. In addition, through the Internet (web) numerous medical algorithms along with their implementations are provided free for use. However, despite the proven benefits of implemented medical algorithms in healthcare, the lack of organization and standardization of their information as well as the difficulty of their discovery and utilization lead to compromised use of this system by the medical staff. The purpose of the present thesis was the initial development of semantic descriptions of Medical Computational Problems (MCPs) and the management of resulting knowledge. Defined by the term MCPs are medical problems the solution of which is an algorithm based on mathematical or statistical models and is implemented through Information Technologies (IT). Specifically, in order for this aim to be achieved, the following were developed: • The MCP Ontology for the semantic representation of MCP knowledge which it describes as a triad: For the development of MCP Ontology three interacting ontological schemes that refer to each part of the above triad were created. Furthermore, existing ontological schemas were reused or altered like BibTex Ontology - for the semantic description of bibliographic recourses of MCPs, ConOnto Ontology - for the semantic description of software and material concerning development and execution of implemented applications, and UMLS Ontology - for the semantic description of medical terms in the description of a medical problem. • The knowledge retrieval through ontological questions and the utilization of information retrieval methods inside the MCP Ontology. For the quest of MCPs the method developed was an adaptation of the classical Vector Space Model (VSM) in MCP Ontology, based on which the similarity between MCP semantic descriptions and the user questions is calculated. The MCP vectors are created by the implementation of the weights of the UMLS terms acting as the problem indexing terms in the MCP Ontology. Moreover, another algorithm was developed, expanding the user question and based on the creation of a fuzzy thesaurus of the relevant UMLS terms inside the MCP Ontology. • The dynamic semantic composition of a sequence of algorithms managing a certain medical case. Specifically, using semantic rules, the links between different algorithms are created and used in the construction of a Finite State Machine (FSM) from algorithms. The description of a certain medical case via the MCP Ontology by a user constitutes the language of that case which is recognised by a FSM of algorithms with the final algorithm that manages the case as the initial state and the algorithm of initiation by the user as the final state. • A step-by-step methodology for the development of a modular and expandable Knowledge System (KS) for the MCPs. The system consists of four subsystems: (1) The Semantic MCP Repository through which knowledge in the MCP Ontology is entered and renewed, (2) A Query Engine which retrieves knowledge from the MCP Ontology, (3) The Ontology-Based VSM Space which estimates the relevance of the user question to the MCPs inside the MCP knowledge base, and (4) The MCP-Algorithm Composition for Management of Medical Cases via which it is possible to build an algorithmic sequence from the MCP Ontology, aiding the management of a specific medical case. The thesis is concluded with the experimental results from the utilization of the KS for the MCPs, presenting four indicative examples of use focused on their impact on clinical medical practice. In conclusion, the developed methods of display and management of MCP knowledge along with the further utilization of the proposed KS are expected to enhance the dissemination and use of algorithmic solutions in everyday medical practice. Simultaneously, medical research and high quality medical education are bound to be benefited at a considerable level.Η ιατρική πληροφορική αποτελεί το γόνο µακροχρόνιας ερευνητικής προσπάθειας της ιατρικής και της πληροφορικής. Τα τελευταία χρόνια έχουν αναπτυχθεί ισχυροί δεσµοί µεταξύ των δύο επιστηµών, µε αποτέλεσµα την δυναµική είσοδο συστηµάτων πληροφορικής στο χώρο της υγείας. Στο επιστηµονικό πεδίο της ιατρικής πληροφορικής περιλαµβάνονται µεταξύ άλλων η ανάπτυξη θεωρητικών µοντέλων αλλά και πρακτικών εργαλείων για την ποιοτική και επιστηµονική υποστήριξη της ιατρικής πράξης, της ιατρικής εκπαίδευσης και της οργάνωσης υπηρεσιών υγείας. Επιπλέον, στις µέρες µας δίνεται ιδιαίτερη βαρύτητα σε θέµατα ερµηνείας, οργάνωσης και διαχείρισης της ιατρικής γνώσης. Φυσικό επακόλουθο των παραπάνω αποτελεί η ραγδαία ανάπτυξη ιατρικών αλγορίθµων µε τη βοήθεια της πληροφορικής, η οποία και καταλαµβάνει ένα µεγάλο ποσοστό της σύγχρονης έρευνας στα πλαίσια της ιατρικής πληροφορικής. Επιπρόσθετα, µέσω του διαδικτύου πολλοί ιατρικοί αλγόριθµοι καθώς και οι εφαρµογές τους παρέχονται δωρεάν προς χρήση. Ωστόσο, παρά τα διαπιστωµένα οφέλη της χρήσης των υλοποιηµένων ιατρικών αλγορίθµων στην υγειονοµική περίθαλψη, η έλλειψη οργάνωσης και τυποποίησης της πληροφορίας τους, καθώς και η δυσκολία της εύρεσης και της χρήσης τους, δυσχεραίνουν τη χρησιµοποίησή τους από το ιατρικό προσωπικό. Σκοπός της παρούσας διατριβής ήταν η αρχική ανάπτυξη σηµασιολογικών περιγραφών Υπολογιστικών Προβληµάτων Ιατρικής (ΥΠΙ) καθώς και της διαχείρισης της προκύπτουσας από αυτές γνώσης. Με τον όρο ΥΠΙ αναφέρονται τα ιατρικά προβλήµατα, η λύση των οποίων είναι ένας αλγόριθµος που βασίζεται σε µαθηµατικά ή στατιστικά µοντέλα και υλοποιείται µέσω τεχνολογιών πληροφορικής. Συγκεκριµένα, για την επίτευξη του παραπάνω σκοπού αναπτύχθηκαν τα εξής: • Η Οντολογία ΥΠΙ για την σηµασιολογική αναπαράσταση της γνώσης των ΥΠΙ, τα οποία και περιγράφει ως µια τριπλέτα: . Για την ανάπτυξη της Οντολογίας ΥΠΙ δηµιουργήθηκαν τρία αλληλένδετα οντολογικά σχήµατα που αντιστοιχούν στο κάθε µέρος της παραπάνω τριπλέτας. Επιπλέον, επαναχρησιµοποιήθηκαν ή προσαρµόστηκαν υπάρχοντά οντολογικά σχήµατα όπως η BibTex οντολογία, για την σηµασιολογική περιγραφή των βιβλιογραφικών πηγών των ΥΠΙ, η ConOnto οντολογία για την σηµασιολογική περιγραφή του λογισµικού και του υλικού ανάπτυξης καθώς και εκτέλεσης των υλοποιηµένων εφαρµογών, και η UMLS οντολογία για την σηµασιολογική περιγραφή των ιατρικών εννοιών στην περιγραφή ενός ιατρικού προβλήµατος. • Η ανάκτηση γνώσης µέσω οντολογικών ερωτηµάτων και της προσαρµογής µεθόδων ανάκτησης πληροφοριών στην οντολογία ΥΠΙ. Συγκεκριµένα για την αναζήτηση των ΥΠΙ, αναπτύχθηκε η µέθοδος προσαρµογής του κλασικού διανυσµατικού µοντελοχώρου στην οντολογία ΥΠΙ, βάσει της οποίας υπολογίζεται η οµοιότητα των ΥΠΙ σηµασιολογικών περιγραφών και των ερωτηµάτων του χρήστη. Τα διανύσµατα των ΥΠΙ προκύπτουν µε την ενσωµάτωση στην ΥΠΙ οντολογία των βαρών των UMLS εννοιών που αποτελούν τους όρους δεικτοδότησης ενός προβλήµατος. Επιπλέον, αναπτύχθηκε αλγόριθµος επέκτασης του ερωτήµατος του χρήστη που βασίζεται στη δηµιουργία ενός ασαφούς θησαυρού µεταξύ των σχετικών µεταξύ τους UMLS εννοιών της ΥΠΙ Οντολογίας. • Η δυναµική σύνδεση ακολουθίας αλγορίθµων διαχείρισης συγκεκριµένου ιατρικού περιστατικού. Συγκεκριµένα, µε την χρήση σηµασιολογικών κανόνων δηµιουργούνται οι συνδέσεις µεταξύ διαφορετικών αλγορίθµων οι οποίες χρησιµοποιούνται στην κατασκευή µιας Μηχανής Πεπερασµένων Καταστάσεων (ΜΠΚ) από αλγορίθµους. Η περιγραφή συγκεκριµένου περιστατικού βάση της ΥΠΙ οντολογίας από έναν χρήστη αποτελεί και την γλώσσα του περιστατικού, η οποία αναγνωρίζεται από µια ΜΠΚ αλγορίθµων µε αρχική κατάσταση τον τελικό αλγόριθµο διαχείρισης του ιατρικού περιστατικού και τελική τον αλγόριθµο αφετηρίας του χρήστη. • Μια βήµα προς βήµα µεθοδολογία ανάπτυξης ενός αρθρωτού και επεκτάσιµου συστήµατος γνώσης (ΣΓ) των ΥΠΙ. Το σύστηµα αποτελείται από τα τέσσερα υποσυστήµατα: (1) της Σηµασιολογικής Αναπαράστασης ΥΠΙ, µέσω του οποίου εισάγεται και ανανεώνεται η γνώση στην ΥΠΙ Οντολογία, (2) της Μηχανής Αναζήτησης, που ανακτά τη γνώση από την ΥΠΙ Οντολογία, (3) του Σηµασιολογικού ∆ιανυσµατικού Μοντελοχώρου, το οποίο εκτιµά τη σχετικότητα του ερωτήµατος του χρήστη µε τα ΥΠΙ της ΥΠΙ Βάσης Γνώσεων, (4) του Σχεδιασµού ∆ιαχείρισης Ιατρικού Περιστατικού, µέσω του οποίου σχεδιάζεται µια ακολουθία αλγορίθµων της ΥΠΙ Οντολογίας, που βοηθούν στη διαχείριση συγκεκριµένου ιατρικού περιστατικού. Η διατριβή ολοκληρώνεται µε τα πειραµατικά αποτελέσµατα της χρήσης του ΣΓ των ΥΠΙ, παρουσιάζοντας τέσσερα ενδεικτικά παραδείγµατα χρήσης του, εστιάζοντας στην χρησιµότητα τους στην κλινική πράξη. Συµπερασµατικά, οι µέθοδοι αναπαράστασης και διαχείρισης της γνώσης των ΥΠΙ που αναπτύχθηκαν, καθώς και η χρήση του ΣΓ αναµένονται να ενισχύουν τη διάδοση και τη χρήση αλγοριθµικών επιλύσεων στην καθηµερινή ιατρική πράξη, ενώ συγχρόνως πρόκειται να ωφεληθούν σε ένα µεγάλο ποσοστό η ιατρική έρευνα και η υψηλής ποιότητας ιατρική εκπαίδευση