5 research outputs found

    Semantics-Based Content Extraction in Typewritten Historical Documents

    No full text
    This paper presents a flexible approach to extracting content from scanned historical documents using semantic information. The final electronic document is the result of a "digital historical document lifecycle" process, where the expert knowledge of the historian/archivist user is incorporated at different stages. Results show that such a conversion strategy aided by (expert) user-specified semantic information and which enables the processing of individual parts of the document in a specialised way, produces superior (in a variety of significant ways) results than document analysis and understanding techniques devised for contemporary documents

    A Workbench for Document Processing

    Get PDF
    During the MEMORIAL project time an international consortium has developed a software solution called DDW (Digital Document Workbench). It provides a set of tools to support the process of digitisation of documents from the scanning up to the retrievable presentation of the content. The attention is focused to machine typed archival documents. One of the important features is the evaluation of quality in each step of the process. The workbench consists of automatic parts as well as of parts which request human activity. The measurable improvement of 20% shows the approach is successful

    Semantics-based content extraction in typewritten historical documents

    Full text link
    This paper presents a flexible approach to extracting content from scanned historical documents using semantic information. The final electronic document is the result of a "digital historical document lifecycle" process, where the expert knowledge of the historian/archivist user is incorporated at different stages. Results show that such a conversion strategy aided by (expert) user-specified semantic information and which enables the processing of individual parts of the document in a specialised way, produces superior (in a variety of significant ways) results than document analysis and understanding techniques devised for contemporary documents

    Τα αρχεία και η διαχείριση γνώσης στην κοινωνία της γνώσης.

    Get PDF
    Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2011.Μέσα από μια συγκριτική παρουσίαση της διαχείρισης της πληροφορίας (Ιnformation Μanagement- IM) και της διαχείρισης της γνώσης (Knowledge Management- KM), δύο βασικών εννοιών της τεχνολογίας της πληροφορίας (Ιnformation Technology- ΙΤ), η μελέτη -με τη διαπίστωση των διαφορών τους- αναδεικνύει την ιδιαίτερη φύση της δεύτερης και τη συμβολή της στη σημασιολογική προσπέλαση και παράσταση εννοιών στον αρχειακό χώρο. Αναπτύσσεται μια στρατηγική δύο φάσεων για την αξιοποίηση της αρχειακής γνώσης στο σύγχρονο ηλεκτρονικό περιβάλλον, βασισμένη στη διερεύνηση των δυνατοτήτων που προσφέρει η σύγχρονη τεχνολογία. Η πρώτη φάση της στρατηγικής (Κεφάλαιο 1, Κεφάλαιο 2) εστιάζεται στην ανάλυση των υπό εξέταση εννοιών και στηρίζεται στο τρίπτυχο «αξιολόγηση της πληροφορίας > ανίχνευση της λανθάνουσας γνώσης > αξιοποίηση της γνώσης». Οι εξελίξεις της τεχνολογίας στις δύο τελευταίες δεκαετίες, συμπεριλαμβανομένης της ανάπτυξης του διαδικτύου και ιδιαίτερα του Web 2.0, με τη δημιουργία κοινοτήτων δράσης και τη χρήση μεταδεδομένων, έχουν δημιουργήσει νέους προβληματισμούς και προκλήσεις για τους αρχειακούς οργανισμούς, ως διαχειριστές των αρχείων. Το ενδιαφέρον έχει μόλις πρόσφατα αρχίζει να εστιάζεται στην οργάνωση και όχι μόνο στην περιγραφή του περιεχομένου των πληροφοριών που τα αρχεία παρέχουν, με τη δόμηση μετα-βιβλιοθηκών αρχείων. Η αρχειονομική κοινότητα συνειδητοποιεί πλέον ότι οι τεχνολογικές δυνατότητες του σύγχρονου παρελθόντος- όπως η πλοήγηση, η αναζήτηση και η ανάκτηση μέσα από πίνακες και ευρετήρια αρχείων στον παγκόσμιο ιστό (World Wide Web- WWW)- δεν επαρκούν για να εξυπηρετήσουν τις ανάγκες των χρηστών της, εάν τα δεδομένα και οι πληροφορίες που προκύπτουν από την ΙΜ/ KM δεν αξιοποιούνται πλήρως. Με συστημική προσέγγιση η δεύτερη φάση της στρατηγικής (Kεφάλαιο 3, Κεφάλαιο 4) επικεντρώνεται στην αποτίμηση των ωφελειών στον αρχειακό χώρο από τη δημιουργία οντολογικών σχημάτων και τη χρήση μεταδεδομένων, ως εργαλείων διαχείρισης της γνώσης. Υπό το πρίσμα της εστίασης στο χρήστη, η γνώση που εμπεριέχεται στα αρχεία πρέπει όχι μόνο να διαφυλαχθεί, αλλά και να οργανωθεί, εάν πρώτιστος στόχος της λειτουργίας των αρχειακών οργανισμών είναι η αναβάθμιση του δείκτη αποδοτικότητάς τους στο σύγχρονο διεθνές περιβάλλον. Τα αρχεία οφείλουν να παρέχουν στους χρήστες τους όχι μόνο μια πλήρη περιγραφή του υλικού τους σε ηλεκτρονικό περιβάλλον, αλλά και τη δυνατότητα μιας εξατομικευμένης και εξ αποστάσεως προσέγγισης του περιεχομένου τους, ανταποκρινόμενα στο μέγιστο δυνατό βαθμό στις προσωπικές αναζητήσεις των χρηστών. Η συνεχής παρουσίαση νέων μεθοδολογιών για την αξιοποίηση του Web 2.0 στη διαχείριση αρχείων εκφράζει σαφώς τη συγκεκριμένη φιλοσοφία. Ταυτόχρονα με τη διαπιστωμένη τάση για προαγωγή της έρευνας στον τομέα αυτό διαμορφώνεται η συνείδηση ότι επαρκώς δομημένες ad hoc θεωρητικές προσεγγίσεις και κατά περίπτωση καλά σχεδιασμένες πρακτικές μπορούν να προσφέρουν σημαντικά πλεονεκτήματα και σε καθολικές εφαρμογές
    corecore