5 research outputs found

    Document Analysis Research in the Year 2021

    Get PDF
    The original publication is available at www.springerlink.comInternational audienceDespite tremendous advances in computer software and hardware, certain key aspects of experimental research in document analysis, and pattern recognition in general, have not changed much over the past 50 years. This paper describes a vision of the future where community-created and managed resources make possible fundamental changes in the way science is conducted in such fields. We also discuss current developments that are helping to lead us in this direction

    Interpretation, Evaluation and the Semantic Gap ... What if we Were on a Side-Track?

    Get PDF
    International audienceA significant amount of research in Document Image Analysis, and Machine Perception in general, relies on the extraction and analysis of signal cues with the goal of interpreting them into higher level information. This paper gives an overview on how this interpretation process is usually considered, and how the research communities proceed in evaluating existing approaches and methods developed for realizing these processes. Evaluation being an essential part to measuring the quality of research and assessing the progress of the state-of-the art, our work aims at showing that classical evaluation methods are not necessarily well suited for interpretation problems, or, at least, that they introduce a strong bias, not necessarily visible at first sight, and that new ways of comparing methods and measuring performance are necessary. It also shows that the infamous {\em Semantic Gap} seems to be an inherent and unavoidable part of the general interpretation process, especially when considered within the framework of traditional evaluation. The use of Formal Concept Analysis is put forward to leverage these limitations into a new tool to the analysis and comparison of interpretation contexts

    Iterated Classification of Document Images

    Get PDF

    Τα αρχεία και η διαχείριση γνώσης στην κοινωνία της γνώσης.

    Get PDF
    Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2011.Μέσα από μια συγκριτική παρουσίαση της διαχείρισης της πληροφορίας (Ιnformation Μanagement- IM) και της διαχείρισης της γνώσης (Knowledge Management- KM), δύο βασικών εννοιών της τεχνολογίας της πληροφορίας (Ιnformation Technology- ΙΤ), η μελέτη -με τη διαπίστωση των διαφορών τους- αναδεικνύει την ιδιαίτερη φύση της δεύτερης και τη συμβολή της στη σημασιολογική προσπέλαση και παράσταση εννοιών στον αρχειακό χώρο. Αναπτύσσεται μια στρατηγική δύο φάσεων για την αξιοποίηση της αρχειακής γνώσης στο σύγχρονο ηλεκτρονικό περιβάλλον, βασισμένη στη διερεύνηση των δυνατοτήτων που προσφέρει η σύγχρονη τεχνολογία. Η πρώτη φάση της στρατηγικής (Κεφάλαιο 1, Κεφάλαιο 2) εστιάζεται στην ανάλυση των υπό εξέταση εννοιών και στηρίζεται στο τρίπτυχο «αξιολόγηση της πληροφορίας > ανίχνευση της λανθάνουσας γνώσης > αξιοποίηση της γνώσης». Οι εξελίξεις της τεχνολογίας στις δύο τελευταίες δεκαετίες, συμπεριλαμβανομένης της ανάπτυξης του διαδικτύου και ιδιαίτερα του Web 2.0, με τη δημιουργία κοινοτήτων δράσης και τη χρήση μεταδεδομένων, έχουν δημιουργήσει νέους προβληματισμούς και προκλήσεις για τους αρχειακούς οργανισμούς, ως διαχειριστές των αρχείων. Το ενδιαφέρον έχει μόλις πρόσφατα αρχίζει να εστιάζεται στην οργάνωση και όχι μόνο στην περιγραφή του περιεχομένου των πληροφοριών που τα αρχεία παρέχουν, με τη δόμηση μετα-βιβλιοθηκών αρχείων. Η αρχειονομική κοινότητα συνειδητοποιεί πλέον ότι οι τεχνολογικές δυνατότητες του σύγχρονου παρελθόντος- όπως η πλοήγηση, η αναζήτηση και η ανάκτηση μέσα από πίνακες και ευρετήρια αρχείων στον παγκόσμιο ιστό (World Wide Web- WWW)- δεν επαρκούν για να εξυπηρετήσουν τις ανάγκες των χρηστών της, εάν τα δεδομένα και οι πληροφορίες που προκύπτουν από την ΙΜ/ KM δεν αξιοποιούνται πλήρως. Με συστημική προσέγγιση η δεύτερη φάση της στρατηγικής (Kεφάλαιο 3, Κεφάλαιο 4) επικεντρώνεται στην αποτίμηση των ωφελειών στον αρχειακό χώρο από τη δημιουργία οντολογικών σχημάτων και τη χρήση μεταδεδομένων, ως εργαλείων διαχείρισης της γνώσης. Υπό το πρίσμα της εστίασης στο χρήστη, η γνώση που εμπεριέχεται στα αρχεία πρέπει όχι μόνο να διαφυλαχθεί, αλλά και να οργανωθεί, εάν πρώτιστος στόχος της λειτουργίας των αρχειακών οργανισμών είναι η αναβάθμιση του δείκτη αποδοτικότητάς τους στο σύγχρονο διεθνές περιβάλλον. Τα αρχεία οφείλουν να παρέχουν στους χρήστες τους όχι μόνο μια πλήρη περιγραφή του υλικού τους σε ηλεκτρονικό περιβάλλον, αλλά και τη δυνατότητα μιας εξατομικευμένης και εξ αποστάσεως προσέγγισης του περιεχομένου τους, ανταποκρινόμενα στο μέγιστο δυνατό βαθμό στις προσωπικές αναζητήσεις των χρηστών. Η συνεχής παρουσίαση νέων μεθοδολογιών για την αξιοποίηση του Web 2.0 στη διαχείριση αρχείων εκφράζει σαφώς τη συγκεκριμένη φιλοσοφία. Ταυτόχρονα με τη διαπιστωμένη τάση για προαγωγή της έρευνας στον τομέα αυτό διαμορφώνεται η συνείδηση ότι επαρκώς δομημένες ad hoc θεωρητικές προσεγγίσεις και κατά περίπτωση καλά σχεδιασμένες πρακτικές μπορούν να προσφέρουν σημαντικά πλεονεκτήματα και σε καθολικές εφαρμογές
    corecore