english greek

Μεταδεδομένα

Η μεγαλύτερη ίσος πρόκληση που πρέπει να αντιμετωπιστεί κατά τη δημιουργία μιας ψηφιακής συλλογής είναι ο μηχανισμός μέσω του οποίου θα καταστούν τα δεδομένα της προσβάσιμα στον τελικό αποδέκτη. Ο μηχανισμός αυτός είναι ο χαρακτηρισμός της πληροφορίας για την οργανωμένη ένταξή της σε ευρετήρια και πίνακες περιεχομένων και υλοποιείται με τη χρήση των μεταδεδομένων.

Τα μεταδεδομένα μπορούν να χαρακτηριστούν ως δεδομένα για τα δεδομένα και αναλόγως της εφαρμογής χωρίζονται σε τρεις κατηγορίες. Η πρώτη σχετίζεται με τα δεδομένα που εισάγει ο χρήστης και αφορούν πληροφορίες σχετικά με το αντικείμενο όπως τις αντιλαμβάνεται αυτός, γιαπαράδειγμα μια περιγραφή για το τι περιέχουν τα δεδομένα. Η δεύτερη σχετίζεται με διαχειριστικά δεδομένα, τα οποία χρησιμοποιούνται για τον έλεγχο της έκδοσης των δεδομένων, τον τύπο τους κλπ. Πιο συγκεκριμένα, το περιεχόμενο και η οργάνωση των μεταδεδομένων που αφορούν τις δύο παραπάνω κατηγορίες, πρέπει να συμβαδίζει με τη βασική μορφή που καθορίζουν κάποια κοινά πρότυπα, ανάλογα με την εκάστοτε εφαρμογή. Στην περίπτωση των μουσείων, οι πληροφορίες που πρέπει να συνοδεύουν ένα έκθεμα καθορίζονται από το εννοιολογικό μοντέλο αναφοράς CIDOC [210]. Το μοντέλο αυτό είναι ικανό να περιγράψει πληροφορίες που αφορούν την ταυτότητα, κατοχή και τοποθέτηση κάποιου μουσειακού εκθέματος, όπως επίσης και πληροφορίες σχετικά με τα φυσικά χαρακτηριστικά, αλλά και ιστορικά γεγονότα που σχετίζονται με αυτό. Παρόλα αυτά όμως, το πρότυπο CIDOC είναι ανίκανο να εκφράσει από μόνο του πληροφορίες που σχετίζονται με τα δεδομένα από την ψηφιοποίηση κάποιου θέματος. Εντούτοις, η ανοιχτή του αρχιτεκτονική επιτρέπει την ενσωμάτωση σχημάτων περιγραφής περισσότερο προσανατολισμένα στα ψηφιακά δεδομένα πολυμέσων, όπως αυτό του MPEG-7 [213].

Η τρίτη κατηγορία αφορά δεδομένα που σχετίζονται με την αυτόματη μαθηματική περιγραφή του αρχειακού αντικειμένου. Τα μεταδεδομένα της κατηγορίας αυτής χρησιμεύουν στην αναζήτηση και ταξινόμηση βάση του ίδιου του περιεχομένου και όχι κάποιας περιγραφής στηριζόμενης στον ανθρώπινο παράγοντα. Στην περίπτωση των τρισδιάστατων αντικειμένων, η περιγραφή του ίδιου του περιεχομένου επιτυγχάνεται βάση ιδικού λογισμικού, το οποίο αναλύοντας τη γεωμετρία του ψηφιοποιημένου θέματος εξάγει πληροφορίες σχετικά με αυτή. Οι πληροφορίες αυτές αφορούν διάφορα τοπολογικά χαρακτηριστικά της τρισδιάστατης γεωμετρίας, όπως είναι για παράδειγμα αυτό της καμπυλότητάς της. Ο πιο διαδεδομένος και κοινά αποδεκτός τρόπος εξαγωγής και χρήσης αυτής της πληροφορίας είναι αυτός που ορίζει το πρότυπο MPEG–7 στο οποίο γίνεται εκτενή αναφορά παρακάτω.

 

 

Αυτόματη εξαγωγή μεταδεδομένων βάση του περιεχομένου

 

Ένας καλός τρόπος ανάδειξης των πλεονεκτημάτων της χρήσης αυτόματης περιγραφής της πληροφορίας, είναι αυτός της παρουσίασής της μέσω μιας εφαρμογής στην οποία όλοι έχουν κάποια εμπειρία. Η εφαρμογή αυτή είναι οι μηχανές αναζήτησης του Internet, οι οποίες είναι ένας μηχανισμός ανάκτησης ψηφιακής πληροφορίας από μια εκτενή βάση δεδομένων.

Σήμερα το Internet αναμφίβολα αποτελεί το καλύτερο μέσω για την εύρεση αλλά και τη διάδοση πληροφορίας. Μπορεί να χαρακτηριστεί σαν μια αχανή βιβλιοθήκη όπου δεν υπάρχουν κανόνες για τον τρόπο οργάνωσης του περιεχομένου της. Ο τεράστιος όγκος πληροφορίας που είναι διαθέσιμος στο Internet αποτελεί μια άριστη πηγή πληροφόρησης, η οποία όμως χωρίς τα κατάλληλα εργαλεία θα ήταν πολύ δύσκολο να αξιοποιηθεί. Τα εργαλεία αυτά είναι οι μηχανές αναζήτησης, οι οποίες δημιουργούν ευρετήρια μεγάλων τμημάτων του διαδικτύου, ενώ παράλληλα παρέχουν στους χρήστες τους τα κατάλληλα εφόδια για την αναζήτηση των ευρετηρίων αυτών.

Οι περισσότερες μηχανές αναζήτησης τυπικά παρέχουν τη δυνατότητα να ψάξουμε τα περιεχόμενά τους βάση λέξεων κλειδιών, που εισάγει ο χρήστης σε μια φόρμα αναζήτησης. Εισάγοντας μια λέξη ή μια φράση στη μηχανή αναζήτησης, αυτή ανευρίσκει σε ποιες σελίδες εμφανίζεται η συγκεκριμένη λέξη ή φράση και τις παρουσιάζει. Ωστόσο οι πληροφορίες που είναι διαθέσιμες στο διαδίκτυο δεν περιορίζονται μόνο σε κείμενα αλλά περιέχονται και σε πολλά άλλα μέσα, (π.χ. μουσική & ήχοι, φωτογραφίες, βίντεο, τρισδιάστατα μοντέλα κλπ.) στα οποία η αναζήτηση βάση κάποιας λέξης κλειδί, δεν είναι εφαρμόσιμη εξ αρχής. Για τις περιπτώσεις αυτές υπάρχουν μηχανές αναζήτησης οι οποίες είναι προσανατολισμένες στην αναζήτηση ειδικών μορφών δεδομένων, όπως είναι οι εικόνες, η μουσική κλπ. Μέχρι και σήμερα, οι περισσότερες από αυτές τις ειδικές μηχανές αναζήτησης εκμεταλλεύονται το γεγονός πως τέτοιου είδους δεδομένα συνοδεύονται από έγγραφη περιγραφή, είτε ενσωματωμένη μέσα στο ίδιο το αρχείο, είτε προσαρμοσμένη στο όνομα του αρχείου, είτε προσαρμοσμένη στην ιστοσελίδα που φιλοξενεί τα δεδομένα αυτά. Αυτή η μέθοδο αναζήτησης όμως δεν είναι αρκετά αποτελεσματική, διότι το περιεχόμενο της έγγραφης λεκτικής περιγραφής που συνοδεύει μια μη λεκτική μορφή πληροφορίας βασίζεται στον ανθρώπινο παράγοντα. Αυτό συνεπάγεται πως εάν τα μη λεκτικά δεδομένα συνοδεύονται από μια λανθασμένη περιγραφή, τότε αυτά δε πρόκειται να εμφανιστούν ποτέ σε μια ενδεχόμενη αναζήτησή τους στο διαδίκτυο. Για να χαρακτηριστεί μια μηχανή αναζήτησης αποτελεσματική στην αναζήτηση μη λεκτικών μορφών δεδομένων, όπως εικόνες ή ήχους κλπ., θα πρέπει να είναι εφοδιασμένη με μηχανισμούς οι οποίοι θα την καθιστούν ικανή να ερευνά βασιζόμενη σε μη λεκτικά στοιχεία, από το περιεχόμενο της ίδιας της πληροφορίας και όχι κάποιας έγγραφης συνοδευτικής περιγραφής. Τέτοιες έξυπνες μηχανές αναζήτησης θα είναι δυνατόν να βρουν ένα μουσικό κομμάτι βάση κάποιου σκοπού που θα σφυρίξουμε στο μικρόφωνο του Η/Υ μας.

Το πρόβλημα που εμφανίζεται στην υλοποίηση μιας τόσο έξυπνης μηχανής αναζήτησης, είναι η χρονοβόρα και απαιτητική, τόσο σε μνήμη και επεξεργαστική ισχύ, όσο και σε εύρος δικτύου, αποκωδικοποίηση και αναγνώριση της δυσνόητης ακολουθίας ψηφιακών στοιχείων (bits) από τα οποία αποτελείται η ψηφιακή πληροφορία. Ο μηχανισμός μέσω του οποίου θα γίνει εφικτή η αναζήτηση μη λεκτικών ψηφιακών δεδομένων βάση του περιεχόμενού τους, είναι μέσω της ψηφιακής περιγραφής τους βάση κάποιων κανόνων θεσπιζόμενοι από κάποιο κοινό πρότυπο. Αυτό το πρότυπο έχει ήδη δημιουργηθεί, είναι το MPEG-7 το οποίο υποδεικνύει τα εργαλεία περιγραφής των ψηφιακών δεδομένων, τους βασικούς ψηφιακούς περιγραφείς (Digital Descriptors) και τον τρόπο με τον οποίο αποθηκεύεται η παραγόμενη από τους ψηφιακούς περιγραφείς πληροφορία.

Δημοσκοπήσεις

Ποία είναι η κλίμακα μεγέθους των θεμάτων που επιθυμείτε να ψηφιοποιήσετε;

Αποτελέσματα

Online χρήστες

Έχουμε 10 επισκέπτες σε σύνδεση
Powered by Elxis - Open Source CMS.
Copyright (C) 2006-2019 Elxis.org. All rights reserved.