Μεταδεδομένα (Metadata)


Τα μεταδεδομένα είναι δομημένη πληροφορία που περιγράφει, εξηγεί, εντοπίζει ή κάνει ευκολότερη την ανάκτηση και διαχείριση πληροφορίας. Με άλλα λόγια είναι δεδομένα που περιγράφουν άλλα δεδομένα. Παραδοσιακά τα μεταδεδομένα χρησιμοποιήθηκαν στις βιβλιοθήκες για την αυστηρή περιγραφή των βιβλιογραφικών εγγραφών, όπως για παράδειγμα η καταλογράφηση ΜΑRK 21. Τα μεταδεδομένα διακρίνονται σε: Τα μεταδεδομένα μπορεί να περιγράφουν μια ολόκληρη συλλογή ή ένα απλό αντικείμενο ή ένα επιμέρους τμήμα του και ενσωματώνονται με τα δεδομένα ή αποθηκεύονται σε ξεχωριστό αρχείο. Συνήθως ενσωματώνονται σε HTML κείμενα ή τις επικεφαλίδες (headers) αρχείων εικόνων. Ωστόσο πολλές φορές δεν είναι δυνατή η αποθήκευση των μεταδεδομένων στο ίδιο αρχείο αν και ενδεχομένως είναι ευκολότερη η ενημέρωση και ανάκτησή τους. Συνήθως, τα μεταδεδομένα συνήθως αποθηκεύονται σε βάσεις δεδομένων και συνδέονται με τα αντικείμενα που περιγράφουν. Στη συνέχεια θα δούμε σε τι μας βοηθούν τα μεταδεδομένα.

Ανακάλυψη σχετικής πληροφορίας

Τα περιγραφικά μεταδεδομένα διευκολύνουν στην ανακάλυψη σχετικής πληροφορίας. Τα μεταδεδομένα προσφέρουν τις ίδιες λειτουργίες στην αναζήτηση αντικειμένων όπως η καταλογράφηση των αντικειμένων: Επιπλέον τα μεταδεδομένα μπορούν να βοηθήσουν στην οργάνωση περιεχομένου την διαλειτουργικότητα (interoperability).

Οργάνωση πηγών

Καθώς το μέγεθος του web μεγαλώνει εκθετικά, δημιουργούνται portals (π.χ. Yahoo!) για την οργάνωση των πηγών πληροφορίας με συνδέσμους. Τέτοιες λίστες με ονόματα και διεύθυνση μπορεί να είναι στατικές HTML λίστες. Ωστόσο, είναι πολύ πιο αποτελεσματικό να δημιουργούνται τέτοιες λίστες από σελίδες δυναμικά με μεταδεδομένα και να αποθηκεύονται σε βάσεις δεδομένων.

Διαλειτουργικότητα

Η περιγραφή ενός αντικειμένου με μεταδεδομένα επιτρέπει να είναι κατανοητό και από τους ανθρώπους και μια μηχανή, έτσι βοηθά στη διαλειτουργικότητα. Διαλειτουργικότητα είναι η ικανότητα διαφορετικά συστήματα με διαφορετικό υλικό και λογισμικό, δομές δεδομένων και διεπαφές να αλλάζουν δεδομένα με ελάχιστο κόστος περιεχομένου και λειτουργικότητας. Χρησιμοποιώντας γνωστά σχήματα μεταδεδομένων, κοινά πρωτόκολλα επικοινωνίας μεταξύ συστημάτων, και τρόπους επικοινωνίας μεταξύ των σχημάτων μεταδεδομένων, μπορούμε να επικοινωνήσουμε και να αναζητήσουμε σε ένα δίκτυο τα έγγραφα που ζητάμε. Το πρωτόκολλο Z39.50 είναι το πλέον συνηθισμένο για αναζήτηση μεταξύ συστημάτων. Οι χρήστες του Z39.50 μπορεί να μην έχουν κοινά μεταδεδομένα αλλά απεικονίζουν τις δικές τους δυνατότητες αναζήτησης σε ένα κοινό σύνολο ιδιοτήτων αναζήτησης. Μια άλλη προσέγγιση από την πρωτοβουλία των ανοιχτών αρχείων (Open Archives) είναι για όλους τους παρόχους δεδομένων να μεταφράζουν τα δικά τους μεταδεδομένα σε ένα κοινό σύνολο στοιχείων και έτσι να τα εκθέσουν για χρήση. Μια υπηρεσία αναζήτησης τότε μπορεί να συγκεντρώσει τα μεταδεδομένα σε ένα κεντρικό ευρετήριο επιτυγχάνοντας έτσι αναζήτηση μεταξύ βάσεων δεδομένων παρόλο που μπορεί να έχουν διαφορετικά σύνολα μεταδεδομένων.

Ηλεκτρονική Αναγνώριση Αντικειμένων (Digital Identification)

Τα περισσότερα σχήματα μεταδεδομένων περιλαμβάνουν στοιχεία όπως αριθμούς για να αναγνωρίσουν μοναδικά το αντικείμενο στο οποίο αναφέρονται τα μεταδεδομένα. Η θέση ενός ηλεκτρονικού εγγράφου μπορεί επίσης να δοθεί με ένα όνομα αρχείου (file name), ή URL (Uniform Resource Locator), ή κάποιο περισσότερο σταθερό αναγνωριστή PURL (Persistent URL). Οι σταθεροί αναγνωριστές προτιμώνται επειδή συχνά η θέση των αντικειμένων αλλάζει το οποίο καθιστά τα URL άκυρα. Επιπρόσθετα με τα πραγματικά στοιχεία που δείχνουν στο αντικείμενο, τα μεταδεδομένα μπορεί να συνδυαστούν και να χρησιμοποιηθούν για να εντοπιστούν τα δεδομένα.

Αρχειοθέτηση (Archiving) και Συντήρηση (Preservation)

Τα μεταδεδομένα μπορεί να εξασφαλίσουν ότι τα έγγραφα αυτά θα επιζήσουν στο μέλλον και θα είναι προσπελάσιμα. Οι περισσότερες τρέχουσες προσπάθειες μεταδεδομένων επικεντρώνονται στην αναζήτηση εγγράφων που έχουν δημιουργηθεί πρόσφατα. Πρόσφατα υπάρχει αυξανόμενο ενδιαφέρον για το λόγο ότι τα ηλεκτρονικά έγγραφα ενδέχεται να μη διαρκέσουν επί πολύ στο μέλλον. Η ηλεκτρονική πληροφορία είναι εύθραυστη, μπορεί να αλλοιωθεί ή να αλλάξει, για διάφορους λόγους. Μπορεί να είναι άχρηστη με την ανακάλυψη νέων τεχνολογιών αποθήκευσης ή την αλλαγή μορφοτύπων. Η αρχειοθέτηση και η διατήρηση των εγγράφων απαιτεί ειδικά στοιχεία ώστε να κρατηθούν όλες οι αλλαγές ενός ηλεκτρονικού εγγράφου από τη στιγμή που δημιουργήθηκε.

Δημιουργία Μεταδεδομένων

Ένα σχήμα μεταδεδομένων (Metadata schemes) σχεδιάζεται για ένα ειδικό σκοπό, όπως είναι η περιγραφή μιας συγκεκριμένου τύπου πηγής πληροφορίας. Οι ορισμοί των στοιχείων αποτελούν τη σημασιολογία (semantics) του σχήματος. Οι τιμές που παίρνουν τα μεταδεδομένα είναι ουσιαστικά το περιεχόμενο. Τα σχήματα μεταδεδομένων γενικά καθορίζουν τα ονόματα των στοιχείων και τα semantics τους. Τα στοιχεία αυτά κωδικοποιούνται σε SGML (Standard Generalized Mark-up Language) ή XML (Extensible Mark-up Language). Tα πλέον δημοφιλή σχήματα μεταδεδομένων είναι το Dublin Core και το ΤΕΙ τα οποία πολύ συνοπτικά περιγράφουμε στη συνέχεια.

Dublin Core

Το σύνολο μεταδεδομένων γνωστό ως Dublin core, (Dublin Core Metadata Εlement Set) προέκυψε από συζητήσεις το 1995 στο συνέδριο OCLC/NCSA Metadata Workshop οργάνωσαν η OCLC (Online Computer Library Center) και η NCSA το National Center for Supercomputing Applications. Επειδή το workshop έγινε στη πόλη Dublin, του Ohio, το το σύνολο των μεταδεδομένων (element set) ονομάστηκε Dublin Core. Αρχικός σκοπός της πρωτοβουλίας αυτής ήταν να οριστεί ένα σύνολο από στοιχεία τα οποία θα μπορούσαν να χρησιμοποιηθούν από τους συγγραφείς για να περιγράψουν τα έγγραφά τους στο Web. Επειδή όμως δεν είναι εύκολο να περιγράψει κανείς ότι δημοσιεύεται στο web, σκοπός ήταν να οριστούν τα ελάχιστα στοιχεία και κάποιοι απλοί κανόνες που θα μπορούσαν να χρησιμοποιηθούν από τους χρήστες οι οποίοι τις περισσότερες φορές δεν είναι ειδικοί. Έτσι δημιουργήθηκε ένα μικρό σύνολο από 15 στοιχεία μεταδεδομένων τα οποία δίδονται στον πίνακα 2-5.
metadata
Πίνακας 5. Τα στοιχεία του απλού συνόλου Dublin Core

Το Dublin Core δημιουργήθηκε για να είναι απλό και σύντομο να περιγράψει έγγραφα του Web. Ωστόσο, το Dublin Core έχει χρησιμοποιηθεί και σε άλλες εφαρμογές που απαιτούν μεγαλύτερη πολυπλοκότητα. Έτσι έχουμε δύο εκδόσεις του Dublin Core: μια απλή και μια περισσότερο σύνθετη που χρησιμοποιεί προσδιοριστές (Qualifiers) οι οποίοι μπορούν να χρησιμοποιηθούν για να δώσουν πιο συγκεκριμένη τιμή σε ένα στοιχείο. Όλα τα στοιχεία του Dublin Core είναι προαιρετικά και μπορεί να επαναλαμβάνονται πολλές φορές. Τα στοιχεία μπορεί να εμφανίζονται σε οποιαδήποτε σειρά. Ιδιαίτερα σχήματα έχει δώσει το Dublin Core για εφαρμογές εκπαίδευσης, κυβερνητικά έγγραφα (e-government) και βιβλιοθήκες. Λόγω της απλότητάς του το Dublin Core σύνολο μεταδεδομένων χρησιμοποιείται από πολλούς πέραν των βιβλιοθηκονόμων – ερευνητές, σε μουσεία, συλλέκτες μουσικής κά.

The Text Encoding Initiative (TEI)

Η πρωτοβουλία, Text Encoding Initiative είναι ένα διεθνές project το οποίο αναπτύχθηκε με οδηγίες για το πως μπορεί να επισημειωθεί ένα ηλεκτρονικό έγγραφο, όπως για παράδειγμα ένα διήγημα, ένα θεατρικό έργο, ένα ποίημα με σκοπό την υποστήριξη της έρευνας στις ανθρωπιστικές επιστήμες.

Αναφορές

  1. Understanding Metadata, NISO Press, National Information Standards Organization, 2004, http://www.niso.org/publications/press/UnderstandingMetadata.pdf