Ιστορική Ανασκόπιση


Ο όρος ανάκτηση πληροφορίας αναφέρεται στην προσπέλαση πληροφορίας σε ένα σύνολο αδόμητων ή ημιαδόμητων εγγράφων τα οποία συνήθως είναι κείμενα σε φυσική γλώσσα. Τέτοια σύνολα εγγράφων (documents) αναφέρονται ως συλλογές (collections, corpuses, archives). Η ιδέα της αυτόματης ανάκτησης πληροφορίας ξεκίνησε το 1945, με το ιστορικό άρθρο “As We May Think” του αμερικανού μηχανικού και προέδρου της Εθνικής Επιτροπής Αμυντικής Έρευνας των ΗΠΑ (National Defence Research Committee) Vannevar Bush's [1]. Για το λόγο αυτό ο V. Bush θεωρείται από πολλούς ως ο πατέρας της σημερινής εποχής του διαδικτύου αν και πέθανε το 1975 πριν την δημιουργία του World Wide Web.

bush


Ο Bush στο άρθρο του περιέγραψε μια θεωρητική μηχανή με το όνομα memex, η οποία επέτρεπε στον χρήστη να αποθηκεύει και να ανακτά κείμενα τα οποία μπορεί να συνδέονται μεταξύ τους με κάποια σχέση (trails). Τα κείμενα αυτά με τους συνδέσμους αργότερα έγιναν γνωστά ως υπερκείμενα (hypertext). Το memex περιγράφτηκε ως ένα γραφείο-μηχανή το οποίο θα μπορούσε να αποθηκεύσει εκατομμύρια από βιβλία, εφημερίδες και περιοδικά μεταξύ των οποίων υπάρχουν σύνδεσμοι που συνδέουν σχετικά μεταξύ τους αντικείμενα. Επιπλέον ο Bush οραματίστηκε ένα ζευγάρι γυαλιά με ενσωματωμένη κάμερα τα οποία θα μπορούσαν να φωτογραφήσουν τα πάντα αλλά και ένα μικρόφωνο το οποίο θα κατέγραφε όλες τις συνομιλίες. Ήταν δηλαδή το memex μια πολυμεσική μηχανή. Στη μηχανή αυτή θα μπορούσε ο χρήστης να προσπελάσει στη πληροφορία είτε ακολουθιακά είτε ακολουθώντας τους συνδέσμους. Τέλος η μηχανή θα μπορούσε να καταλάβει εντολές σε φυσική γλώσσα και να εκτυπώσει μια ομιλία. Πολλές από τις προκλήσεις που οραματίστηκε ο Bush σήμερα έχουν σε μεγάλο βαθμό πραγματοποιηθεί, όπως για παράδειγμα, η αναγνώριση φωνής (speech recognition) και η αυτόματη ανάγνωση κειμένων (OCR, Optical Character Reader).