Ανάκτηση Ελληνικών Κειμένων


Η ελληνική γλώσσα, όπως και πολλές άλλες μειοψηφικές γλώσσες, δεν έχουν τύχει ανάλογης διερεύνησης όπως η αγγλική και στο θέμα της ανάκτησης πληροφορίας. Η ελληνική είναι μια γλώσσα πλούσια σε κλητικές και παραγωγικές καταλήξεις, σε σχέση με την αγγλική, και έτσι ορισμένα προβλήματα όπως αυτό της αποκοπής καταλήξεων είναι πιο σύνθετη διαδικασία με σημαντική επίδραση στα αποτελέσματα από μια μηχανή αναζήτησης. Για παράδειγμα ενώ στην αγγλική ο πληθυντικός των ουσιαστικών σχηματίζεται με την προσθήκη ενός s στο τέλος της λέξης (εκτός ορισμένες εξαιρέσεις) στην ελληνική υπάρχουν 41 διαφορετικοί τύποι κλητικών καταλήξεων. Ένας άλλος παράγοντας διαφοροποίησης της ελληνικής από άλλες γλώσσες είναι οι μεγάλες αλλαγές που έχει υποστεί με τον χρόνο. Έτσι έχουμε διάφορες μορφές της γλώσσας όπως, τα αρχαία ελληνικά, η καθαρεύουσα και η δημοτική. Έχουμε δύο διαφορετικά συστήματα: πολυτονικό και μονοτονικό. Επιπλέον διάφορες ομάδες ομιλούν κάποια ενδιάμεση γλώσσα μεταξύ της καθαρεύουσας και της δημοτικής, όπως για παράδειγμα είναι τα νομικά κείμενα δικηγόρων, η νομοθεσία, τα κείμενα γιατρών και πολλά άλλα. Τα θέματα αυτά χρίζουν μιας περισσότερο συστηματικής έρευνας ιδιαίτερα τη σημερινή εποχή της παγκοσμιοποίησης.