ΕΡΜΗΣ: Ένα Σύστημα Ανάκτησης πληροφορίας για τα νέα ελληνικά.

Σκοπός του προγράμματος αυτού ήταν η ανάπτυξη ενός συστήματος Ανάκτησης Πληροφορίας για τα νέα ελληνικά, βασισμένο στο μοντέλο του Διανυσματικού Χώρου. Με το τέλος του προγράμματος έγινε μια συστηματική στατιστική ανάλυση της επίδρασης των αλγορίθμων αποκοπής των καταλήξεων στην επίδοση της ανάκτησης. Τα νέα ελληνικά είναι μία γλώσσα πλούσια σε κλιτικές και παραγωγικές καταλήξεις και τα αποτελέσματα που προκύπτουν από την ανάκτηση αγγλικών κειμένων δεν ισχύουν σε αυτήν.

Τρέχουσα έρευνα στο πρόγραμμα αυτό, για την περαιτέρω βελτίωση της επίδοσης του συστήματος, περιλαμβάνει την ανάπτυξη ενός αλγόριθμου ομαδοποίησης (sub clustering) των λέξεων μετά την αποκοπή των καταλήξεων, βασιζόμενη στις συσχετίσεις μεταξύ των λέξεων που υπολογίζονται μετά από στατιστική ανάλυση της συλλογής των κειμένων.

Το πρόγραμμα αυτό χρηματοδοτήθηκε από το Οικονομικό Πανεπιστήμιο Αθηνών.