Περιεχόμενα

Αρχική Σελίδα


Περιεχόμενα

 1. Εισαγωγή
  1. Η εποχή πριν το διαδίκτυο
  2. Η εποχή του διαδικτύου
  3. Σημαντικά Θέματα Ανάκτησης Πληροφοριών
  4. Ανάκτηση Ελληνικών κειμένων
  5. Αναφορές
 2. Προεπεξεργασία Κειμένων
  1. Αρχιτεκτονική Συστημάτων Ανάκτησης
  2. Διάβασμα Κειμένων
  3. Συγκέντρωση Περιεχομένου, Ιχνηλάτες
  4. Αναγνώριση Λεξικών Μονάδων
  5. Ανίχνευση Λεξικών ομάδων
  6. Αποκοπή Καταλήξεων (Stemming)
  7. Μεταδεδομένα (Metadata)
  8. Ασκήσεις
 3. Στατιστική Ανάλυση Λέξεων
  1. Στατιστικά Στοιχεία των Λέξεων
  2. Νόμος του Zipf
  3. Αύξηση του Λεξιλογίου
  4. Παράδειγμα
  5. Πλήθος απαντήσεων μιας μηχ. αναζήτησης
  6. Ασκήσεις
  7. Επιλογή Όρων
  8. Σήμα και Θόρυβος
  9. Τιμή Διακριτικότητας
  10. Αντίστροφη Συχνότητα Κειμένων
 4. Ανεστραμμένα Αρχεία
  1. Αλγόριθμος Αναστροφής αρχείου
  2. Συμπίεση Αρχείων
  3. Ασκήσεις
 5. Λογικό Μοντέλο Ανάκτησης
  1. Γενίκευση Λογικού Μοντέλου
  2. Λογικοί Τελεστές
 6. Μοντέλο Διανυσματικού Χώρου
  1. Θεωρεία Μοντέλου Διανυσματικού Χώρου
  2. Γενίκευση Μοντέλου Διανυσματικού Χώρου
  3. Ασκήσεις
 7. Πιθανοτικό Μοντέλο Ανάκτησης
  1. Ανάδραση Συνάφειας
  2. Ασκήσεις
 8. Ανάδραση Συνάφειας
  1. Αλγόριθμοι Τοπικής Ανάλυσης
  2. Αλγόριθμοι Καθολικής Ανάλυσης
  3. Διεύρυνση Ερωτήματος
  4. Οντολογίες
  5. Αρχεία Ερωτημάτων (Query Logs)
  6. Αξιολόγηση
 9. Ανάκτηση με πολλαπλά πεδία
  1. Ανάκτηση με βάση τα πεδία του κειμένου
  2. Συνδυασμός διαφορετικών πεδίων
  3. Ανάκτηση με Πολλαπλά Πεδία
  4. Ασκήσεις
 10. Αξιολόγηση Συστημάτων Ανάκτησης
  1. Απόκριση και Ακρίβεια
  2. Μέτρα Αξιολόγησης
  3. Παράδειγμα
  4. Υποκειμενικά Μέτρα Αξιολόγησης
  5. Πειράματα Αξιολόγησης
  6. Ασκήσεις
 11. Λανθάνουσα Σημασιολογική Ευρετηρίαση
  1. Στοιχεία Γραμμικής Άλγεβρας
  2. Προσέγγιση Χαμηλής Τάξεως
  3. Παράδειγμα LSI
  4. Ενημέρωση της Βάσης με Αναδίπλωση
  5. Ενημέρωση της Βάσης LSI
  6. Ασκήσεις
 12. Ανάκτηση από το Web
  1. PageRank
 13. Ορολογία

Labs

 1. Parsing XML documents
 2. Crawling the Web
 3. Tokenization
 4. Stemming
 5. Word Statistics
 6. The Lucene search engine
 7. Construct term x document matrix
 8. Latent Semantic Indexing
 9. PageRank
 10. Text Classification