Η διδακτέα ύλη περιλαμβάνει: Επίπεδα Γλωσσικής Ανάλυσης, Κώδικες, Απόσταση Levenshtein, Βέλτιστο Μονοπάτι στον Πίνακα Levenshtein, Πολλαπλά Μονοπάτια στον Πίνακα Levenshtein, Κανονικές Εκφράσεις (Regular Expressions), Αυτόματα Πεπερασμένων Καταστάσεων (FSA), Αντιστοίχιση Κανονικών Εκφράσεων με FSA, Είδη FSA: Κυκλικά, Ακυκλικά, Αιτιοκρατικά, Μαθηματικός Ορισμός Αυτομάτων, Επεκτάσεις FSA: Δίδυμα, Παράλληλα, Μετατροπείς, Εφαρμογές Αυτομάτων, Μορφολογική Ανάλυση, Το Μορφολογικό Μοντέλο Kay-Kaplan, Το Μορφολογικό Μοντέλο Δύο Επιπέδων, Τυπικές Γλώσσες και Γραμματικές, Η Ιεραρχία Chomsky, Κανονική Μορφή κατά Chomsky (CNF), Ο Αλγόριθμος CKY, Λογάριθμοι και Logprob, Πιθανοτικές Γραμματικές Τύπου 2, Κατηγορίες Σωμάτων Κειμένων, Μετατροπή PCFG σε CNF, Πιθανοτικός CKY, Μοντέλα Γλώσσας, Πίνακας Εμφανίσεων Διγραμμάτων, Πίνακας Πιθανοτήτων Διγραμμάτων, Εξομάλυνση κατά Laplace (Laplace Smoothing), Backoff (Οπισθοχώρηση), Interpolation (Παρεμβολή), Πίνακας Εμφανίσεων Τριγραμμάτων, Αρχεία Γλωσσικών Μοντέλων, Ορθογραφική Διόρθωση με Μοντέλο Γλώσσας, Εντροπία και Περιπλοκή, Κατηγοριοποίηση Κειμένων με Συμπίεση, WordNet. Μοντελοποίηση του μηχανισμού παραγωγής ομιλίας: Μηχανισμός παραγωγής ομιλίας, Ήχοι ομιλίας, Μοντέλο παραγωγής ομιλίας. Ψηφιακή προεπεξεργασία σήματος ομιλίας: Επιλογή της συχνότητας δειγματοληψίας, Ψηφιοποίηση, Βραχύχρονη ανάλυση σήματος ομιλίας, Επιλογή μήκους πλαισίου, Προέμφαση, Επιλογή φίλτρου "παραθύρου", Ρυθμός μετακίνησης πλαισίων. Ακουστικές παράμετροι: Ενέργεια, Μηδενικές διελεύσεις, Θεμελιώδης συχνότητα, Μέθοδοι υπολογισμού τονικότητας, Φασματογράφημα, Συντονισμοί φωνητικού καναλιού (Formants), Συντελεστές γραμμικής πρόγνωσης (LPC), Τράπεζα φίλτρων, Συντελεστές ανάκλασης, Cepstral Συντελεστές. Τεχνικές επεξεργασίας ομιλίας: Ταίριασμα ακουστικών προτύπων, Παραμόρφωση δυναμικού χρόνου (DTW), Κβαντισμός διανυσμάτων, Ο k-means αλγόριθμος, VQ Codebook με ανάμειξη πυκνοτήτων, Μοντελοποίηση με κρυμμένα μοντέλα Markov (HMM), Forward-backward αλγόριθμος, Viterbi αλγόριθμος. Συστήματα αναγνώρισης ομιλίας. Συστήματα αναγνώρισης ομιλητή. Σύνθεση ομιλίας: Βασικές αρχές, Μέγεθος μονάδων, Τύποι μονάδων, Μέθοδοι σύνθεσης, Συστήματα περιορισμένου-απεριορίστου λεξιλογίου. Σύνθεση άρθρωσης, Σύνθεση με Formants, LPC σύνθεση, Μοντελοποίηση της πηγής διέγερσης, Μοντέλα προσωδίας-επιτονισμού, Εκτίμηση του LPC μοντέλου με διαδικασία δείγματος-δείγματος, Μοντελοποίηση του σήματος ομιλίας με πόλους και μηδενικά, Μέθοδοι υπολογισμού των παραμέτρων του μοντέλου ARMA, Προβλήματα του μοντέλου ARMA. Ψηφιακές τεχνικές αφαίρεσης θορύβου. Κωδικοποίηση ομιλίας: Τεχνικές για την κωδικοποίηση της κυματομορφής ομιλίας (πεδίο χρόνου), Κωδικοποίηση με χρήση του φάσματος ομιλίας (πεδίο συχνότητας), Τεχνικές κωδικοποίησης με τη χρήση ανάλυσης-σύνθεσης (πεδίο συχνότητας), Κωδικοποίηση γραμμικής πρόβλεψης.
|