Παρασκευή, 18 10 2019

Τεχνολογία Ομιλίας (Εργαστήριο)

Γενικά

 
Τεχνολογία Ομιλίας (Εργαστήριο)
 
Κωδικός:  ECE_A9061
Επίπεδο:  Προπτυχιακό
Εξάμηνο:  9ο
eclass:   http://eclass.upatras.gr/courses/EE699/

Περιγραφή

Μοντελοποίηση του μηχανισμού παραγωγής ομιλίας: Μηχανισμός παραγωγής ομιλίας, Ήχοι ομιλίας, Μοντέλο παραγωγής ομιλίας. Ψηφιακή προεπεξεργασία σήματος ομιλίας: Επιλογή της συχνότητας δειγματοληψίας, Ψηφιοποίηση, Βραχύχρονη ανάλυση Υσήματος ομιλίας, Επιλογή μήκους πλαισίου, Προέμφαση, Επιλογή φίλτρου "παραθύρου", Ρυθμός μετακίνησης πλαισίων. Ακουστικές παράμετροι: Ενέργεια, Μηδενικές Διελεύσεις, Θεμελιώδης συχνότητα, Μέθοδοι υπολογισμού τονικότητας, Φασματογράφημα, Συντονισμοί φωνητικού καναλιού (FORMANTS), Συντελεστές γραμμικής πρόγνωσης (LPC), τράπεζα φίλτρων, συντελεστές ανάκλασης, Cepstral Συντελεστές. Τεχνικές Επεξεργασίας ομιλίας: Ταίριασμα ακουστικών προτύπων, Παραμόρφωση δυναμικού χρόνου (DTW), Κβαντισμός Διανυσμάτων, Ο Κ-means αλγόριθμος, VQ Codebook με ανάμειξη πυκνοτήτων, Μοντελοποίηση με κρυμμένα μοντέλα Markov (HMM), Forward-backward αλγόριθμος, Viterbi Αλγόριθμος. Συστήματα αναγνώρισης ομιλίας. Συστήματα Αναγνώρισης Ομιλητή. Σύνθεση ομιλίας: Βασικές Αρχές, Μέγεθος των μονάδων, Τύποι μονάδων, Μέθοδοι Σύνθεσης, Συστήματα περιορισμένου - απεριορίστου λεξιλογίου. Σύνθεση άρθρωσης, Σύνθεση με Formants, LPC Σύνθεση, Μοντελοποίηση της πηγής διέγερσης, Μοντέλα Προσωδίας-Επιτονισμού, Εκτίμηση του LPC μοντέλου με διαδικασία δείγματος-δείγματος, Μοντελοποίηση του σήματος ομιλίας με πόλους και μηδενικά, Μέθοδοι υπολογισμού των παραμέτρων του μοντέλου ARMA, Προβλήματα του μοντέλου ARMA. Ψηφιακές τεχνικές αφαίρεσης θορύβου. Κωδικοποίηση Ομιλίας: Τεχνικές για την κωδικοποίηση της κυματόμορφης ομιλίας (πεδίο χρόνου), Κωδικοποίηση με χρήση του φάσματος ομιλίας (πεδίο συχνότητας), Τεχνικές κωδικοποίησης με τη χρήση ανάλυσης-σύνθεσης (πεδίο συχνότητας), Κωδικοποίηση γραμμικής πρόβλεψης.

 

 

Διδάσκοντες

 
Δερματάς Ευάγγελος
Φακωτάκης Νίκος