next up previous contents
Next: Réalisation d'une modélisation automatique Up: Systèmes d'IAL utilisant la Previous: Système de Li

Système de Itahashi

Itahashi [Itahashi et Du 95] utilise un système d'IAL basé sur la fréquence fondamentale. Son système est constitué de trois parties :

  1. Extraction de F0 et segmentation : la fréquence fondamentale est extraite à l'aide de l'algorithme AMDF (cf. section 3.2.2) et les zones voisées sont détectées à partir de l'énergie du signal.
  2. Approximation polynômiale du contour F0 : chaque intervalle voisé est approximé par un nombre minimal de lignes (dont la valeur est obtenue par un algorithme de programmation dynamique), ce qui permet de lisser le contour et réduire le taux d'erreur.
  3. Analyse discriminante : 21 paramètres statistiques sont extraits de la courbe mélodique et de son approximation polynômiale. La variance, le skewness et le kurtosis sont calculés à la fois à partir de F0, de l'energie E, des lignes polynômiales ayant une pente positive et de celles ayant une pente négative. A ces 12 paramètres sont ajoutés un coefficient de corrélation entre F0 et E, le nombre, la moyenne, la durée et les fréquences relatives de départ et la moyenne de la pente des lignes positives et négatives de l'approximation polynômiale. Une Analyse en Composantes Principales est ensuite appliquée puis la classification est réalisée avec une analyse discriminante
Les résultats sont de 78% environ pour cinq langues (japonais, chinois, coréen, anglais, français et allemand) sur le corpus téléphonique OGI-MLTS, avec les fichiers de dialogue non contraint de 20 s.



Jérôme Farinas
Mon Nov 16 16:11:40 MET 1998