Il
n'est
pas
évident
de
présenter
des
résultats
quantifiables,
étant
donné
que
le
jeu
de
formes
ne
peut
pas
représenter
entièrement
toutes
les
formes
disponibles,
néanmoins
une
petite
base
a
été
étiquetée
manuellement
pour
évaluer
cette
modélisation.
Les
tableaux
ci-dessous
contiennent
les
matrices
de
covariance
respectivement
du
français
et
du
japonais.
La
première
colonne
contient
les
labels
étiquetés
manuellement
et
la
première
ligne
les
labels
qui
sont
trouvés
par
la
modélisation
automatique.
ST | BU | TR | DWlo | DWmi | DWhi | UPlo | UPmi | UPhi | UPen | |
ST | 5 | 1 | 1 | 1 | 0 | 0 | 1 | 0 | 0 | 0 |
BU | 2 | 4 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
TR | 0 | 0 | 12 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
DWlo | 1 | 0 | 0 | 24 | 0 | 0 | 0 | 0 | 0 | 0 |
DWmi | 0 | 2 | 1 | 0 | 7 | 0 | 0 | 0 | 0 | 0 |
DWhi | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 1 |
UPlo | 0 | 0 | 0 | 0 | 0 | 0 | 10 | 0 | 0 | 0 |
UPmi | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 9 | 0 | 0 |
UPhi | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 4 | 0 |
UPen | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 6 |
ST | BU | TR | DWlo | DWmi | DWhi | UPlo | UPmi | UPhi | UPen | |
ST | 8 | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 1 |
BU | 0 | 10 | 2 | 1 | 0 | 0 | 0 | 0 | 0 | 1 |
TR | 1 | 1 | 6 | 2 | 0 | 0 | 0 | 0 | 0 | 0 |
DWlo | 0 | 0 | 1 | 22 | 0 | 0 | 0 | 0 | 0 | 0 |
DWmi | 0 | 1 | 0 | 0 | 12 | 0 | 0 | 0 | 0 | 0 |
DWhi | 0 | 0 | 0 | 0 | 0 | 3 | 0 | 0 | 0 | 0 |
UPlo | 2 | 0 | 1 | 0 | 0 | 0 | 7 | 0 | 0 | 0 |
UPmi | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 0 |
UPhi | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
UPen | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 4 |
Les résultats ne sont pas parfaits, ce qui est attendu : le nombre de formes modélisées est réduit et ne peut pas rendre compte de toutes les formes existantes (en particulier les formes présentant une succession de plus de trois formes montantes et descendantes).
Il faut aussi noter que les erreurs d'extraction de la fréquence fondamentale (en particulier les erreurs d'harmoniques) entrainent une mauvaise modélisation des unités prosodiques. Dans un premier temps nous avons modélisé deux formes supplémentaires pour rendre compte de ces formes (``WAup'' et ``WAdw'' pour waste up et down), mais elles ont été supprimées car elles n'apportaient aucune information sur la prosodie de la phrase, mais une information sur la difficulté d'extraire la fréquence fondamentale sur des signaux très bruités.
Dans l'ensemble la modélisation est de bonne qualité et caractérise bien la courbe prosodique. Il est d'ailleurs surprenant de constater que la modélisation se comporte très bien dans certains cas limites : lorsqu'une forme présente un contour relativement accidenté, le MMC choisit l'unité prosodique la plus proche de la dynamique générale du motif. Certaines erreurs provoqués par l'extraction de la fréquence fondamentale sont alors rectifiées.