Next: Réalisation
d'une
modélisation
automatique
Up: Systèmes
d'IAL
utilisant
la
Previous: Système
de
Li
Itahashi
[Itahashi et Du 95]
utilise
un
système
d'IAL
basé
sur
la
fréquence
fondamentale.
Son
système
est
constitué
de
trois
parties
:
- Extraction
de
F0
et
segmentation
:
la
fréquence
fondamentale
est
extraite
à
l'aide
de
l'algorithme
AMDF
(cf.
section
3.2.2)
et
les
zones
voisées
sont
détectées
à
partir
de
l'énergie
du
signal.
- Approximation
polynômiale
du
contour
F0
:
chaque
intervalle
voisé
est
approximé
par
un
nombre
minimal
de
lignes
(dont
la
valeur
est
obtenue
par
un
algorithme
de
programmation
dynamique),
ce
qui
permet
de
lisser
le
contour
et
réduire
le
taux
d'erreur.
- Analyse
discriminante
:
21
paramètres
statistiques
sont
extraits
de
la
courbe
mélodique
et
de
son
approximation
polynômiale.
La
variance,
le
skewness
et
le
kurtosis
sont
calculés
à
la
fois
à
partir
de
F0,
de
l'energie
E,
des
lignes
polynômiales
ayant
une
pente
positive
et
de
celles
ayant
une
pente
négative.
A
ces
12
paramètres
sont
ajoutés
un
coefficient
de
corrélation
entre
F0
et
E,
le
nombre,
la
moyenne,
la
durée
et
les
fréquences
relatives
de
départ
et
la
moyenne
de
la
pente
des
lignes
positives
et
négatives
de
l'approximation
polynômiale.
Une
Analyse
en
Composantes
Principales
est
ensuite
appliquée
puis
la
classification
est
réalisée
avec
une
analyse
discriminante
Les
résultats
sont
de
78%
environ
pour
cinq
langues
(japonais,
chinois,
coréen,
anglais,
français
et
allemand)
sur
le
corpus
téléphonique
OGI-MLTS,
avec
les
fichiers
de
dialogue
non
contraint
de
20
s.
Jérôme Farinas
Mon Nov 16 16:11:40 MET 1998