Un système classique d'IAL, utilisant des indices acoustiques et phonotactiques [Yan et Barnard 95], peut se décomposer en trois parties distinctes :
La première partie consiste à extraire du signal des paramètres caractéristiques.
Une transformation numérique/symbolique est ensuite effectuée au cours de l'étape de reconnaissance phonétique. Des techniques de classification de type Quantification Vectorielle [Pellegrino et Obrecht 97b] où une modélisation de type markovienne peuvent être utilisées à cette étape.
La suite des symboles phonétiques est ensuite décodée à l'aide d'un modèle de langage et fournit également un score de vraisemblance. Les séquences de symboles sont alors modélisées. Dans un système d'IAL, il y a en général autant de modèles de langage que de langues à identifier, alors qu'au niveau du décodage phonétique, les approches peuvent être très variées (emploi d'un décodeur unique, d'un décodeur par langue...).
Nous allons maintenant présenter des systèmes existants qui utilisent des informations prosodiques.