Vers un modèle articulatoire du conduit nasal en 3 dimensions...
Les objectifs
La nasalité est un phénomène complexe, tant du point de vue articulatoire, qu'acoustique ou
aérodynamique. Afin de mieux comprendre ce phénomène et de créer un modèle complet, on décide
dans un premier temps de construire un modèle articulatoire.
Le conduit nasal se décompose en deux parties distinctes:
- Une partie
souple dans la région du nasopharynx (mouvements du nasopharynx et du voile du palais) - Une partie
rigide constituée des deux fosses nasales et des narines. On y assimile également une partie des cavités résonnates supplémentaires (c'est à dire certains sinus)
|
La complexité et la spécificité tridimensionnelle des différents organes sont illustrées sur les images suivantes. On voit par exemple la complexité des fosses nasales ainsi que la forme du voile du palais qui peut créer un occlusion du conduit nasal dans le plan médio-sagittal mais laisser passer l'air latéralement:
|
Vue coronale des fosses nasales |
|
|
| Vues antérieure et médio-sagittale du voile du palais | |
Le modèle choisi aura donc les caractéristiques suivantes:
Modèle d'organes : chaque organe constitutif des conduits vocal et nasal sera modélisé indépendamment puis rassemblés à la fin pour former un modèle complet.Modèle tridimensionnel : pour prendre en compte les spécificités spatiales des organes et y construire un modèle acoustique.Modèle articulatoire géométrique : on modélise la forme de chaque organe en se basant sur des données réelles extraites d'images IRM et CT.Modèle linéaire : la géométrie des organes sera modélisée par la somme d'un petit nombre de composants linéaires indépendants. Ces composants seront extraits par analyse linéaire (Analyse en Composante Principale et Régression linéaire) sur une base de donnée de formes des différents organes représentative de la parole.Modèle monosujet : le modèle sera construit sur des données extraites d'un unique locuteur français.- Le
corpus utilisé est constitué de 46 phonèmes de voyelles, consonnes, orales et nasales du français
Le modèle sera donc réalisé en deux étapes:
- Construction de la base de donnée des 46 formes de chaque organe
- Analyse linéaire de ces formes tridimensionnelles et construction du modèle proprement dit
Les données
Le modèle articulatoire est basé sur deux séries d'images extraites du même locutaire:
- Une pile de 149 images axiales
CT , d'une taille de 512x512 chacune, d'une résolution de 20 pixels/cm, qui s'étendent du cou à la boîte cranienne et enregistrées dans une position de repos du locuteur. Ces images permettent la distinction entre les os, l'air et les tissus mous, mais ne permettent pas de discriminer ces derniers entre eux. Cette pile sera utilisée pour extraire les formes des structures osseuses. - 46 piles de 25 images sagittales
IRM , pour chaque phonème, d'une taille de 256x256 chacune, d'une résolution de 10 pixels/cm et qui s'étendent sur la largeur du conduit vocal. Ces images permettent la distinction entre les tissus mous d'une part et les structures osseuses et l'air d'autre part, permettent de discriminer les tissus mous entre eux, mais ne permettent pas de distinguer les structures osseuses de l'air.
|
| ||
| Image CT | Image IRM médio-sagittale pour la voyelle [a] |
Pour exploiter plus complètement ces données, les piles d'images on été recoupées en images perpendiculaires aux piles déjà présentes:
- En 2 piles d'images sagittales et coronales pour les images CT
- En images perpendiculaires au conduit vocal suivant une grille définie ci-dessous pour chacune des 46 piles d'images IRM.
|
|
| Image axiale CT originale | |
|
|
| Image coronale CT reconstruite | Image sagittale CT reconstruite |
|
|
| Image IRM originale (voyelle [a]) - Grille de recoupe | Image IRM prependiculaire reconstruite |
Extraction des surfaces 3D
L'objectif est de construire un ensemble de 46 formes d'organes sur lesquelles effectuer une analyse statistique. Deux types d'organes sont donc à considérer:
- Les organes
rigides (fosses nasales, machoîre, palais dur, os hyoide, etc.) dont la forme ne change pas par définition. Ils sont donc extrait une seule fois, à partir des images CT. - Les organes
mous (voile du palais, langue, pharynx, etc.) dont on cherche à modéliser la forme. On doit construire pour chacun de ces organes un ensemble de 46 formes à partir des images IRM.
La procédure détaillée d'extraction des formes tridimensionnelle est la suivante:
- Extraction manuelle, plan par plan, sur les images CT des structures osseuses.
Exemple pour la machoîre:
- Empilement en cm de ces structures osseuses pour obtenir la forme 3D des organes.
Exemple pour la machoîre:
- Maillage des contours 3D pour obtenir une surface 3D (en format VRML2) de chaque organe
rigide. Ce maillage est obtenu grâce au
Service de Reconstruction 3D
développé par l'équipe du Projet GEOMETRICA
de l'INRIA. Quelques exemples:
Machoîre
Fosses nasales
Os hyoide
- Alignement de toutes les piles d'images dans un repère commun pour pouvoir fusionner
les données extraites de ces différentes piles. Cette opération est réalisée de manière
semi-automatique en définissant manuellement une fonction d'erreur de distance à minimiser
de manière automatique par le fonction fminunc (minimisation sans contrainte) de MATLAB.
- Superposition des contours osseux extraits des images CT sur les images IRM
pour augmenter l'information disponible sur l'image IRM (les os ne sont pas visibles sur
les IRM). On recoupe donc les maillages VRML des contours osseux dans les plans des IRM.
Quelques exemples:
- Extraction manuelle des contours mous sur toutes les images IRM et pour tous les phonèmes
comme au point 1. Quelques exemples pour le voile du palais pour l'articulation [a]:
Edition du voile du palais dans le plan médio-sagittal Edition du voile du palais dans un plan perpendiculaire
- Empilement en cm des contours extraits pour chacune des 46 articulations pour
chaque organe. Quelques exemples pour le voile du palais pour l'articulation [a]:
- Création d'un maillage générique pour chaque organe mou: en vue de faire
une étude statistique, on travaille sur une unique surface maillée (au format VRML2)
pour chaque organe, que l'on déforme vers chacune des 46 cibles obtenues à l'étape 7.
Ce maillage générique est issu d'une des 46 configurations et maillée grace au
Service de Reconstruction 3D
de l'INRIA. Voici l'exemple du maillage générique du voile du palais (issu de la
configuration [an]):
En construction...
- Déformation des maillages génériques vers chacune des 46 cibles pour
chaque organe grâce au logiciel TestRigid développé au laboratoire
TIMC à Grenoble. Quelques exemples
de déformation du maillage générique du voile du palais:
En construction...
Quelques résulats...
En attachant le repère fixe 3D sur la boîte cranienne, un certain nombre d'organes restent
fixes et ne nesessient donc aucune analyse statistique: fosses nasales, sinus, palais dur, etc.
En revanche, les autres nécessitent une analyse statistique (langue, voile du palais, machoîre,
etc.). Pour extraire les paramètres de commande de ces organes, on effectue une Analyse
en Composante Principale sur tous les points du maillage générique déformé dans les 46
configurations possibles.
En construction...