Thèse de doctorat de l'Université Paris
6 - Nathalie Henrich (2001)
PhD thesis, University Paris 6 - Nathalie
Henrich (2001)
Etude de la source glottique en voix parlée et
chantée : modélisation et estimation, mesures
acoustiques et électroglottographiques, perception
Study of the glottal source in speech and singing: Modeling and
estimation, acoustic and electroglottographic measurements, perception
Cette thèse est également téléchargeable sur le
serveur TEL (thèses-en-ligne,
serveur de thèses multidisciplinaire).
This PhD thesis can also be downloaded on the TEL
server (Thesis on Line, multidisciplinary theses server).
Résumé
Les relations entre les paramètres de source glottique et la
qualité vocale sont étudiées en voix
parlée et chantée, par étude spectrale
des modèles de signaux, par mesures acoustiques et
électroglottographiques et par détermination des
seuils différentiels.
Les corrélats spectraux de ces paramètres sont
évalués à partir des expressions
analytiques temporelles et spectrales des modèles de
signaux. Une augmentation de l'amplitude de voisement ou de la vitesse
de fermeture entraîne une amplification spectrale globale. Le
quotient ouvert et le coefficient d'asymétrie sont
corrélés à la fréquence et
la largeur de bande du formant glottique, ainsi qu'à
l'amplitude de la pente spectrale. Le quotient de phase de retour
affecte la pente spectrale en haute fréquence. L'estimation
du quotient ouvert à partir de la différence
spectrale entre les deux premiers harmoniques, H1-H2,
est étudiée de façon
théorique et expérimentale. Elle n'est pas
adaptée aux signaux de voix chantée,
où l'interaction entre source et filtre devient importante.
L'utilisation des signaux électroglottographiques
dérivés, qui permettent de détecter
les instants d'ouverture et de fermeture glottique
indépendamment du système supraglottique, est
explorée et des méthodes de mesure de la
fréquence fondamentale et du quotient ouvert sont
proposées. Une base de données a
été constituée, par enregistrement
simultané des signaux acoustiques et
électroglottographiques de 18 chanteurs
entraînés sur des voyelles tenues, des sons
filés ou des phrases parlées et
chantées. Le quotient ouvert est analysé en
fonction de l'intensité vocale et de la fréquence
fondamentale, dans les deux principaux mécanismes
laryngés de production vocale. Il présente des
valeurs plus élevées en mécanisme II (
)
qu'en mécanisme I (
)
et la transition entre mécanismes s'accompagne d'un saut
marqué de quotient ouvert. Il est fortement
corrélé à l'intensité
vocale en mécanisme I et à la
fréquence fondamentale en mécanisme II et
dépend de l'ouverture de la voyelle émise. Les
seuils différentiels associés au quotient ouvert
et au coefficient d'asymétrie sont mesurés. Le
seuil différentiel relatif
est de l'ordre de 14 % pour 20 sujets
non-entraînés et 10 % pour 10 sujets
entraînés. Il ne varie pas lors d'un changement de
voyelle ou de fréquence fondamentale, mais dépend
du paramètre d'amplitude et de la présence ou non
d'un vibrato.
Mots clefs :
voix, source glottique, qualité vocale,
électroglottographie, quotient ouvert, mécanismes
laryngés, synthèse de voix chantée,
perception.
Abstract
The dependence of qualities of the voice on parameters of glottal flow
was
studied in speech and singing, using spectral modelling and estimation,
acoustic and electroglottographic measurements and psychoacoustic
determinations of just noticeable differences (JND).
The effects of glottal flow parameters on the voice signal were studied
in
the time and frequency domains using models of glottal flow. An
increase of the amplitude parameters led to a spectral amplification.
The open quotient and asymmetry coefficient were correlated to the
frequency and bandwith of the glottal formant and the spectral tilt
amplitude. The return phase quotient was correlated to the
high-frequency part of the spectral tilt. Open quotient estimation
using the first two harmonics difference, H1-H2,
was studied theoretically and experimentally. This estimation is not
adequate for singing, for which the interaction between source and
filter is no longer negligible.
The use of the derivative of electroglottographic signals to detect
glottal opening and closure instants, independently of the effects of
the supraglottal system, was investigated and methods were proposed for
measuring fundamental frequency and open quotient. A
data base of simultaneous EGG and acoustic signals was recorded for 18
trained singers who produced sustained vowels, crescendos and spoken
and sung
phrases. The open quotient was analysed as a function of fundamental
frequency and vocal intensity and related to the main laryngeal
mechanisms
of voice production. It had larger values in mechanism II (
)
than in mechanism I (
)
and a jump of open quotient was noticed at the mechanism's transition.
A high correlation was found with vocal intensity in mechanism I and
with fundamental frequency in mechanism II. It was also dependent on
the opening of the vowel.
The JNDs were determined for the open quotient and the asymmetry
coefficient. The relative JND,
,
was about 14 % for 20 untrained subjects and 10 % for 10 trained ones.
The JND did not vary with a change of vowel or fundamental frequency,
but it depended on the amplitude parameter and whether or not a vibrato
were present.
Keywords :
voice, glottal source, voice quality , electroglottography, open
quotient, laryngeal mechanisms, singing voice synthesis, perception.
Articles publiés en relation avec ce travail
Published papers related to this work
- Henrich N., Sundin G., Ambroise D., d'Alessandro C., Castellengo M. and
Doval B. (2003)
Just noticeable differences of open quotient
and asymmetry coefficient in singing voice, Journal of Voice, vol. 17
(4), pp. 481-494.
- Henrich N. , d'Alessandro C. , Castellengo M. and Doval
B. (2004)
On the use of the derivative of electroglottographic
signals for characterization of nonpathological phonation, J. Acoust.
Soc. Amer., Vol. 115 (3), pp. 1321-1332.
- Henrich N. , d'Alessandro C. , Castellengo M. and Doval
B. (2005)
Glottal open quotient in singing: Measurements
and correlation with laryngeal mechanisms, vocal intensity, and fundamental
frequency, J. Acoust. Soc. Amer., Vol. 117 (3), pp. 1417-1430.
- Doval B., d'Alessandro C. and Henrich N. (2006)
The spectrum of glottal flow models, Acta Acustica united with Acustica, vol.
92, pp. 1026-1046.
Pour voir la liste des publications, cliquer ici
Click here to go to the Publication page.