Modélisation de la coarticulation labiale : mise en oeuvre sur une tête parlante, Modeling labial coarticulation : implementation for a talking head

De
Publié par

Sous la direction de Yves Laprie, Anne Bonneau
Thèse soutenue le 12 novembre 2008: Nancy 1
Cette thèse s'inscrit dans une étude sur l’élaboration d'une tête parlante. Nous nous intéressons tout particulièrement à la prédiction du mouvement de coarticulation des lèvres et de la mâchoire. Après avoir analysé les variations intra et interlocuteur des paramètres labiaux de deux corpora audiovisuels, nous avons conçu un algorithme de prédiction de la coarticulation basé sur des règles phonétiques et prenant en considération l'interaction entre les articulateurs. Nous avons ensuite proposé une technique pour synthétiser les mouvements articulatoires des lèvres et de la mâchoire en utilisant un corpus monolocuteur. Le principe de base est la concaténation de séquences élémentaires de type VC...CV qui ont été jugées pertinentes par notre algorithme de prédiction phonétique, et qui sont soit extraites du corpus, soit obtenues par complétion. Nous avons modélisé les mouvements articulatoires par des sigmoïdes qui offrent l'avantage de réduire considérablement la taille du modèle construit et permettent de s'adapter facilement à des vitesses d'élocution ou des stratégies articulatoires particulières tout en conservant les contrastes distinctifs entre les sons successifs et leurs caractéristiques intrinsèques. Afin d'estimer la qualité de notre synthèse, nous avons mesuré les différences entre les signaux réels et synthétisés sur l'ensemble des phrases du corpus et nous avons comparé notre solution avec l’algorithme de Cohen et Massaro. Nous avons montré que notre synthèse est meilleure pour certaines séquences spécifiques de type VCCV où l'anticipation est plus complexe.
-Coarticulation
-Tête parlante
This thesis comes within the scope of talking heads. We are particularly interested in the prediction of labial and jaw coarticulation movements. After analyzing intra and inter speaker variability using two corpora, we defined a prediction algorithm for anticipatory coarticulation based on phonetic rules which takes into account interactions between articulators. We then proposed a solution to estimate labial and jaw movements using a one speaker corpus. It consists in concatenating elementary VC...CV sequences selected by our prediction algorithm and either extracted from the corpus or rebuilt by completion. We modeled articulatory movements using sigmoids which offer the advantage of considerably reducing the model size and which are adaptable to speaking rate or articulatory strategies. Additionally, sigmoids are able to keep distinctive contrasts between neighboring segments as well as intrinsic characteristics of the sounds. With the aim of estimating the quality of our synthesis process, we measured differences between real and predicted data for all the sentences of the corpus et we compared our solution with Cohen and Massaro 's algorithm. It turns out that our solution is better for specific VCCV sequences in which anticipation is more complex.
Source: http://www.theses.fr/2008NAN10077/document
Publié le : mardi 1 novembre 2011
Lecture(s) : 34
Nombre de pages : 132
Voir plus Voir moins




AVERTISSEMENT

Ce document est le fruit d'un long travail approuvé par le
jury de soutenance et mis à disposition de l'ensemble de la
communauté universitaire élargie.

Il est soumis à la propriété intellectuelle de l'auteur. Ceci
implique une obligation de citation et de référencement lors
de l’utilisation de ce document.

Toute contrefaçon, plagiat, reproduction illicite encourt une
poursuite pénale.


➢ Contact SCD Nancy 1 : theses.sciences@scd.uhp-nancy.fr




LIENS


Code de la Propriété Intellectuelle. articles L 122. 4
Code de la Propriété Intellectuelle. articles L 335.2- L 335.10
http://www.cfcopies.com/V2/leg/leg_droi.php
http://www.culture.gouv.fr/culture/infos-pratiques/droits/protection.htm








Departement de formation doctorale en informatique Ecole doctorale IAEM Lorraine
UFR STMIA
Modelisation de la coarticulation
labiale :
THESE
presentee et soutenue publiquement le 12 novembre 2008
pour l’obtention du
Doctorat de l’Universite Henri Poincare { Nancy I
(Specialite Informatique)
par
Vincent ROBERT
Composition du jury
Rapporteurs : L. Besacier, Ma^ tre de Conference a l’Universite Joseph Fourier de Grenoble.
O. Boe ard, Professeur a l’ENSSAT de Lannion.
Examinateurs : R. Sock, Professeur a l’Universite Marc Bloch de Strasbourg.
Y. Laprie, Directeur de Recherche au CNRS - LORIA.
A. Bonneau, Chargee de Recherche au -
J. P. Haton, Professeur a l’Universite Henri Poincare de Nancy.
Laboratoire Lorrain de Recherche en Informatique et ses Applications | UMR 7503




!






6M@







+

!



K;y















K



*!)
"!#
4;J1


$%'&(!)






j@


im
*



=





Urs!)







MI

j@
+,$
B


-









[!#
!)
xz

"A@{
/.







-01 %3241 .657$198:!)
V@


+;




"I
<


"




!




=n$24
=

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.

Diffusez cette publication

Vous aimerez aussi