Contributions à la reconnaissance automatique de la parole avec données manquantes, Contributions to automatic speech recognition with missing data

De
Publié par

Sous la direction de Jean-Paul Haton
Thèse soutenue le 08 novembre 2007: Nancy 1
Ce mémoire propose, dans un premier temps, une introduction détaillée de la reconnaissance automatique de la parole avec données manquantes appuyée par de nombreuses références bibliographiques. Il est montré que l'estimation de masques constitue une étape cruciale. En effet, la qualité des masques estimés conditionne les performances du système de reconnaissance. L'amélioration de la fiabilité des masques constitue donc un enjeu important. Dans un second temps, les travaux menés dans le cadre de l'estimation bayésienne des masques de données manquantes sont présentés. D'une part je propose de nouveaux modèles de masques permettant de modéliser les dépendances entre les masques de différents coefficients d'un signal. Ces modèles sont évalués comparativement à un modèle de référence. Les résultats sont présentés en termes d'erreur de masques ainsi qu'en taux de reconnaissance. Les résultats montrent que ces dépendances contribuent à améliorer les taux de reconnaissance et soulignent l'importance du contexte temporel d'un masque. Je présente, dans un second temps, une nouvelle définition de masque: les masques de contribution. Ces nouveaux masques sont évalués comparativement aux masques usuellement utilisés, fondés sur le seuillage du SNR. Je montre que cette nouvelle définition permet d'améliorer l'algorithme de décodage en affinant les intervalles de marginalisation. L’évaluation, dans le cadre de la marginalisation de données et en présence d'un bruit stationnaire, montrent que les intervalles sont considérablement réduits entraînant une nette amélioration des taux de reconnaissance.
-Robustesse
-Masques
This thesis dissertation proposes, as a first step, a detailed introduction to the automatic speech recognition with missing data supported by many bibliographic references. It is shown that the estimation of masks is a crucial step. Indeed, the quality of the estimated masks determines the performance of the recognition system. Improving the reliability of masks is thus an important issue. In a second step, new investigations in the field of Bayesian missing data mask estimation are presented. I propose first new mask models to model dependencies between the masks of different coefficients of a signal. These models are evaluated and compared to a reference model. The results are presented in terms of error of masks, as well as recognition rate. The results show that these dependencies contribute to improving the recognition rate and stress the importance of the temporal context of a mask. Second, I introduce a new missing data mask definition: the masks of contribution. These new masks are evaluated compared to masks commonly used, based on the SNR thresholding. I show how the decoding algorithm can be improved with such a mask definition by refining the likelihood marginalization intervals. The assessment, in the context of data marginalization and in the presence of a stationary noise, shows that the intervals are considerably reduced resulting in a significant improvement of the recognition rate.
Source: http://www.theses.fr/2007NAN10117/document
Publié le : mardi 25 octobre 2011
Lecture(s) : 35
Nombre de pages : 167
Voir plus Voir moins




AVERTISSEMENT

Ce document est le fruit d'un long travail approuvé par le
jury de soutenance et mis à disposition de l'ensemble de la
communauté universitaire élargie.

Il est soumis à la propriété intellectuelle de l'auteur. Ceci
implique une obligation de citation et de référencement lors
de l’utilisation de ce document.

Toute contrefaçon, plagiat, reproduction illicite encourt une
poursuite pénale.


➢ Contact SCD Nancy 1 : theses.sciences@scd.uhp-nancy.fr




LIENS


Code de la Propriété Intellectuelle. articles L 122. 4
Code de la Propriété Intellectuelle. articles L 335.2- L 335.10
http://www.cfcopies.com/V2/leg/leg_droi.php
http://www.culture.gouv.fr/culture/infos-pratiques/droits/protection.htm ´D´epartement de formation doctorale en informatique Ecole doctorale IAEM Lorraine
UFR STMIA
Contributions `a la reconnaissance
automatique de la parole avec donn´ees
manquantes
`THESE
pr´esent´ee et soutenue publiquement le 8 novembre 2007
pour l’obtention du
Doctorat de l’universit´e Henri Poincar´e – Nancy 1
(sp´ecialit´e informatique)
par
S´ebastien Demange
Composition du jury
Rapporteurs :
Examinateurs :
Laboratoire Lorrain de Recherche en Informatique et ses Applications — UMR 7503
euven
one
r
MCF
e
(HDR)
-
-
-
Universit?
T
de
ar
Nancy
aul
2
L
-
Comp
Nancy
-
-
Pr
F
-
r
Henri

Pr
e
Belgique
Christophe
-
Cerisara
Catholique
Char
Pr
g?
V
de
r
r
L
e
-

t

F
abb
T
CNRS
?
-

Nancy
Universit?
-
ofesseur
F
Haton
r
Jean-P

-
e
L
atore
ouvain
Salv
de
unisie
Universit?
T
ofesseur
-
ernolle
unis
an
T
Dirk
-

ENIT
F
-
anion
ofesseur
-
Pr
ENSSA
Ellouze
ofesseur
Noureddine

e
Lauren

Nancy
-la
Mis
thloria.
en

page
avecsuivi
Remerciemen
mon
ts
t
Une
et
th?se
autres
est
e
une
ec
?tap
m'a
e
grande
inp
Salv
ortan

te
famille
dans
Amandine.
la
Caroline,
vie
Christophe
de
le
toute
que
p
gen
ersonne
mon
attir?e
one,
par
V
le
mem
monde

de
t
la


mes
herc
plus
he.
Joseph,
Cette
Haton
histoire
p
est
oir

?
he

de
our
nouv
onibilit?
elles

exp
bres
?riences,
de
d'?c
T
hanges
Ellouze,
et
et
de
Comp
rencon
tous
tres.
de
A
AR

toute
titre,
plus
j'aimerais
paren
remercier
ainsi
de
Gene
nom
?
breuses
a
p
p
ersonnes
p
p
uel,
our
Gilles,
a
d'autres
v
et
oir
Cerisara

our
tribu?,
v

mis

pied
?
l'?trier,
leur
et
mani?re,
ainsi
?
p
la
leur

disp
de
et

tillesse.
m?moire.
aux
J'adresse
mem
donc
de
mes
jury
remerciemen
th?se,
ts
atore
les
abb
plus
Nourredine

Lauren
haleureux

et
Dirk
les
an
plus
ernolle.
sinc?res
?
:
les

bres
?
l'?quip
Violaine,
P
qui
OLE.
partage
?
ma
ma
vie
et
depuis
particuli?remen
plus
mes
de
ts,
10
fr?re
ans
que
et
hel,
qui
et
m'a

toujours
tous

amis
et
v
souten
une
u
ens?e

particuli?re
trois
our
ann?es
Emman
duran
Slim,
t.
Romain,

Lo?c,
?
bien
Jean-P
i
auliila
A
our
Violaine.
magie
Des
d'?tre
pa
m?me
roles
b
de
La
douceur
Main
Des
Suivre
moments
Juste
de
l'amour
b
vie
onheur
iii
Des
joie
rega
deux
rds
dans
?chang?s
main
Un
le
zeste

de
la

de
Des
Une
?toiles
elle
dans
p
les
toujours
y
euxiv.
T
.
able
.
des
.
mati?res
2.3.2
T
ec
able
de
des
.
gures
.
ix
34
Liste
.
des
.
tableaux
.
xi
Masquage
In
.
tro
.

parole
g?n?rale
.
xiii
.
Chapitre
.
1
.
La
2

de
automatique
.
de

la
Le
parole
.
robuste
.
au
Masque
bruit
.
1.1
oracle

.
automatique
.
de
.
la
donn?es
parole
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
la
.
2.1
.
.
.
.
.
.
.
Th?orie
.
monde
.
.
.
p
.
.
.
.
.
de
.
.
.
.
.
tes
.
.
2
.
1.1.1
.
Le
.
signal
.
de
.
la
.
parole
2.3
.
ations
.
.
.
2.3.1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
23
.
automatique
.
a
.
manquan
.
en
.
parole
.
.
.
.
.
.
.
.
.
.
2
27
1.1.2
:
P

aram?trisation
.
du
.
signal
27
.
dans
.
h
.
parole
.
.
.
.
.
28
.

.
parole
.
.
.
.
.
.
.
29
.
donn?es
.
.
.
.
.
.
.
.
.
.
.
.
.
2.2.2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
.
1.1.3
.

de
e
des
de
.
la
.

.
.
.
.
probl?me
.
tes
.
.
.
.
.
.
.
.
.
.
.
des
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
.
1.1.4
.
Le
.
mo
.
d?le
.
de
.
Mark
.
o
.
v
.

.
h?
Chapitre
.

.
de
.
parole
.
v
.
donn?es
.
tes
.
Masquage
.

.
la
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2.1.1
.
gestaltiste
.
p
.
et
.
du
9
.
1.2
.
Robustesse
.
au
.
bruit
.
.
2.1.2
.
masquage
.
la
.

.
umaine
.
la
.
.
.
.
.
.
.
.
.
.
.
.
.
2.2
.
en
.
automatique
.
la
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2.2.1
.
de
.
manquan
.
.
.
.
.
.
.
.
.
.
.
.
.
.
16
.
1.2.1
.
Le
.
bruit
.
.
.
.
30
.
Masque
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
33
.

.
la
.
sur
.
observ
.
partielles
.
.
.
.
.
.
.
.
.
.
.
.
.
33
.
Le
.
des
.
manquan
.
.
16
.
1.2.2
.
Strat?gies
.
p
.
our
.
la
.

.
robuste
.
de
.
la
33
parole
Imputation
.
donn?es
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
18
.
1.3
.
Conclusion
.
.
.
.
v
..
T
.
able
.
des
.
mati?r
.
es
.
2.3.3
.
Marginalisation
.
des
.
donn?es
.
.
.
.
.
.
.
.
.
.
exp
.
.
.
temp
.
.
.
.
.
orelles
.
masques
.
nouv
.
.
.
.
.

.
.
.
.
.
?v
.
.
.
.
.
.
.
v
.
.
.
aleurs
.
.
.
.
39
.
2.4
.
Conclusion
.
.
.
.
.
.
.
.
.
.
tes
.
.
.
.
.
.
.
.
.
.
.
.
.
ts
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Les
.
.
.
.
.
.
.
.
.
72
.
tielles
.
.
.
In
.
.
.
.
.
.
.
.
.
D?p
.
.
.
.
.
.
.
4.2.3
.
.
48
.
Chapitre
.
3
78
Estimation
.
des
.
masques
.
:
.
?tat
masques
de
.
l'art
In
3.1
.
In
.
tro
.

.
.
Masque
.
.
.
.
.
.
.
83
.
terv
.
.
.
Gestion
.
.
.
.
.
.
.
Conclusion
.
.
.
.
.
.
.
.
.
.
.
tro
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Syst?me
.
tes
.
vi
.
.
.
.
.
.
.
D?p
52
et
3.2
les
Analyse
masques

.
de
74
sc?ne

auditiv
.
e
.
.
.
.
.
.
.
.
.
.
.
.
.
.
74
.
fr?quen
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
endances
.
.
.
.
.
.
.
.
.
.
53
.
3.2.1
.

Estimateurs
es
.
de
.
base
.
.
.
.
.
.
.
.
.
.
4.3
.

.
donn?es
.
.
.
.
.
81
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
81
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Masque
.
et
.
de
.
.
53
.
3.2.2
83
Bref

surv
vitesse
ol
.
des
.
syst?mes
.
CASA
.
.
.
.
84
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Chapitre
.
5.1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
54
5.2
3.3
tal
T
.
raitemen
.
t
.
du
.
signal
.
et
.
mo
.
d?les
.
statistiques
89
.
de
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
89
.

.
donn?es
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4.2
59
endances
3.3.1
orelles
S?paration
fr?quen
bas?e
sur
sur
v
le
de
SNR
.
lo
.

.
.
.
.
4.2.1
.
tro
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4.2.2
.
endances
60
tielles
3.3.2
.
R?seaux
.
de
.
neurones
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
74
.
D?p
.
temp
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4.2.4
.
de
.
.
.
.
62
.
3.3.3
.
S?paration
.
de
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
79
.
Une
.
elle
.
des
.
de
.
manquan
.
.
.
.
.
.
.
.
.
.
.
4.3.1
.
tro
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
62
.
3.3.4
.
Mo
.
d?les
.
statistiques
.
.
.
.
.
.
.
.
.
.
4.3.2
.
de
.
tribution
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4.3.3
.
de
.
tribution
.
in
.
alle
.
marginalisation
.
.
.
.
.
.
64
.
3.3.5
.
Masque
4.3.4

des
pro

duit
de
de
.
la
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4.4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
66
.
3.4
.
Discussion
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
85
.
5
.
aluations
.
In
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
89
.
Cadre
.
?rimen
.
.
.
.
.
.
67
.
Chapitre
.
4
.
Deux
.
nouv
.
elles
.
appro
.

.
hes
.
de
.
mo
.
d?lisation
.
des
.
masques
.
4.1
.
In
5.2.1
tro
bases

donn?es
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5.2.2
.
de
.
a
.
ec
.
manquan
.
ou
.
.
.
.
.
92
.
..
5.2.3
.
Mo
.
d?les
minim
acoustiques
.
.
.
.
.
.
.
.
.
.
.
.
marginale
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
?sienne
.
.
.
.
.
.
.
.
.
.
.
A.2
.
.
.
.
.
.
.
.
.
D?p
.
.
.
Une
.
.
.
ectiv
.
.
93
.
5.2.4

P
.
aram?trisation
.
p
125
our
.
les
.
mo
.
d?les
.
de
.
masques
.
.
A.1.4
.
.
.
.
.
.
.
.
.
A.2.1
.
.
.
A.2.2
.
.
.
.
.
.
.
Liste
.
.
.
masques
.
.
.
.
94
.
5.3
de
D?p
.
endances
.
sur
120
les
.
v
.
aleurs
.
de
.
masque
.
.
A
.
la
.
probabiliste
.
.
.
.
.
.
.
.
.
te
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
A.1.3
.
.
.
.
.
.
.
.
.
y
.
.
.
.
94
.
5.3.1
.

.
des
.
d?p
.
endances
.
sur
.
les
de
masques
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
119
.
sur
.
.
.
.
.
.
.
.
95
.
5.3.2
.
?v
119
aluation
elle
des
.
masques
.
.
.
.
.
.
.
.
.
.
P
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Annexes
.
el
.
p
.
ba
.
Asp
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
97
.
5.3.3
Probabilit?
?v
.
aluation
.
de
.
la
.

.
.
.
.
.
.
.
.
A.1.2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
de
.
.
99
.
5.3.4
.
Conclusion
.
.
.
.
.
.
.
.
.
.
.
.
ect
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
et
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
de
.
.
.
.
.
.
.
.
.
.
.
.
.
A.2.3
.
taux
.
.
.
.
106
.
5.4
.

.
des
Annexe
in
publications
terv
.
alles
.
de
.
marginalisation
.
.
6.2.1
.
endances
.
les
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6.2.2
.
nouv
.
d?nition
.
masques
.
.
107
.
5.4.1
.
L'erreur
.
marginale
.
aux
.
moindres
.

.
:
.
MaMSE
.
.
.
.
6.3
.
ersp
.
es
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
107
.
5.4.2
.
In
.
terpr?tation
.
de
.
la
.
mesure
.
MaMSE
.
.
.
.
122
.
Annexe
.
Rapp
.
des
.
probabilistes
.
our
.

.
y
.
A.1
.
ect
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
108
.
5.4.3
.
R?sultats
.
.
.
.
.
.
.
.
.
.
.
.
A.1.1
.
join
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
125
.
Loi
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
110
.
5.4.4
.
Conclusion
.
.
.
.
.
.
.
.
126
.
Loi
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
126
.
R?gle
.
Ba
.
es
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
115
.
Chapitre
.
6
.
Conclusion
.
g?n?rale
.
6.1
.
Cadre
127
de
Asp
notre

?tude
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
127
.

.
r?gles
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
127
.
F
118
de
6.2
et
Con
risque
tributions
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
128
.
Le
.
du
.
d'erreur
.
um
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
129
.
B
.
des
.
vii
.

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.

Diffusez cette publication

Vous aimerez aussi