La lecture à portée de main
Découvre YouScribe en t'inscrivant gratuitement
Je m'inscrisDécouvre YouScribe en t'inscrivant gratuitement
Je m'inscrisDescription
Informations
Publié par | Thesee |
Nombre de lectures | 40 |
Langue | Français |
Poids de l'ouvrage | 2 Mo |
Extrait
ACADÉMIEDENANTES
UNIVERSITÉDUMAINE
THÈSE
présentéeàl’UniversitéduMaine
pourobtenirlediplômedeDOCTORAT
SPÉCIALITÉ: Informatique
ÉcoleDoctorale503
«SciencesetTechnologiesdel’InformationetMathématiques»
Laboratoired’Informatique
Identificationnomméedulocuteur:exploitation
conjointedusignalsonoreetdesatranscription
par
VincentJOUSSE
Soutenuepubliquementle04mai2011devantunjurycomposéde:
FrédéricBéchet Professeur,LIF,U.delaMéditerranée RapporteurBimbot DirecteurdeRecherche,IRISA,U.deRennes
ClaudeBarras MaîtredeConférences,LIMSI,U.ParisXI Examinateur
BéatriceDaille Professeur,LINA,U.deNantes Directricedethèse
SylvainMeignier MaîtredeConférences,LIUM,U.duMaine Co-Encadrantdethèse
ChristineJacquinedeLINA,U.deNantes Co-Encadrantedethèse
SimonPetitrenaud MaîtredeConférences,LIUM,U.duMaine Invité
Laboratoired’Informatiquedel’UniversitéduMaineedeNantesAtlantique2Tabledesmatières
1 Introduction 11
2 Traitementautomatiquedelaparole 15
2.1 Différentstypesdesystèmes . . . . . . . . . . . . . . . . . . . . . . 17
2.1.1 Commandesvocales . . . . . . . . . . . . . . . . . . . . . . 17
2.1.2 Systèmesdecompréhension . . . . . . . . . . . . . . . . . 18
2.1.3dedictéeautomatique . . . . . . . . . . . . . . . 19
2.1.4 Systèmesdetranscriptiongrandvocabulaire . . . . . . . . 20
2.2 Transcriptionautomatiquedelaparole. . . . . . . . . . . . . . . . 22
2.2.1 Principesgénéraux . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.2 Modèlesacoustiques . . . . . . . . . . . . . . . . . . . . . . 23
2.2.3delangage . . . . . . . . . . . . . . . . . . . . . . 24
2.2.4 Évaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 Reconnaissanceautomatiquedulocuteur . . . . . . . . . . . . . . 26
2.3.1 Caractéristiquesetvariabilité . . . . . . . . . . . . . . . . . 26
2.3.2 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.3 Identificationautomatiquedulocuteur . . . . . . . . . . . 27
2.3.4 Vérificationdu . . . . . . . . . . . . 28
2.3.5 Suividelocuteur . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3.6 Segmentationetclassificationenlocuteur . . . . . . . . . . 30
2.4 Transcriptionenrichiepourlareconnaissanceenlocuteur . . . . . 31
2.4.1et . . . . . . . . . . . . . . . . . 32
2.4.2 Transcriptionetentitésnommées . . . . . . . . . . . . . . . 33
2.5 Détectiondesentitésnommées . . . . . . . . . . . . . . . . . . . . 34
2.5.1 Catégorisation . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.5.2 Lesdifférentstypesdesystèmes . . . . . . . . . . . . . . . 35
2.5.3 ReconnaissanceetdécouvertedesEntitésNommées . . . 35
3 L’identificationnomméedulocuteur 39
3.1 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.2 Métriqued’évaluation . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.3 Utilisationdeconnaissancesapriori . . . . . . . . . . . . . . . . . 41
33.4 Utilisationdesinformationsdelatranscription . . . . . . . . . . . 42
3.4.1 Hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.4.2 Attributionlocale . . . . . . . . . . . . . . . . . . . . . . . . 44
3.4.3globale . . . . . . . . . . . . . . . . . . . . . . . 45
3.4.4 Processusd’attribution . . . . . . . . . . . . . . . . . . . . . 46
3.5 Approchesymbolique . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.5.1 Règleslinguistiques . . . . . . . . . . . . . . . . . . . . . . 49
3.5.2 Expériencesetmétriquesd’évaluation . . . . . . . . . . . . 50
3.5.3 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.6 Approchestatistique:N-grammes . . . . . . . . . . . . . . . . . . 53
3.6.1 Attributionlocale:utilisationdeN-grammes . . . . . . . . 53
3.6.2globale . . . . . . . . . . . . . . . . . . . . . . . 53
3.6.3 Corpus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.6.4 Analysedesdonnées . . . . . . . . . . . . . . . . . . . . . . 56
3.6.5 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.7 Approchestatistique:arbredeclassificationsémantique . . . . . 59
3.7.1 Détectiondesentitésnommées . . . . . . . . . . . . . . . . 60
3.7.2 Attributions . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.7.3 Expériencesetrésultats . . . . . . . . . . . . . . . . . . . . 62
3.8 Bilan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4 Milesin : Un système d’INL par analyse conjointe du signal et de sa
transcription 65
4.1 Détectiondesentitésnommées . . . . . . . . . . . . . . . . . . . . 66
4.1.1 Lacampagned’évaluationESTER2 . . . . . . . . . . . . . 66
4.1.2 LesystèmeLIA_NE . . . . . . . . . . . . . . . . . . . . . . 67
4.2 Attributionslocales:arbredeclassificationsémantique . . . . . . 68
4.2.1 Arbredeclassificationsémantique . . . . . . . . . . . . . . 69
4.2.2 Apprentissage . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2.3 Étiquetageetattributionslocales . . . . . . . . . . . . . . . 74
4.3 Attributionglobale:processusdedécisionetfonctionsdecroyance
pourl’INL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.3.1 Formalismeetnotations . . . . . . . . . . . . . . . . . . . . 76
4.3.2 Fonctionsdecroyance . . . . . . . . . . . . . . . . . . . . . 77
4.3.3 Définitiondesmassesdecroyance . . . . . . . . . . . . . . 78
4.3.4 Combinaisonpartourdeparoleetparlocuteur . . . . . . 78
4.3.5 Processusdedécision . . . . . . . . . . . . . . . . . . . . . 79
4.3.6 Priseencomptedugenre . . . . . . . . . . . . . . . . . . . 81
4.4 Évaluationdusystèmeproposé . . . . . . . . . . . . . . . . . . . . 82
4.4.1 Descriptiondescorpus . . . . . . . . . . . . . . . . . . . . . 82
4.4.2 Métriquesutilisées . . . . . . . . . . . . . . . . . . . . . . . 83
4.4.3 SystèmedetranscriptionautomatiqueduLIUM . . . . . . 84
4.4.4 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
44.5 Bilan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5 Milesin:avancéesetlimites 89
5.1 Analysepréliminaire . . . . . . . . . . . . . . . . . . . . . . . . . . 90
5.1.1 Nemesis,unoutilprévupourleTAL . . . . . . . . . . . . 90
5.1.2 Analysedeserreurs . . . . . . . . . . . . . . . . . . . . . . 91
5.2 Processusdedécision:variantes . . . . . . . . . . . . . . . . . . . 95
5.2.1 Utilisationd’unmaximum . . . . . . . . . . . . . . . . . . 95
5.2.2 Normalisationdesscores . . . . . . . . . . . . . . . . . . . 96
5.2.3 Expériencesetrésultats . . . . . . . . . . . . . . . . . . . . 97
5.2.4 Critiquesetthéoriedesfonctionsdecroyance . . . . . . . 98
5.3 Listedelocuteursetapplications . . . . . . . . . . . . . . . . . . . 99
5.3.1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.3.2 Expérimentations . . . . . . . . . . . . . . . . . . . . . . . . 100
5.3.3 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5.4 Transcriptionsautomatiques . . . . . . . . . . . . . . . . . . . . . . 102
5.4.1 Delapertinencedesmétriquesutilisées . . . . . . . . . . . 102
5.4.2 Influencedelaqualitédestranscriptionsenrichies . . . . . 103
5.5 Bilan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6 Conclusionetperspectives 107
Listedesillustrations 111
Listedestableaux 113
Bibliographie 115
56Remerciements
Cette thèse a été par bien des aspects atypique, et cette section «Remercie-
ments»nedérogerapasàlarègle.JeremerciedoncenpremierlieuJessica,ma
femme. Sans son soutien et sa patience cette thèse n’aurait jamais pu débuter,
c’est grâce elle que vous pouvez lire ces lignes. Merci pour tout, merci pour
notrebellefamille.
Jetiensensuiteàremercierlesmembresdemonjurypourleurparticipation
à la soutenance de cette thèse : Monsieur Claude Barras pour avoir présidé le
jury,MonsieurFrédéricBéchetetFrédéricBimbot,rapporteursdece
travail,pouravoirconsacrédutempsàlalecturedecedocument.
Ensuite je tiens chaleureusement à remercier mon équipe encadrante Nan-
taise. Tout d’abord Madame Béatrice Daille, directrice de cette thèse. Elle a su
memontrerlarigueurqueréclamaituntravaildethèseetsum’orienterquand
il le fallait. Ce travail «invisible» n’en est pas moins important et a eu beau-
coupdevaleuràmesyeux.Ellead’autantplusducomposeravecundoctorant
pèredefamille,cequin’a,jeleconsens,pasdutoujoursêtrefacile.Ensuitej’ai-
merais remercier Madame Christine Jacquin, co-encadrante de cette thèse. J’ai
connu Christine lorsque j’étais sur les bancs de l’IUT et pouvoir retravailler en
sacompagnieaétéunréelplaisir.
Le Mans, une ville pleine de rencontres enrichissantes. Ce fut tout d’abord
le cas avec Monsieur Sylvain Meignier, co-encadrant de cette thèse. Sylvain
était présent à mes côtés quotidiennement, et sa bonne hume