La lecture en ligne est gratuite
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Partagez cette publication

Statistiqueasymptotiquedansdesmod`eles`a variables latentes
Catherine Matias
Habilitation`adirigerdesrecherches
´ Soutenuele17octobre2008a`lUniversit´edEvry-ValdEssonne
LaboratoireStatistiqueetG´enome(UMRCNRS8071), ´ Tour Evry 2, 523 pl. des Terrasses de l’Agora, ´ 91000 Evry, France e-mail:tacirehm.enaitarfs@genopole.cnrs. url:stat.genopole.cnrs.fr/cmatias
1
2 Tabledesmatie`res
Catherine Matias
Remerciements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Pre´sentationge´ne´rale...........................................6
IS´equences:mode´lisationdelacompositionetdesprocessusde´volution8 1LeschaˆınesdeMarkova`r´egimesMarkoviens............................8 1.1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.2Repre´sentationsdesCMRM...................................10 1.3De´nitionetestimationdelordreduneCMRM.......................14 1.4Donn´eessimule´es.........................................17 2Leschaınessemi-Markovcache´es...................................17 ˆ 2.1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.2 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3Lesmod`elespair-Markovcache´spourmod´eliserl´evolutiondess´equences............19 3.1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.2Descriptiondumod`ele......................................21 3.3 Vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3.4Re´sultats.............................................24 3.5 Commentaires et conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 4Mod`elesde´volutiondese´quencesde´pendantsducontexte.....................26 4.1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 4.2Mode`le...............................................30 4.3 Conclusions et perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
IIMode`lessemiparam´etriquesdesignauxbruit´es32 5Lemod`eledeconvolution.......................................32 5.1Convolutionavec´echelledubruitinconnue..........................35 5.2Convolutionavecr´egularit´edubruitinconnue.........................38 5.3Approchege´n´eraledel´etudedesestimateurs`anoyauconstruitspar«plug-in». . . . . . 41 5.4Testsdade´quationenconvolutionsemiounonparame´trique................44 6Fonctionsp´eriodiquesbruite´es,dep´eriodeinconnue.........................49
IIIGraphesale´atoires53 7Lesmotifsdanslesre´seauxbiologiques................................53 8Unmod`eledem´elangepourgraphes.................................54
Mode`lesa`variableslatentes
8.1Quelquesmode`lesdem´elangedegraphesidentiables.................... 9Identiabilit´edesmod`elesdem´elangepourapplicationauxmode`lesdeme´langesdegraphes.. 10Inf´erenceder´eseauxdinteraction................................... A Identifiability of latent class models with many observed variables . . . . . . . . . . . . . . . . A.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2 The discrete latent class model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.3 Kruskal’s theorem and its consequences . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.4 Finite mixtures of discrete multivariate distributions . . . . . . . . . . . . . . . . . . . . . A.5 Proofs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Re´f´ences.................................................. er Liste des travaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Liste des co-auteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
55 59 60 63 63 66 67 69 70 73 80 82
4 Remerciements
Catherine Matias
Mesremerciementsvonttoutdaborda`ElisabethGassiat,quiaeulabienveillancedesuivremon travailavecsusammentdedistancepourmelaisserme´panouir,maissansjamaismefermersaporte lorsque j’en ai eu besoin. Merci beaucoup Elisabeth.
JeremercieensuiteFabienneComte,SylvieHuetetAadvanderVaart,quiontaccept´ed´ecrireun rapportsurcetravail.Cestunhonneurpourmoiquevousayezaccepte´cettetˆacheingrateetjevousen suisreconnaissante.Jeremerciee´galementLaurentCavalieretSte´phaneRobindavoiraccepte´defaire partie des membres du jury de cette soutenance.
Jaieuleplaisirdetravailleravecdenombreusespersonnesdurantcesann´eesderecherche,etje tiensa`remerciericitousmesco-auteurs.Sanseux,cem´emoireneseraitpascequilest,etjaieuavec chacundeuxbeaucoupdeplaisir`atravailler.
´ Mesremerciementsvontensuite`aBernardPrum,quiasucr´eer`aEvryunlaboratoireo`ulonse senttoutsimplementbien.Enn,mesremerciementsvontauxmembrespass´esetpre´sentsdulaboratoire StatistiqueetG´enome,quiontcontribu´e`acetteambiancesiparticulie`requejeviensde´voquer,ainsi qu`atouslesmembresdugroupeSSB.
Notations
Mode`lesavariableslatentes `
5
Pourplusdelisibilit´e,jedresseci-dessouslalistedesnotationsetconventionsutilise´esdanscema-nuscrit. X1:nouX1nngissalee´dabrisleteuivadeX1, . . . , Xn. N?emetcirtssreitne.fstisiponte´isdedesemblensgnel SiAest un alphabet fini,|A|naditle´dsegienoscnraA?l’ensemble des suites finies deA. Pour touts∈ A?, la longueur deseet´noste|s|. Pour touss, t∈ A?, la suitesteatenndioonrct´canetbapeuotseset det. 1{A}est la fonction indicatrice de l’ensembleA. P,E´les´eetilitbobaedrpuserenemtuengnsi´edceansoas´ecie;Pθ,EθouPf,Efdes mesures de per probabilite´etlesespe´rancesassoci´ees,d´ependantdunparam`etreθouf;P0,E0mesesemit´tsueqnal ˆ pourlepara`etreθ0ouf0. m XqYsignifie que les variablesXetY.neadtnseepd´inntso