Initiation a` l’Estimation Statistique et Applications Astrom´etriques Fr´ed´eric Arenou UMR 8111 du CNRS et G´epi (Observatoire de Paris) Support de cours au TD bruit et signaux Revision: 1.1.1 , Date: 2004/10/15 13:53:31 Mise a` jour sur http://wwwhip.obspm.fr/˜arenou 1 L’estimation statistique - biais: en plus des erreurs al´eatoires sur les donn´ees obser- vationnelles,onpeutparfoiss’attendre`adeserreurssyst´ema- ` tiques.1.1 A quoi servent les statistiques? Parmi les diff´erentes causes de ces biais: probl`emes instru- Le probl`eme de l’estimation statistique est aussi ancien que mentaux (par exemple d´eformation de plaques photographi- les diff´erentes sciences observationnelles, d`es lors qu’il a fallu ques), ´echantillon non repr´esentatif, et en particulier a` cause synth´etiserdesmesuresr´ep´et´eesd’unemˆemegrandeurincon- d’une censure (ex: on observe des´etoiles jusqu’`a une certaine nue. Les diff´erentes applications de l’estimation sont les sui- magnitude apparente limite, donc on privil´egie les plus in- vantes: trins`equementbrillantes,donclamagnitudeabsoluemoyenne -inf´ererlespropri´et´esd’unepopulationa`partird’un´echan- observ´ee est biais´ee), pr´esence de points aberrants (si l’esti- tillon repr´esentatif: onsupposequel’´echantillonquel’onaest mateur que l’on utilise y est sensible) extrait d’une population parente dont on connaˆıt la forme de la distribution, et dont on cherche la meilleure valeur des pa- ram`etres qui la caract´erisent (estimation ...
Support de cours au TD bruit et signaux Revision: 1.1.1 , Date: 2004/10/15 13:53:31 Misea`joursurhttp://wwwhip.obspm.fr/˜arenou
1L’estimation statistique ` 1.1 A quoi servent les statistiques ? Leprobl`emedel’estimationstatistiqueestaussiancienque lesdiffe´rentessciencesobservationnelles,de`slorsqu’ilafallu synth´etiserdesmesuresre´p´et´eesd’unemˆemegrandeurincon-nue.Lesdiff´erentesapplicationsdel’estimationsontlessui-vantes : -inf´ererlesproprie´te´sd’unepopulationa`partird’une´chan-tillonrepr´esentatif:quse’´elhaecilntqnol’leueanotsosnpuop extraitd’unepopulationparentedontonconnaıˆtlaformede la distribution, et dont on cherche la meilleure valeur des pa-rame`tresquilacaract´erisent(estimationponctuelle) ou un intervalledeconfiancequicontiennecesparame`tresavecune certaineprobabilit´e(estimationd’intervalle). Extraire un si-gnal du bruit de mesure en est une application analogue. -choisirentrediff´erenteshypothe`ses:par exemple savoir si laloideserreurssurdesdonn´eesestounongaussienne,ou bieneˆtrecertainqu’uneobservationquel’onvientd’obtenir est(significativement)diffe´rentedecellequ’unmod`elepr´edi-rait.
1.2 Quelques remarques -inf´erence:le but de l’estimation statistique est d’analy-serlese´ve`nementspass´es,et´eventuellementdepre´direles e´v`enementsfuturs.Lemotpr´ediren’estpasinnocent,car ilsous-entendlerisquedesetromper:meˆmesilesme´thodes utilise´esproviennentdesmath´ematiques,ou`c’estlad´eduction quiestutilise´e,l’estimationstatistiqueutilisel’nce´ereifn, tout commelaphysique.C’estdoncuneinterpre´tationdumonde (unemode´lisationr´eductrice),lebutestquec’ensoitlaplus probable... - grandeurs physiques:otturuerailbveraerv´eobsneereeau demesureale´atoire(dontondoitdoncindiquerladispersion). Ex:sil’onmesuredesparallaxestrigonom´etriques,ondoit logiquements’attendre`aobtenirdesparallaxesne´gatives, mˆemesil’onsaitquelavraieparallaxeestpositive.Toute analysededonne´esdoitdoncprendreleserreursdemesure en compte. -´echantillon:ituqdee´ep-neaunlynastseisatselse´ratlu’dst dentclairementdelatailledel’´echantillonetdesarepre´senta-tivit´e;lessondagesd’opinionensontunexemple. -interpre´tation:u’enustltadsitate´rpe´rsednosdorlernt’iel analyse,ilnefautpasconfondrecorre´lationetcausalit´e.
1
- biais:atoial´eeursserrsuednelp-erbssoee´nnodselrusser vationnelles,onpeutparfoiss’attendre`adeserreurssyst´ema-tiques. Parmilesdiff´erentescausesdecesbiais:probl`emesinstru-mentaux(parexemplede´formationdeplaquesphotographi-ques),´echantillonnonrepr´esentatif,etenparticulier`acause d’unecensure(ex:onobservedes´etoilesjusqu’a`unecertaine magnitudeapparentelimite,donconprivile´gielesplusin-trins`equementbrillantes,donclamagnitudeabsoluemoyenne observe´eestbiaise´e),pr´esencedepointsaberrants(sil’esti-mateur que l’on utilise y est sensible)
2
Probabilite´s
2.1 Conventions Unevariableal´eatoire(v.a.)estunefonctiona`valeurre´elle (ouunvecteurdontlescomposantessont`avaleursre´elles). Pour une v.a.Xaeilasitnoetsar´x, on notera souventf(x) au lieu defX(xbalirpboe´edsntidesa).it´e Ons’int´eresseraessentiellement`adesfonctionscontinues. Danslecasdiscreto`uΩ=(x1, . . . , xn) est l’ensemble des valeurs possibles de la v.a.X, et en notantpi=P(X=xi) laprobabilite´dere´alisation,ilsuffitdesubstituerlessomma-tionsauxint´egralesetpi`af(x). Onutiliseraleslettresgrecquespourlesparam`etresincon-nus, les autres lettres pour les estimations empiriques :m→ b µ,s→σ;θsenuamitse´dengivaleurinteurdelaocnneu θ, le signe❀indique qu’une v.a. suit une certaine loi de probabilit´e.Onnotesouventxou< x >la valeur moyenne. Pour qu’il n’y ait pas de confusion, on note dans ce qui suit $lallarapae´und’xeetleoietπle nombre utile aux sages.
´ 3.3 Ecart-typeσ(X) C’estlaracinecarre´edelavariance.Pourlad´esigner,on rencontrerasouventlestermesd’erreur,depre´cision,dedis-persion. L’erreur interne (ou formelle) est celle qui est obtenue parlam´ethoded’estimationutilise´e,paropposition`al’erreur externe.
3.4
Covariance
Cov(X, Y) =E[(X−E[X])(Y−E[Y])] Z +∞ = (x−µX)(y−µY)f(x, y)dxdy −∞ Z +∞ =xyf(x, y)dxdy−µXµY −∞ On a Cov(X, Y) = Cov(Y, X) et, siaetbedrse´les,ostn
Cov(aX+bY, Z) =aCov(X, Z) +bCov(Y, Z)
Dans le cas multidimensionnel d’un vecteurX= (Xi), on introduit la matrice de variance-covariance h i T V=E(X−E[X])(X−E[X(Cov(]) = Xi, Xj))
Cov(X, Y) ρ(X, Y) = σ(X)σ(Y) Dans le cas multidimensionnel, soitX= (Xiarec’´,d)epyt-t Xi−E[Xi] (σi), et soient Δi=reoe.amseieln´ssno´naeLlds σi T matriceR=EΔΔlamaestteden,ioermcedecirttale´rro g´ene´ral(ρ(Xi, Xjt´egalementd´efin))e,onei´n-ntage.evi On a toujours−1≤ρ(X, Y)≤1, et d’autre partρ(X, Y) = 0silesdeuxvariablesnesontpascorre´le´es.Noterquel’inde´-pendanceimpliquelanon-corre´lation,maisquel’inversen’est pasforc´ementvrai(saufdanslecasGaussien).SiXetYsont compl`etementcorr´el´ees,|ρ(X, Y)|= 1, c’est qu’il existe des r´eelsa, b, ctels queaX+bY=c. SiX, Ysont des v.a. eta, bs,on´eeldesra
3.5.1 Application Lesdonne´esd’Hipparcosfurentre´duitespardeuxConsor-tiums,avecdesre´sultatsdonccorr´ele´s.Commentde´terminer lesvariationsducoefficientdecorr´elationdesparallaxes? On ne peut pas utiliser l’estimateur empirique P n ($Fi−$F)($Ni−$N) i=1 R=pP P n n 2 2 ($Fi−$F) ($Ni−$N) i=1i=1