La lecture en ligne est gratuite
Lire Télécharger

Etonnanteprecisiondelamethodedesmoindres carrespourdesserieschronologiquesissuesde modeles lineaires fortement perturbes StephaneJunca, IUFMetUniversitedeNice, Laboratoire J. A. Dieudonne, UMR CNRS 6621.
1 Introduction Letudedeseriesstatistiquesenclassedemandesouventdutempspourrentrerlesdonnees. Cequinouslimitedanslatailledesechantillons.Pourgagnerdutempsettraitertresrapidement desexemplesdeplusgrandetaille,jutilisedansmesclassesdepreparationauC.A.P.E.S.des seriesdelaforme( k, k + e k ) kn =1 , facile a rentrer et a illustrer graphiquement avec ma calculatrice a ecran retroprojectable. Pour des ”petites” perturbations e k , on n’est pas surpris de retrouver precisementlapente1aveclamethodedesmoindrescarres.Onestalorstentedeprendredes perturbations de plus en plus grandes. A la grande surprise de ma classe, la methode des moindres carresresistetresbienacegenredetraitement.Poureclaircircemystere,cetarticleproposede nombreuxexemplesetdesexplicationsmathematiquesethistoriquesdecetteetonantestabilite de la methode des moindres carres. Ilfautsavoirquecettemethodecomprendbienplusqueleproblemedelajustementane. Engeneral,ilsagitdetrouver p parametressolutionsdunsystemelineairerectangulaire.En pratique,onabeaucoupplusdequationsquedinconnuesetilsagitdetrouverlasolutionau sens des moindres carres [10]. Le cas p =1estdejafaitdesleCollegesansbiensˆurlepresenterdecettemaniere.Ene et lorsquelonchoisitdenassocierauneseriestatistique( x k ) kn =1 quunseulnombrerepresentatif: la moyenne m ,onresoudlesystemelineaire surdetermine : m = x k , k = 1 ,    , n a une inconnue et avec n equationsausensdesmoindrescarres.Cestadirequelonprendluniquenombre m quiminimiselecartq1 n ( uadratique moyen : n X x k  m ) 2 . k =1 Le cas p =2nestfaitquauLyceepourcertainesTerminalesdanslecadredajustemenent ane d’une nuage de points ( x k , y k ) kn =1 .IlenestainsipourlasectionES,desseriestechnolo-giques(parexemplelaseriesciencesettechnologiesdelagestion)etdesseriesprofessionnelles. Lutilisationcroissantedematerielinformatiqueneferaquerenforcercettetendance.Dautant plusquesonutilisationesttrescouranteapreslebacencoordonneessemilogoulog-log,en physique,enchimie,enbiologie,eneconomie,enscienceshumaines,...Pourleproblemede lajustementanelesinconnuessontlescoecientsdeladroite( , ),etlesequationssont y k = x k + , k = 1 ,    , n avec n > 2. Une fois encore la solution s’obtient en minimisant lamoyennedesecartsquadratiques( y k  ( x k + )) 2 . Ainsi, la methode nous fournit toujours une droite. Mais cette droite est-elle bien pertinente ? Par exemple, si le nuage de points est un echantillondepointsduneparaboleladroitefournieestsansinterˆet.Ilfautdoncavoirplus d’informations sur le nuage de points. Dans cet article nous ne traiterons que des cas issues de perturbations du modele lineaire. De plus nous supposerons que la serie des abscisses est arithmetique ,cequiestfrequentpourdesserieschronologiques.Danscecadrenousverronsque cettemethodeesttresecaceettresstable.
1
Commencons d’abord par bien poser le probleme. On suppose que deux caracteres statis-tiques y et x sontreliesdemanierelineaireouane: y = x + . (1) En pratique les mesures de y en fonction de celles de x sont perturbees. La perturbation sera representeeparlaserie( e k ) nk =1 . On obtient ainsi le modele lineaire perturbe : y k := x k + + e k , k = 1 ,    , n. (2) Apartirdelaseriestatistique( x k , y k ) kn =1 , on se propose de retrouver une approximation de et graˆcealacelebre m ethodedes m oindres c arres ( MMC )decouverteparCarlFriedrich Gauss en 1795 1 ,alorsquilnavaitque18ans!Gaussavaitdejaobtenuloptimalite(enun certain sens statistique) de la MMC pour estimer les coecien ts inconnus et lors de calculs astronomiques.Ainsi,ilretouvaquelquesanneesplustard,alasurprisegenerale,parlecalcul lastreCeres 2 que les astronomes avaient perdu de vue (au sens propre). Et, a trente ans, il devintledirecteurdelobservatoiredelUniversitedeGottingen. Aujourdhuis,lutilisationdescalculatricesetdestableursnousdonnefacilementaccesa lamethodedesmoindrescarres.Avecunesimplecalculatriceonvafabriquerdesseriesstatis-tiquesveri antlemodele(2).( e k ) k  1 representeraunesuitedeperturbationsdeterministesou aleatoires.Ensuite,ondemanderaanotrecalculatricedenousfourniruneapproximationdes coecientsdeladroitedumodeletheorique(1).Vouspourrezapprecierlaqualitedelapproxi-mation de la pente . Au cours de cet article, on fera des perturbations de plus en plus fortes, pour pousser la methode jusqu’a ses derniers retranchements. On traitera des cas de perturba-tionsdeterministesavec e k = (  1) k ou sin( k ).Ensuiteonsimuleradespertubationsaleatoires independantes:lecasenvisageparGauss.Onterminerapardespertubationsaleatoiresnon independantesaveclaloibinoˆmiale.OndonneralepointdevuedeLegendreetdeGauss, demontrantlecacitedeleurmethode.Pournepascouperle ldelexposition,onamisen ndarticlelesdemonstrationsmathematiquesdesresultatsenonces.
2Notations,formulesetcaracterearithmetiquedutemps n Pouruneseriestatistiqueadeuxvariables( x k , y k ) k =1 ,onpeutchercherunedroitedequation y = ax + b ,quiminimiseaumieuxlecartquadratiquemoyen R n ( a, b ) := 1 n X n ( y k  [ ax k + b ]) 2 . (3) k =1 Parlasuite,onvaetudierle etdelatailledelechantillonsurlescoecientsdeladroite cherchee.Onindiceraainsilescoecientsdeladroitedesmoindrescarrespar n . Des calculs classiques montrent que la droite optimale pour ce critere a pour coecien ts : a n := s x 2 y , b n := y  a n x, (4) s x aveclesnotationsusuellespourlesmoyennes,lesvariances,lacovariance,lecoecientde correlation,etlarelationentrelaformuledesresidusetlecoecientdecorrelation: x := n 1 n X x k , y := n 1 X n y k , e := 1 n n X e k , s 2 x := 1 n n X ( x k  x ) 2 , s y 2 := 1 n X ( y k  y ) 2 , (5) n k =1 k =1 k =1 k =1 k =1 s xy := 1 n n X ( x k  x ) ( y k  y ) ,  n := ss xx s yy , R n := R n ( a n , b n ) = s y 2 (1   n 2 ) . (6) k =1 1 Cette decouverte n’est publiee qu’en 1809 dans [4], soit quatre ans apres Adrien Marie Legendre dans [11]. Il enresultaunequerelledeprioriteentreLegendreetGauss. 2 Ceresestuneasterodedetresgrandetaille.
2