Etonnante precision de la methode des moindres carres pour des series chronologiques issues de

De
Publié par

Niveau: Supérieur
Etonnante precision de la methode des moindres carres pour des series chronologiques issues de modeles lineaires fortement perturbes Stephane Junca, IUFM et Universite de Nice, Laboratoire J. A. Dieudonne, UMR CNRS 6621. 1 Introduction L'etude de series statistiques en classe demande souvent du temps pour rentrer les donnees. Ce qui nous limite dans la taille des echantillons. Pour gagner du temps et traiter tres rapidement des exemples de plus grande taille, j'utilise dans mes classes de preparation au C.A.P.E.S. des series de la forme (k, k+ek)nk=1, facile a rentrer et a illustrer graphiquement avec ma calculatrice a ecran retroprojectable. Pour des ”petites” perturbations ek, on n'est pas surpris de retrouver precisement la pente 1 avec la methode des moindres carres. On est alors tente de prendre des perturbations de plus en plus grandes. A la grande surprise de ma classe, la methode des moindres carres resiste tres bien a ce genre de traitement. Pour eclaircir ce mystere, cet article propose de nombreux exemples et des explications mathematiques et historiques de cette etonante stabilite de la methode des moindres carres. Il faut savoir que cette methode comprend bien plus que le probleme de l'ajustement affine. En general, il s'agit de trouver p parametres solutions d'un systeme lineaire rectangulaire. En pratique, on a beaucoup plus d'equations que d'inconnues et il s'agit de trouver la solution au sens des moindres carres [10].

  • coefficient de correlation

  • mmc

  • somme des carres des erreurs

  • perturbation

  • excellente approximation du modele reel

  • perturbation de moyenne

  • perturbation deterministe de taille

  • serie statistique


Publié le : mercredi 30 mai 2012
Lecture(s) : 43
Source : math.unice.fr
Nombre de pages : 15
Voir plus Voir moins

Etonnanteprecisiondelamethodedesmoindres carrespourdesserieschronologiquesissuesde modeles lineaires fortement perturbes StephaneJunca, IUFMetUniversitedeNice, Laboratoire J. A. Dieudonne, UMR CNRS 6621.
1 Introduction Letudedeseriesstatistiquesenclassedemandesouventdutempspourrentrerlesdonnees. Cequinouslimitedanslatailledesechantillons.Pourgagnerdutempsettraitertresrapidement desexemplesdeplusgrandetaille,jutilisedansmesclassesdepreparationauC.A.P.E.S.des seriesdelaforme( k, k + e k ) kn =1 , facile a rentrer et a illustrer graphiquement avec ma calculatrice a ecran retroprojectable. Pour des ”petites” perturbations e k , on n’est pas surpris de retrouver precisementlapente1aveclamethodedesmoindrescarres.Onestalorstentedeprendredes perturbations de plus en plus grandes. A la grande surprise de ma classe, la methode des moindres carresresistetresbienacegenredetraitement.Poureclaircircemystere,cetarticleproposede nombreuxexemplesetdesexplicationsmathematiquesethistoriquesdecetteetonantestabilite de la methode des moindres carres. Ilfautsavoirquecettemethodecomprendbienplusqueleproblemedelajustementane. Engeneral,ilsagitdetrouver p parametressolutionsdunsystemelineairerectangulaire.En pratique,onabeaucoupplusdequationsquedinconnuesetilsagitdetrouverlasolutionau sens des moindres carres [10]. Le cas p =1estdejafaitdesleCollegesansbiensˆurlepresenterdecettemaniere.Ene et lorsquelonchoisitdenassocierauneseriestatistique( x k ) kn =1 quunseulnombrerepresentatif: la moyenne m ,onresoudlesystemelineaire surdetermine : m = x k , k = 1 ,    , n a une inconnue et avec n equationsausensdesmoindrescarres.Cestadirequelonprendluniquenombre m quiminimiselecartq1 n ( uadratique moyen : n X x k  m ) 2 . k =1 Le cas p =2nestfaitquauLyceepourcertainesTerminalesdanslecadredajustemenent ane d’une nuage de points ( x k , y k ) kn =1 .IlenestainsipourlasectionES,desseriestechnolo-giques(parexemplelaseriesciencesettechnologiesdelagestion)etdesseriesprofessionnelles. Lutilisationcroissantedematerielinformatiqueneferaquerenforcercettetendance.Dautant plusquesonutilisationesttrescouranteapreslebacencoordonneessemilogoulog-log,en physique,enchimie,enbiologie,eneconomie,enscienceshumaines,...Pourleproblemede lajustementanelesinconnuessontlescoecientsdeladroite( , ),etlesequationssont y k = x k + , k = 1 ,    , n avec n > 2. Une fois encore la solution s’obtient en minimisant lamoyennedesecartsquadratiques( y k  ( x k + )) 2 . Ainsi, la methode nous fournit toujours une droite. Mais cette droite est-elle bien pertinente ? Par exemple, si le nuage de points est un echantillondepointsduneparaboleladroitefournieestsansinterˆet.Ilfautdoncavoirplus d’informations sur le nuage de points. Dans cet article nous ne traiterons que des cas issues de perturbations du modele lineaire. De plus nous supposerons que la serie des abscisses est arithmetique ,cequiestfrequentpourdesserieschronologiques.Danscecadrenousverronsque cettemethodeesttresecaceettresstable.
1
Commencons d’abord par bien poser le probleme. On suppose que deux caracteres statis-tiques y et x sontreliesdemanierelineaireouane: y = x + . (1) En pratique les mesures de y en fonction de celles de x sont perturbees. La perturbation sera representeeparlaserie( e k ) nk =1 . On obtient ainsi le modele lineaire perturbe : y k := x k + + e k , k = 1 ,    , n. (2) Apartirdelaseriestatistique( x k , y k ) kn =1 , on se propose de retrouver une approximation de et graˆcealacelebre m ethodedes m oindres c arres ( MMC )decouverteparCarlFriedrich Gauss en 1795 1 ,alorsquilnavaitque18ans!Gaussavaitdejaobtenuloptimalite(enun certain sens statistique) de la MMC pour estimer les coecien ts inconnus et lors de calculs astronomiques.Ainsi,ilretouvaquelquesanneesplustard,alasurprisegenerale,parlecalcul lastreCeres 2 que les astronomes avaient perdu de vue (au sens propre). Et, a trente ans, il devintledirecteurdelobservatoiredelUniversitedeGottingen. Aujourdhuis,lutilisationdescalculatricesetdestableursnousdonnefacilementaccesa lamethodedesmoindrescarres.Avecunesimplecalculatriceonvafabriquerdesseriesstatis-tiquesveri antlemodele(2).( e k ) k  1 representeraunesuitedeperturbationsdeterministesou aleatoires.Ensuite,ondemanderaanotrecalculatricedenousfourniruneapproximationdes coecientsdeladroitedumodeletheorique(1).Vouspourrezapprecierlaqualitedelapproxi-mation de la pente . Au cours de cet article, on fera des perturbations de plus en plus fortes, pour pousser la methode jusqu’a ses derniers retranchements. On traitera des cas de perturba-tionsdeterministesavec e k = (  1) k ou sin( k ).Ensuiteonsimuleradespertubationsaleatoires independantes:lecasenvisageparGauss.Onterminerapardespertubationsaleatoiresnon independantesaveclaloibinoˆmiale.OndonneralepointdevuedeLegendreetdeGauss, demontrantlecacitedeleurmethode.Pournepascouperle ldelexposition,onamisen ndarticlelesdemonstrationsmathematiquesdesresultatsenonces.
2Notations,formulesetcaracterearithmetiquedutemps n Pouruneseriestatistiqueadeuxvariables( x k , y k ) k =1 ,onpeutchercherunedroitedequation y = ax + b ,quiminimiseaumieuxlecartquadratiquemoyen R n ( a, b ) := 1 n X n ( y k  [ ax k + b ]) 2 . (3) k =1 Parlasuite,onvaetudierle etdelatailledelechantillonsurlescoecientsdeladroite cherchee.Onindiceraainsilescoecientsdeladroitedesmoindrescarrespar n . Des calculs classiques montrent que la droite optimale pour ce critere a pour coecien ts : a n := s x 2 y , b n := y  a n x, (4) s x aveclesnotationsusuellespourlesmoyennes,lesvariances,lacovariance,lecoecientde correlation,etlarelationentrelaformuledesresidusetlecoecientdecorrelation: x := n 1 n X x k , y := n 1 X n y k , e := 1 n n X e k , s 2 x := 1 n n X ( x k  x ) 2 , s y 2 := 1 n X ( y k  y ) 2 , (5) n k =1 k =1 k =1 k =1 k =1 s xy := 1 n n X ( x k  x ) ( y k  y ) ,  n := ss xx s yy , R n := R n ( a n , b n ) = s y 2 (1   n 2 ) . (6) k =1 1 Cette decouverte n’est publiee qu’en 1809 dans [4], soit quatre ans apres Adrien Marie Legendre dans [11]. Il enresultaunequerelledeprioriteentreLegendreetGauss. 2 Ceresestuneasterodedetresgrandetaille.
2
Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.

Diffusez cette publication

Vous aimerez aussi