URCA Hugo Harari-Kermadec2008-2009 harari@ecogest.ens-cachan.frEconometrie 1 : Modele lineaireI Outils d’algebre lineaireI.1 ProjectionsSoitX une matrice an lignes etp colonnes avecpn. On note classiquementX2M (R).R est sous-entendunpdans la suite.Proposition I.1 (Projection) Si X est de rang p alors1. la projection sur Vect(X) a pour matrice0 1 0P =X(X X) XXappartient aM ,nn2. la projection sur l’orthogonal de Vect(X) est0 1 0P ? =I P =I X(X X) X ;X n X n3. le rang de P est egal a la dimension de Vect(X) et est donne par la trace de P ,X X4. P est une matrice de projection doncX2 0P =P P =PX XX XI.2 Derivation matricielleSoit A2M et X2M alorsnp p1@ 0AX =A:@XSi A est symetrique (et donc n =p),@ 0X AX = 2AX:@XII Modele et estimationLe modele lineaire pour explique Y a l’aide de K variables explicatives et d’une constante s’ecrit pour uneobservation i :KXY = + x +" ;i K+1 k i;k ik=1c’est- a-direY =X +" ;i i i0 K+1avec X = (x ;:::;x ; 1)2M et = ( ;:::; ; ) 2R .i i;1 i;K 1;K+1 1 K K+1On a alors pour n observations :Y =X +E;0 n 0 n 0avec Y = (Y ;:::;Y ) 2R ,E = (" ;:::;" ) 2R et X = (X ;:::;X ) 2M .1 n 1 n 1 n n;K+11II.1 EstimationOn va utiliser les hypotheses suivantes :H : les colonnes de X sont lineairement independantes,1nH :E[EjX] = 02R .22H : Var(E) = I .3 nDe nition II.1 (Estimateur des moindres carres) L’estimateur des moindres carres est de ni par2^ = arginf jjY Xjj :K+12RProposition ...
Onpeutalorstesterlapertinenced’unevariableexplicative:sil’hypoth`ese“θkesc’uetqla”0=rtseteje,ee´ ke.-emi`veraailbeetstuli PropositionIII.2(Testdenullite´d’uncoefficient)SousH1etHG, le test de “θk= 0” contre “θk6= 0” de niveauαa pour zone critique : n o α ˆ Wn=|θk| ≥ˆσkqn−K−1(1−) 2 α α o`uqn−K−1(1−) =est le quantile de niveau1−diolutSedenu’ntde`an−K−1.tre´ilebseeddr´eg 2 2 Remarque III.1 (p-value)ate´rpretni’Leeluvap-ladeontiartpisfounsttr`esimportantdenacscenoettxee peud´eroutante.Onrappellequelap-valueestl’erreurdepremie`reesp`ecelimite. Silap-valuedutestestparexemplede37%,caveutdirequ’avecuneerreurdepremi`ereespe`cemeˆmegrande (jusqu’a`37%donc),onacceptel’hypoth`esenulle.Donconestvraimenttr`esconvaincuquelecoefficientsoit nul,c’est-a`-direquelavariablen’aitpasd’effet(line´aire)surY. Silap-valuevaut10%,onacceptedonca`90%(etafortiori`a95%)quelecoefficientsoitnul,c’estlecasou` l’interpr´etationestunpeuambivalente.Enfinsilap-valueesttr`espetite(disonsinf´erieurea`1%)alorsonest pratiquementsuˆrqu’ilfautrejeterl’hypoth`esenulle:lavariableestutilepourexpliquer(line´airement)Y.
IVPre´visions De´finitionIV.1(Pr´evisions)Pour une nouvelle valeur du vecteur des variables explicativesXn+1,norpe´dit bˆ Y=Xn+1θ. b Proposition IV.1SousH1etHG,Yest un estimateur sans biais deYn+1et 20 −10 b Y∼ NXn+1θ0X, σn+1(X X)X . n+1
V Analysede la variance P P n n n21 2 n poseZ=Zi(Z() =Z Pour un vecteurZ∈R, on i=1etSn i=1i−Z) . The´ore`meV.1(De´compositiondelavariance)SousH1, 2 22 b b S(Y) =S(Y) +S(E) n nn ⊥b b Preuve V.1naOesr`apd’,1itionII.laproposY=PXY+PXY=Y+Eocernnolredae`incos,elmm.Dluepe deXs´eeompoestced,1Y= (1, . . . ,1)∙YtecaVt`entiarppa(X). DoncY−Y´mdoecseesopalnemmose b b orthogonale deY−YetEO.anppiluqeensuiteleth´eoryPedeme`:erogaht 2 22 b b ||Y−Y||=||Y−Y||+||E ||. On note ces sommes respectivement SCT:SommedesCarre´sTotale SCE:Sommedescarr´esExpliqu´ee SCR:SommedesCarr´esdesRe´sidus. On a donc
SCT=SCE+SCR
. 2 D´efinitionV.1(Qualite´del’ajustement)Ondital´efinelsroRsuetemtn:italqulaajl’de´eqerusemiu c2 SCE SCR(n−K−1)σ 2 R= =1−= 1− SCT SCTSCT 2 2 Il est trivial que leR`a[0ientpaaprt,1]. Plus leRest proche de 1, plus l’ajustement est bon. S’il vaut 1, c’est bˆ que toutes les valeursYirapse´rpetidteaintmentsorfpaYi=Xiθ. 2 2 Ilfautne´anmoinsbiensegarderd’interpre´tertrophˆativementleR: unRde 0.an3tueptrˆer`etboesions peu de variables explicatives et queYrivadeangrneauraptemreplI.ecnaarercompredecontleseom`dedxu a`conditionsqu’ilsaientlemeˆmenombredevariablesexplicatives.Silenombredevariablesexplicative(K) 2 change, il faut introduire leRt´use.aj