La lecture à portée de main
Description
Informations
Publié par | Onkou |
Nombre de lectures | 35 |
Langue | Français |
Extrait
7
R
7
6
6
b
w
6
3
5
7
4
7
5
4
b
6
w
6
w
2
N
5
2
2
7
6
2
5
6
7
3
7
7
3
6
kk
6
2
6
w
4
w
3
w
7
7
4
CHAPITRE 9
La régression linéaire multiple
Résumé : Le chapitre précédent a introduit le modèle statistique de la régression
linéaire simple (une variable quantitative comme fonction affine d’une seule autre variable
quantitative, à qui s’ajoute un aléa).
Objectif : Nous étudions ici le modèle de la régression linéaire multiple où l’on dis-
pose de plusieurs variables explicatives pour modéliser la variable à expliquer. Parfois,
il y a tellement de v explicatives qu’il s’agit d’en sélectionner un sous-ensemble
permettant de prédire suffisamment efficacement la variable à expliquer.
1. Le modèle linéaire multiple
On part toujours d’observations Y ;:::;Y à expliquer, mais cette fois, comme à1 n
l’exercice 8.9, on dispose, pour chaque Y , de plusieurs variables explicatives, disons k,j
notéesx ;:::;x . On postule un modèle de la formej;1 j;k
Y = + x +:::+ x +" ; j=1;:::;n;j 0 1;0 1;j k;0 k;j j
2où" ;:::;" sont des variables aléatoires i.i.d. selon une loi normale 0; . LesY sont1 n j0
observées, lesx sont observées voire choisies par le statisticien; les coefficients dep;j p;0
la relation linéaire, de même que les erreurs aléatoires" ne le sont en revanche pas.j
On note ce modèle postulé sous la forme compacte suivante,
Y =X +"
0
où
0
Y 1 x x "1 1;1 k;1 1
1;0. . . . .. . . . .Y = ; X= ; = ; et "= :.. . . . .0 ..
Y 1 x x "n 1;n k;n n
k;0
X est connu,Y est observé, mais est inconnu (il est même à estimer et à tester) et "
0
n’est pas observé.
On effectue une hypothèse supplémentaire : que X soit injective. Ici, on ak+1<n,
sans quoi il existe une solution déterministe au système d’équations donnant le modèle
(on pourrait tuer tout aléa). De manière équivalente, on suppose donc que X est de rang
pleink+1, que ses colonnes sont non liées.
T
Exercice 9.1 (Un peu d’algèbre linéaire...). Montrez que dans ce cas, X X est une
matrice (k+1) (k+1) inversible.
1.1. Estimation du vecteur des coefficients. On considère l’estimateur