La démarche économétrique : principes et difficultés illustrés à partir d'un exemple - article ; n°1 ; vol.157, pg 35-47

De
Publié par

Économie rurale - Année 1983 - Volume 157 - Numéro 1 - Pages 35-47
This article is based on a real world example from regional economics. It is a mathematical presentation of the principles of econometric theory. Its objective is to acquaint readers with a simple mathematical training. Regression is used throughout the text to demonstrate the points made.
Model development is stressed early on. There is also a discussion of least squares fitting. Special emphasis is put on model evaluation : how well do the coefficient estimates conform to a priori expectations ? Are the signs and magnitude Correct ? Are the coefficients different from zero ? The consequence of multicollinearity and the effects of various specification errors are discussed in detail. A final section is devoted to covariance analysis and dummy variable technique.
Cet article est basé sur un exemple réel emprunté à l'économie régionale. Il propose une présentation non théorique de l'économétrie. Il vise à donner un aperçu de la démarche aux lecteurs dont la formation mathématique est élémentaire. La mise en évidence des différentes questions abordées repose sur le modèle de la régression.
On insiste d'abord sur la construction du modèle et on discute l'ajustement par les moindres carrés. L'évaluation du modèle est traitée en détails : comparaison entre estimations et valeurs a priori, jugement sur les signes et les ordres de grandeur, influence des variables exogènes. Les conséquences de la colinéarité ainsi que les effets de différentes erreurs de spécification donnent lieu à une discussion. Une dernière partie est consacrée à l'analyse de la covariance et à la technique des variables indicatrices.
13 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : samedi 1 janvier 1983
Lecture(s) : 26
Nombre de pages : 14
Voir plus Voir moins

Mr François Bonnieux
La démarche économétrique : principes et difficultés illustrés à
partir d'un exemple
In: Économie rurale. N°157, 1983. pp. 35-47.
Abstract
This article is based on a real world example from regional economics. It is a mathematical presentation of the principles of
econometric theory. Its objective is to acquaint readers with a simple mathematical training. Regression is used throughout the
text to demonstrate the points made.
Model development is stressed early on. There is also a discussion of least squares fitting. Special emphasis is put on model
evaluation : how well do the coefficient estimates conform to a priori expectations ? Are the signs and magnitude "Correct" ? Are
the coefficients different from zero ? The consequence of multicollinearity and the effects of various specification errors are
discussed in detail. A final section is devoted to covariance analysis and dummy variable technique.
Résumé
Cet article est basé sur un exemple réel emprunté à l'économie régionale. Il propose une présentation non théorique de
l'économétrie. Il vise à donner un aperçu de la démarche aux lecteurs dont la formation mathématique est élémentaire. La mise
en évidence des différentes questions abordées repose sur le modèle de la régression.
On insiste d'abord sur la construction du modèle et on discute l'ajustement par les moindres carrés. L'évaluation du modèle est
traitée en détails : comparaison entre estimations et valeurs a priori, jugement sur les signes et les ordres de grandeur, influence
des variables exogènes. Les conséquences de la colinéarité ainsi que les effets de différentes erreurs de spécification donnent
lieu à une discussion. Une dernière partie est consacrée à l'analyse de la covariance et à la technique des variables indicatrices.
Citer ce document / Cite this document :
Bonnieux François. La démarche économétrique : principes et difficultés illustrés à partir d'un exemple. In: Économie rurale.
N°157, 1983. pp. 35-47.
doi : 10.3406/ecoru.1983.2996
http://www.persee.fr/web/revues/home/prescript/article/ecoru_0013-0559_1983_num_157_1_2996ECONOMIE n° 157, septembre-octobre RURALE 1983
LA DEMARCHE ECONOMETRIQUE :
PRINCIPES ET DIFFICULTÉS ILLUSTRÉS À PARTIR D'UN EXEMPLE
F. BONNIEUX
INRA - Rennes
Résumé :
Cet article est basé sur un exemple réel emprunté à l'économie régionale. Il propose une présentation non théori
que de l'économétrie. Il vise à donner un aperçu de la démarche aux lecteurs dont la formation mathématique est élé
mentaire. La mise en évidence des différentes questions abordées repose sur le modèle de la régression.
On insiste d'abord sur la construction du modèle et on discute l'ajustement par les moindres carrés. L'évaluation
du modèle est traitée en détails : comparaison entre estimations et valeurs a priori, jugement sur les signes et les ordres
de grandeur, influence des variables exogènes. Les conséquences de la colinéarité ainsi que les effets de différentes
erreurs de spécification donnent lieu à une discussion. Une dernière partie est consacrée à l'analyse de la covariance
et à la technique des variables indicatrices.
Summary :
BUILDING AND USING OF ECONOMETRIC MODELS : A PROBLEM - SOLVING PAPER
This article is based on a real world example from regional economics. It is a mathematical presentation of the
principles of econometric theory. Its objective is to acquaint readers with a simple training. Regression
is used throughout the text to demonstrate the points made.
Model development is stressed early on. There is also a discussion of least squares fitting. Special emphasis
is put on model evaluation : how well do the coefficient estimates conform to a priori expectations ? Are the signs
and magnitude "Correct" ? Are the coefficients different from zero ? The consequence of multicollinearity and the
effects of various specification errors are discussed in detail. A final section is devoted to covariance analysis and
dummy variable technique.
sons l'hypothèse économique que les valeurs observées de Y ne Cet article n'a pas pour objectif d'exposer les méthodes de
sont pas simplement dues au hasard mais dépendent de diffél'économétrie qui font l'objet de nombreux manuels de niveaux
théoriques divers (1). Il est consacré à une présentation de la rents facteurs, parmi lesquels le système de production, la struc
démarche économétrique à partir d'un exemple emprunté au ture des exploitations, le niveau de développement économique
des régions. domaine de l'économie régionale. Aussi n'aborde-t-il que les pro
blèmes économétriques rencontrés lors d'une recherche particu- On fait ainsi l'hypothèse qu'il existe un ensemble de variables lièredont les aspects économiques sont traités par ailleurs (Bon- noté t dont les variations permettent d'expliquer les variations
nieux et al., 1980). Les données de base sont de type cross-section observées de Y. On suppose donc l'existence d'une relation fonc
puisqu'il s'agit d'une coupe régionale. Les questions spécifiques tionnelle :
que posent l'analyse de séries chronologiques ne sont donc pas
envisagées ici. A fortiori le regroupement de plusieurs coupes
(données de type spatio temporel) n'est pas considéré. Sur le plan qui exprime la dépendance de la variable Y par rapport aux variades instruments statistiques, il se limite au modèle de la régres bles explicatives de l'ensemble e . Les variations de ces dernièsion linéaire multiple. Ce dernier, malgré sa grande simplicité
res sont observées indépendamment de la relation fonctionnelle, formelle, correspond à un processus d'abstraction très import aussi peut-on parler de variables indépendantes. ant et permet de poser nombre de questions fondamentales de
La théorie économique est rarement explicite sur la liste des l'économétrie. Il permet par ailleurs de passer en revue des dif
variables qui constituent l'ensemble £ et sur la forme mathéficultés liées à l'interprétation des résultats et d'aborder celles
matique de la relation fonctionnelle. Spécifier un modèle consqui sont introduites par le non-respect de certaines hypothèses
iste donc à préciser ces points. Il existe néanmoins des cas trfondamentales.
iviaux où il n'y a pas d'étape de spécification, c'est le cas des
équations institutionnelles et des équations de définition. Les pre
mières sont déterminées par des lois, des décrets, des arrêtés, par 1. SPECIFICATION D'UN MODELE
Sans entrer dans les détails, considérons le problème des dis 1. Une bibliographie commentée d'ouvrages généraux d'économétrie est parités régionales de revenu dans l'agriculture européenne. Plus fournie à la fin de ce numéro. précisément intéressons-nous à une variable notée Y qui mesure 2. Nous utilisons un découpage de la CEE en 295 régions qui corresponla valeur ajoutée agricole par actif (agricole) des différentes dent pour la France aux départements. Les départements de la Région
régions de la Communauté Economique Européenne (2). Parisienne sont toutefois agrégés pour former deux unités seulement.
■35- exemple une équation qui exprime le montant d'un impôt en X2, X3, X4 et X5 décrivent l'agriculture et la variable X6 rend
fonction de son assiette. Quant aux secondes il s'agit d'identit compte d'une façon synthétique du niveau de développement éco
és. C'est par exemple le cas de l'équation qui exprime que le nomique. La valeur ajoutée agricole par actif est mesurée en cen
revenu est égal à la consommation plus l'investissement. Dans taines d'unités de compte.
ces deux cas les variables indépendantes qui interviennent et la Pour estimer les paramètres du modèle et la loi de probabilité relation fonctionnelle sont parfaitement déterminées. du terme aléatoire l'économètre utilise un échantillon d'obser
La fonction linéaire est largement utilisée à cause de sa sim vations de taille N (5). Dans notre exemple N est égal à 295, nomb
plicité mais surtout parce qu'elle fournit une bonne approximat re de régions de la CEE. En indicant les observations par i, le
ion de fonctions plus générales dans certains domaines de varia modèle s'écrit :
tions des variables indépendantes. En outre, comme nous le ver + b2 Xi2 + . . . + bK XiK + i = 1, . . . N rons, les résultats obtenus sont relativement faciles à interprét (N = 295) er. L'approximation linéaire présente donc deux avantages évi
dents, à l'inverse elle est bien sûr source d'erreur (Cramer, Nous ne considérons ici que des modèles linéaires où la varia1971, p. 79-83). ble dépendante est continue. Les variables indépendantes peuDans le problème d'économie régionale que nous considérons vent être par contre continues ou qualitatives (on parle alors plus
de très nombreux facteurs spécifiques aux diverses régions inte volontiers de facteurs). Lorsque toutes les variables explicatives
rviennent et influencent le niveau de valeur ajoutée. De façon sont des facteurs, il est intéressant d'exploiter cette particularité générale on est conduit à négliger certains facteurs explicatifs et d'utiliser les techniques d'analyse de la variance. Si l'on a à
et à ne faire intervenir que quelques variables explicatives dans faire à la fois à des variables continues et à des facteurs l'analyse
le modèle. de la covariance présente un intérêt pratique important. Nous
Aux sources d'erreur qui viennent d'être évoquées il convient la présenterons en développant l'exemple.
d'ajouter les erreurs de mesure. Il est en effet bien difficile de Pour estimer les paramètres du modèle, il est nécessaire de se
mesurer les notions introduites par la théorie économique. Enfin fixer auparavant des hypothèses précises qui portent sur la loi
il est fort possible que le problème étudié ne puisse pas être com de probabilité du terme aléatoire du modèle. Comme on l'a vu, plètement appréhendé par une démarche déterministe. l'hypothèse qui pose que l'espérance mathématique de ce terme
Pour représenter la résultante de ces phénomènes : erreur d'ap est nulle n'a pas de caractère contraignant :
proximation et de mesure, variables négligées et caractère incer E (ej) = 0 i = 1 . . . N
tain du problème, on introduit une variable aléatoire dans le
modèle. où la lettre E désigne l'opérateur espérance (mathématique). Les
hypothèses d'homoscédasticité et d'absence d'autocorrélation Le passage fondamental d'hypothèses économiques détermin
sont plus limitatives, aussi de nombreux développements de l'éco- istes à un modèle économétrique aléatoire se fait donc par l'i
nométrie tentent de les dépasser. La première exprime que, quelle ntroduction d'un terme aléatoire. Celui-ci recouvre diverses
que soit l'observation considérée, la variance du terme aléatoire notions délicates à cerner et il est difficile de faire des hypothès
est la même, ce qui s'écrit : es précises sur la loi de probabilité qui le régit. Cette loi décrit
la population fictive dont est extrait l'échantillon d'observations, E (e]) = s2 i = 1 . . . N
c'est donc ce terme qui va nous permettre de généraliser un cer
s2 est un paramètre fini et strictement positif. D'après la tain nombre de caractéristiques constatées sur l'échantillon. Les
seconde hypothèse, les termes aléatoires associés à deux obsercaractéristiques trouvées sur l'échantillon vont permettre de pré
vations différentes ne sont pas corrélés, ce qui s'écrit : ciser certains aspects permanents du phénomène étudié. Une des
conséquences de cette abstraction est alors de nous contraindre E (e; e3) = 0 i,j = 1 . . . N et i 4 j
à ne porter que des jugements en probabilité.
Notons ici que nous ne faisons pas d'hypothèse sur l'imporSi Y désigne la variable dépendante (à expliquer) et tance de la variance du terme aléatoire, il est cependant clair que X2 . . . XK les variables indépendantes (explicatives) prises en les résultats seront d'autant meilleurs qu'elle sera plus petite. compte, le modèle s'écrit :
Nous présenterons un cas d'hétéroscédasticité à partir du déveY = b, + b2 X2 + + e loppement de l'exemple. Dans l'étude de phénomènes histori
ques la présence d'autocorrélation est fréquente. Sur des donLe terme constant bj qui correspond à une ordonnée à l'ori
nées régionales, on peut rencontrer des cas de corrélation spa- gine et les coefficients b2 . . . bK sont des paramètres incon
nus (3), e est une variable aléatoire dont la loi de probabilité 3. Le modèle avec terme constant est d'application plus générale que le est elle aussi inconnue. Le terme constant du modèle représente modèle sans terme constant. Formellement on peut définir une variable la composante systématique des phénomènes qui ne sont pas X1 identiquement égale à l'unité, ce qui permet d'écrire le modèle sous la forme suivante : directement pris en compte. Le terme aléatoire e figure donc les
Y = b, X, + b2 X2 + + bK XK + e écarts aléatoires par rapport à cette composante systématique,
On note la double linéarité par rapport aux variables explicatives et par on peut par conséquent supposer que son espérance mathémati rapport aux paramètres inconnus. Seule cette deuxième hypothèse est que est nulle (4). importante. En effet supposons par exemple qu'une variable Z intervienne
par l'intermédiaire de son logarithme, il suffit pour se ramener à la linéaDans notre exemple Y désignant la valeur ajoutée agricole par rité par rapport aux variables explicatives de faire la transformation actif, nous retenons 5 variables explicatives donc K = 6 (nomb X = Log Z et d'introduire cette nouvelle variable au lieu de Z dans le
modèle. L'hypothèse de linéarité ne porte donc que sur les paramètres. re de variables explicatives plus le terme constant). Celles-ci sont
4. Cette hypothèse est peu restrictive puisqu'elle n'exclut que le cas où définies de la façon suivante : cette espérance n'est pas définie. L'hypothèse de nullité est rendue nécessX2 : terres labourables \ aire pour des raisons d'identification des paramètres du modèle (Malin-
vaud, 1978, p. 88). De toute façon, il est toujours possible d'incorporer au X3 : prairies permanentes > ha par actif agricole terme constant une espérance mathématique qui ne serait pas nulle. X4 : cultures ; 5. Si le modèle ne comptait pas de terme aléatoire, il suffirait de K obser
vations pour calculer le terme constant et les -coefficients des variables X5 : cheptel en unités gros bovins par actif agricole explicatives. Puisqu'il n'y a pas de solution exacte, l'estimation de K paraX6 : pourcentage de la population active employée dans mètres nécessite N > K observations, la différence N — K est le nombre
l'agriculture. de degrés de liberté.
-36- "i" "x,2" Y" ceux-ci sortent du domaine de cet article et ne sont évotiale,
qués que pour mémoire (Paelinck et Klaassen, 1979).
Y = x,= x,- Enfin, pour finir de spécifier le modèle, précisons que les varia
bles explicatives sont des variables certaines (non aléatoires) et
qu'il n'existe pas de relation linéaire entre elles. Cette dernière
hypothèse est très importante. Lorsqu'elle n'est pas vérifiée on
se heurte au difficile problème de la colinéarité qui a de nomb Y est le vecteur des observations sur la variable dépendante, X,
reuses incidences pratiques. Nous aurons l'occasion de revenir figure la variable identiquement égale à l'unité (8), X2 . . . , XK
sur ce problème. sont les vecteurs d'observation sur les variables explicatives. Il
est commode de définir la matrice à N lignes et K colonnes : L'hypothèse de normalité du terme aléatoire (6) permet après
l'étape d'estimation d'élaborer des tests d'hypothèses et de cons X = (X,X2 . . . XK) truire des intervalles de confiance. Dès lors que l'on a de grands
ainsi que le vecteur à K éléments des paramètres à estimer : échantillons, ce qui est notre cas ici, cette hypothèse n'est guère
limitative. Enfin, signalons que pour obtenir certains résultats
asymptotiques, il faut poser des conditions sur le comportement b,
de l'échantillon lorsque sa taille tend vers l'infini. b = Tel qu'il vient d'être spécifié ce modèle est connu sous le nom
de modèle de la régression linéaire multiple. Il est intéressant de
l'écrire sous une forme un peu différente. La variable dépen
dante est aléatoire par l'intermédiaire du terme aléatoire, on peut
alors calculer son espérance mathématique : On peut alors adopter l'écriture condensée du modèle :
E (Yj) = b, + b2Xi2 + + bKXiK i = 1 N Y
On détermine de même sa variance : E(Y) = X b.
Var (Yj) = s2 i = 1 . . . N
et on vérifie que pour deux observations différentes i et j, les
valeurs de Y; et de Yj ne sont pas corrélées. Ainsi le modèle pose
que les valeurs de la variable dépendante sont engendrées par
un processus aléatoire. Son espérance dépend linéairement des
variables explicatives par l'intermédiaire de paramètres incon
nus et sa variance est inconnue. Signalons que lorsque les varia
bles explicatives ne sont plus certaines, mais aléatoires, on peut
aussi donner une interprétation du modèle (7).
2. ESTIMATION ET PROPRIÉTÉS DES ESTIMATEURS FigUre 1 - Agression représentée dans l'espace des observations
On estime tout d'abord les paramètres b,, b2, . . . bK en Dans l'espace des observations les vecteurs colonnes de la
appliquant la méthode des moindres carrés, puis on s'intéresse matrice X engendrent un sous-espace vectoriel V(X) de dimens
à l'estimation de la variance s2. L'emploi de la méthode des moin ion égale à K puisque les variables explicatives sont linéairement
dres carrés est justifié a posteriori par les propriétés des estima indépendantes. La figure 1 représente le cas où K = 2. Le modèle
teurs obtenus. Afin d'éviter au maximum des considérations tech comporte un terme aléatoire donc le vecteur Y n'appartient pas
niques qui risqueraient d'être fastidieuses donnons une présen à V(X), par contre le vecteur espérance mathématique E(Y) = Xb
tation géométrique de la méthode des moindres carrés et des est est situé dans ce sous-espace vectoriel.
imateurs obtenus. On recherche un vecteur Y situé dans V(X) pour estimer E(Y).
Les observations sur la variable dépendante et les variables La méthode des moindres carrés consiste à choisir la projection
explicatives permettent de définir des vecteurs de l'espace eucli orthogonale du vecteur Y sur le sous-espace vectoriel V(X),'ce
dien à N dimensions, appelé ici espace des observations. De façon que l'on écrit :
naturelle nous les notons : Y - Y + ê
Y est appelé vecteur ajusté et ê vecteur des résidus. Pour est
6. L'hypothèse de normalité concerne des quantités non observables. On imer les paramètres il suffit enfin de calculer les coordonnées de doit juger de son caractère raisonnable en considérant ses implications. Y par rapport à la base de V(X) formée par les colonnes de la Il est clair qu'on l'introduit en premier lieu pour des raisons techniques. matrice X. Elle permet en effet d'obtenir des conclusions puissantes et qui peuvent
être confrontées aux faits observés. On peut aussi évoquer une raison plus Y = xb théorique. Dans la mesure où les facteurs explicatifs qui sont négligés
dans le modèle sont très nombreux, indépendants entre eux et où l'i 62X 2X2 bKXK nfluence de chacun est négligeable par rapport à l'influence de tous les
autres, leur somme est approximativement distribuée selon une loi Les coordonnées 6j, 62 . . . . bKsont uniques, donc le problème normale. d'estimation est résolu (9). 7. On ne considère plus alors la loi de probabilité de la variable dépen
dante mais sa loi conditionnelle par rapport aux variables explicatives. Ce 8. X1 est un vecteur particulier puisqu'il porte la première bissectrice de qui après tout est naturel dans la mesure où notre information se limite l'espace des observations. à l'échantillon. Dans notre exemple au lieu de s'intéresser à la loi de pro
babilité de la valeur ajoutée agricole par actif on s'intéresserait alors à 9. Notons ici que si les variables explicatives étaient linéairement dépencette loi conditionnée par les valeurs des variables qui décrivent l'agricul dantes, la dimension du sous-espace vectoriel V(X) serait strictement inféture et le niveau de développement des régions de la CEE. L'avantage de rieure à K. Il n'y aurait donc pas un système unique de coordonnées de cette interprétation est d'autoriser ces variables à être aléatoires (Malin- Y par rapport aux vecteurs X,, X, .... X,,. C'est donc bien l'indépendance
vaud, 1978, p. 86-87). linéaire qui assure l'unicité de ta solution.
-37- est intéressant de donner une forme explicite de 6. Pour ce A mesure que N croît la courbe représentative de f(6h) tend Il
faire il suffit d'écrire que le vecteur des résidus est orthogonal à se concentrer autour de la vraie valeur bh du paramètre.
au sous-espace vectoriel V(X), ce qui équivaut à : En général les économètres privilégient le critère de conver
X'X 6 = X'Y où X' est la matrice transposée de X. gence en probabilité plutôt que l'absence de biais. En effet un
estimateur biaisé mais convergent en probabilité peut ne pas être Cette équation est connue sous le nom d'équation normale et égal en moyenne à la valeur du paramètre, mais l'approcher admet la solution unique : asymptotiquement. C'est un comportement plus sécurisant que
celui d'un estimateur qui serait sans biais mais tendrait à diver
V ger asymptotiquement de la valeur du paramètre (Bibby et Tou-
b = = (X'X)-i X'Y tenburg, 1977 ; chapitre 2).
La méthode des moindres carrés fournit donc un estimateur
qui satisfait un certain nombre de critères statistiques ce qui jus
tifie son utilisation. Pour achever l'estimation du modèle, il nous On pçut vérifier une propriété de l'estimateur du terme cons
reste à estimer la variance s2. L'idée est de baser un estimateur tant : _ _ _ sur la longueur du vecteur des résidus. On montre que : = Y — 62 X2 . . . . — bK XK 6j
«? où Y, X2, . . . XK désignent les moyennes arithmétiques des dif S* = i- I férentes variables. N — K Il est facile de montrer que 6 est un estimateur sans biais de
b, ce qui signifie que l'espérance mathématique de la distribu où ê! . . . . êN sont les composantes du vecteur ê, est un esttion de probabilité de b est égal à b. L'absence de biais est une imateur sans biais et convergent en probabilité de s2. propriété intéressante mais qui n'implique rien en ce qui con
On peut aller plus loin et montrer que la matrice des variancerne la dispersion de l'estimateur. Ainsi un estimateur peut-il
ces et covariances de l'estimateur 6 vaut s2(X'X)-', ce qui être sans biais et très dispersé, ce qui peut conduire à lui préfé
s'écrit explicitement : rer un estimateur faiblement biaisé et moins dispersé. Il faut donc
s'interroger sur l'efficacité des estimateurs, mais il s'agit là d'une
notion difficile à manipuler dans le cas général. 6K)~ ' " n lXa -XiK var (6|) cov(6!,62) cov(6|, L'estimateur des moindres carrés 6 dépend linéairement des cov (6,, 62) var (62) cov (62, 6k) I X» Ï, X?, observations sur la variable dépendante. Limitons-nous à la classe
des estimateurs démette forme et plus particulièrement aux est
imateurs linéaires sans biais. Parmi ceux-ci les estimateurs 6ls cov(6), 6k) cov (62,61c) var (6k) . . 6K obtenus par la méthode des moindres carrés sont de
variance minimale. La des carrés fournit donc
les estimateurs linéaires sans biais les plus efficaces du terme cons
Pour estimer cette matrice il suffit de substituer s2 à s2 ce qui tant et des coefficients du modèle. On dit encore que b est le
fournit les estimateurs des variances et des covariances du terme meilleur estimateur linéaire sans biais de b.
constant et des coefficients du modèle. Pour compléter cette discussion des propriétés de l'estima
La variance estimée de 6h (h = 1 . . . K) s'obtient donc en teur b indiquons qu'asymptotiquement il est très proche de b
multipliant s2 par le he terme de la diagonale de la matrice au sens suivant : lorsque la taille de l'échantillon tend vers l'in
(X'X)-1 . On obtient de même la covariance estimée de 6h et bk fini la probabilité que le biais soit arbitrairement faible tend vers
(h, k = 1 . . . K, h ^ k) en multipliant s2 par le terme de la un. On dit que 6 converge vers b en probabilité. Ce qu'on peut
he ligne et ke colonne de la matrice (X'X)—1. Désignons par sjL illustrer en figurant la densité de probabilité f(bh) de 6h
(h = 1,2, ... K) pour différentes valeurs de N. la variance estimée de 6h et par s^k la covariance estimée de bh
et 6k.
N très grand Si on suppose que le terme aléatoire suit la loi normale (10),
on montre que
shh
suit la loi du t de Student à N — K degrés de liberté.
Ce résultat permet de construire des intervalles de confiance
pour le terme constant et les coefficients du modèle, faire des
tests d'hypothèse sur ces mêmes paramètres. Désignons par ta
la valeur t de Student lue dans la table qui a une probabilité a
d'être dépassée en valeur absolue. L'intervalle de confiance à N grand
(1 — a) % pour bh est donnée par :
ce qui signifie que la probabilité que bh appartienne à l'inter
valle
(6h — ^ shh, 6h + ta shh) est égale à 1 — a. petit
h 10. Si cette hypothèse n'est pas vérifiée, on peut cependant justifier les
résultats qui suivent par des considérations asymptotiques. Elles repoFigure 2. - Convergence en probabilité sent sur le théorème central limite.
-38- Supposons que l'on désire tester l'hypothèse d'influence sur Comme nous l'avons déjà remarqué le choix du niveau de con
la variable dépendante de la variable Xh. Ce qui équivaut à tes fiance du test n'a pas un caractère arbitraire. Si le test a pour
objet la confirmation d'une hypothèse solide on se contente d'un ter la nullité de bh. On considère alors la quantité :
niveau de confiance plus faible que s'il remet en cause une théor
ie solidement établie. On touche ici du doigt un des problèmes
fondamentaux de l'économétrie, à savoir le rôle exact des a priori Si ce rapport est supérieur en valeur absolue à ta , on rejette
économiques dans l'analyse des résultats quantitatifs. Ainsi il l'hypothèse nulle, donc implicitement on accepte l'hypothèse
est déjà établi que le système de production et le degré de déved'influence significative de Xh avec une probabilité égale à
1 — a. Lorsqu'on fait ce test et plus généralement tout test sta loppement influencent le niveau de valeur ajoutée. Les tests sur
la nullité des effets des variables qui les décrivent ont pour objet tistique, on se fixe une règle d'acceptation ou de rejet avant d'exa
une simple vérification. Un niveau de confiance de 0,95 ou évenminer les données. Supposons que l'on prenne le seuil de
a = 0,05 cela signifie que le rejet de l'hypothèse nulle lorsqu'elle tuellement moins apparaît ainsi suffisant, cette valeur correspond
à la pratique économétrique courante. Cette attitude est cepenest vraie se produit avec une probabilité de 5 % . Il est clair que
dant contestable car elle revient à négliger l'arbitrage entre le le choix du seuil dépend du contexte pratique dans lequel on se
situe. risque de première espèce et le risque de seconde espèce (11).
Signalons que dans le cas de notre exemple nous aboutirons aux Un autre test usuel vise à comparer les influences de deux varia mêmes conclusions pour un niveau de confiance plus élevé. Par bles Xh et Xk, c'est-à-dire les coefficients bh et bk. Dans le cas
exemple pour 0,99 on lit la valeur critique ^ 01 = 2,576. En consimple où l'on s'interroge sur leur égalité on forme le rapport
clusion les calculs confirment nos hypothèses a priori sur l'ide la différence bh — bk à son écart type : nfluence des variables indépendantes introduites comme variables
6h — 6w explicatives du niveau de valeur ajoutée agricole par actif.
On obtient les intervalles de confiance à 0,90 suivant pour les
52 hh coefficients de :
terres labourables : 1,17 1,62 b2 Si ce rapport est en valeur absolue supérieur à ta . on rejette
: — 0,81 — 0,38 prairies permanentes l'hypothèse de nullité de la différence bh — bk c'est-à-dire qu'on b3
conclut que les influences sont inégales avec une probabilité égale cultures : 3,00 5,47 b4 à 1 — a .
cheptel : 0,26 0,56 b5 Pour illustrer notre propos, seulement deux catégories de tests : — 0,59 — 0,45 actifs agri. °/o b6 ont été présentées. Outre les tests basés sur la loi du t, les tests
basés sur la loi du F sont d'un usage courant en régression (Cas- La conduite des tests sur l'influence des variables explicatives sidy 1981, p. 243 et sq.). correspond à un premier examen des résultats que l'on poursuit
par une appréciation globale de la qualité de l'ajustement effec
tué. Une mesure utile est fournie par la valeur des résidus, en 3. INTERPRETATION DES RESULTATS effet des valeurs élevées de ceux-ci impliquent un mauvais ajus
tement tandis que des valeurs faibles plaident au contraire pour Laissons de côté tous les aspects algorithmiques et supposons un bon ajustement. Les résidus dépendant toutefois des unités exécutés les calculs qui conduisent à l'équation de régression est de mesure, on se ramène à une quantité sans dimension. Le coefimée. Nous allons passer en revue les principales statistiques que ficient de détermination rapporte les variations expliquées de la fournissent tous les programmes informatiques consacrés à la variable dépendante aux variations totales : régression linéaire multiple en insistant sur les difficultés
d'interprétation. N
^ — Y)2 — ê?
3-1. - Discussion statistique générale i = 1 R2 = = 1 — N L'équation de régression estimée de notre exemple s'écrit : — Y)2 ri — Y)2 _ v ri Y = 32,32 + l,40X2 — 0,59X3 + 4,23 X4 + 0,41 X5 — 0,52X6 i= 1
(20,43) (10,22) (4,64) (5,65) (4,48) (12,00)
Le coefficient de détermination est une mesure descriptive de
Pour chaque paramètre on fournit entre parenthèses le rapport l'association d'une variable dépendante et d'un ensemble de
variables indépendantes facile à interpréter. Il est en effet comp
th = — — h = 1, ...6 ris entre zéro et un et une valeur proche de l'unité est associée
shh à un bon ajustement tandis qu'une valeur faible correspond à
un mauvais ajustement. de l'estimateur à son écart-type estimé. Certains auteurs indi
quent la valeur de shh, l'intérêt de la présentation que nous Le coefficient de détermination ne tient pas compte du nomb
avons retenue est d'indiquer par lecture directe le résultat du test re de degrés de liberté, l'addition d'une variable indépendante
d'absence d'influence des variables explicatives. supplémentaire se traduit automatiquement par son accroisse
Pour un test de niveau de confiance égal à 0,95 on lit ment puisque la somme des carrés des résidus diminue. C'est une
dans la table du t de Student à 289 degrés de liberté propriété mathématique qui ne dépend pas de l'adéquation de
(N — K = 295 — 6 = 289) cette variable et ne correspond pas à une quelconque causalité.
Par conséquent, on lui préfère souvent le coefficient de détet005 = 1,960 rmination ajusté :
- _ Kl 1 Toutes les valeurs calculées th sont supérieures à cette valeur R2 .= 1 — (1 — — — R2) — K critique. Pour chaque variable explicative on rejette donc l'hypo N
thèse nulle (absence d'influence) ce qui revient à accepter 11. Rappelons que dans un test, on peut commettre deux types d'erreur: d'influence significative de chaque variable explicative con — accepter refuser une une hypothèse alors alors qu'elle qu'elle est vraie, est c'est fausse, le risque c'est de le 1re risque espèce, de sidérée isolément. De même on rejette l'hypothèse de nullité du
2e espèce. terme constant.
-39- qui tient compte du nombre de degrés de liberté et établit une Appliqué à l'exemple on trouve :
sorte de compromis entre diminution de la somme des carrés des F = 76.62 résidus et perte de degrés de liberté (12).
La comparaison de différentes valeurs du coefficient de déte au seuil de 0,05 on lit dans la table pour 289 et 5 degrés de liberté
rmination ne peut être menée qu'avec prudence et est insuffisante F0>05 = 4,36 pour guider le choix entre différentes spécifications comme le
montre l'exemple suivant. On considère les comptes départemen ce qui conduit à admettre que les variables indépendantes introtaux de l'agriculture française en 1977 et plus particulièrement duites dans le modèle est une influence significative sur les varia
les comptes de production (13). Pour simplifier, considérons un tions de la variable dépendante. échantillon de N = 13 départements (14). Afin d'étudier la struc Dans cet exemple les coefficients des variables indépendantes ture de ces comptes on étudie l'ajustement de la valeur ajoutée apparaissent comme non nuls et le coefficient de détermination en fonction de la production finale d'où l'équation ajustée : suffisamment élevé ce qui ne pose pas de problèmes d'interpréVA = 325,44 + 0,310 PFIN R2 = 0,76 tation et conduit à conclure à l'utilité du modèle. Nous aurions (2,40) (6,00) la même conclusion avec un coefficient de détermination élevé, Le même calcul avec les consommations intermédiaires comme quelques coefficients statistiquement nuls et les autres non nuls. variable dépendante donne : A l'inverse le modèle apparaît inutile lorsque le coefficient de CI = — 325,44 + 0,689 PFIN R2 = 0,94 détermination est très faible et les coefficients statistiquement (2,40) (13,33) nuls. Un examen rapide de ces résultats pourrait conduire à décla Des difficultés d'interprétation interviennent lorsque le test rer le deuxième modèle meilleur que le premier, or ils se dédui
conjoint sur l'influence des variables explicatives et les tests sépasent l'un de l'autre puisque l'on a l'identité suivante :
rés sur l'influence de chacune d'entre elles conduisent à des conPFIN = VA + CI clusions en apparence contradictoires. Un cas typique est celui
où le coefficient de détermination est relativement élevé et les On pourrait d'ailleurs vérifier que les sommes des carrés des coefficients des variables indépendantes statistiquement nuls. Il résidus sont égales dans les deux cas ce qui achève de montrer correspond à une situation de colinéarité de ces dernières. Plus l'équivalence entre modèles. La différence des coefficients de rarement on observe le cas d'un coefficient de détermination prodétermination provient uniquement du fait que les valeurs ajou che de zéro et des coefficients non nuls (statistiquement). Un tel tées sont plus dispersées d'un département à l'autre que les con résultat peut être dû à une structure particulière des liaisons entre sommations intermédiaires. variables indépendantes lorsque celles-ci sont faiblement corré- En tout état de cause on ne peut comparer les coefficients de lées à la variable dépendante. Un autre cas problématique se rendétermination que pour des modèles qui expliquent la même contre lorsque le coefficient de détermination est proche de zéro variable dépendante. et que quelques coefficients apparaissent comme non nuls st
Dans l'exemple d'économie régionale on obtient des valeurs atistiquement. La question est en effet alors de savoir si on doit
relativement modestes du coefficient de détermination : éliminer du modèle les variables indépendantes dont l'influence
paraît être nulle. R2 = 0,57 et R2 = 0,56.
C'est souvent le cas lorsque la variable dépendante est un rap
port (ici valeur ajoutée agricole par actif)- Par ailleurs dans un 3-2. - Interprétation économique
grand échantillon les données sont très dispersées ce qui traduit Les coefficients des variables indépendantes s'interprètent la multiplicité des facteurs qui peuvent en rendre compte. Une comme les dérivées partielles de la variable dépendante par raptelle dispersion n'interdit pas l'étude de l'influence des variables port à ces variables. Ainsi, si Xh (h = 2 . . . K) s'accroît de qui paraissent être les plus importantes. Aussi n'y a-t-il pas lieu A Xh, alors toutes choses égales par ailleurs Y varie de Y = bh de s'étonner que les effets des variables explicatives introduites A Xh. Ces coefficients n'ont cependant cette interprétation que dans le modèle soient significatifs alors que la valeur du coeffi dans un domaine de variations voisin du point moyen, car il ne cient de détermination est somme toute faible. faut pas oublier que la fonction linéaire ne correspond qu'à une Le coefficient de détermination rend compte de l'association approximation d'une plus compliquée dans ce voisinage. des variables indépendantes et de la variable dépendante. Plus Cette interprétation des coefficients permet du même coup d'en précisément on peut faire un test simultané de l'influence de l'e déduire leur dimension. nsemble des variables indépendantes, en considérant la statistique Dans l'exemple les coefficients de X2, X3, X4 sont exprimés
p — R2 N en 100 unités de compte par hectare, celui de X5 en 100 unités
de compte par unité de gros bovins. Celui de X6 exprime la 1 — R2 K — 1 perte de valeur ajoutée (en 100 unités de compte) associée à une
qui suit si l'hypothèse nulle est vraie (c'est-à-dire les coefficients variation en pourcentage de la population active employée dans
des variables indépendantes sont tous nuls) la loi F de Fisher à l'agriculture.
N — K et K — 1 degrés de liberté. On rejettera l'hypothèse nulle Le signe des coefficients doit aussi donner lieu à une interpré
si la valeur calculée F est supérieure à la valeur critique Fa lue tation particulière. Si le signe négatif pour le coefficient de X6
dans la table, pour un test au seuil a. On accepte donc l'hypo apparaît normal compte tenu de la liaison négative entre niveau
thèse d'une influence significative de l'ensemble des variables de valeur ajoutée et niveau de développement, ce même signe
indépendantes si la valeur calculée F est significativement posi pour le coefficient de X3 paraît plus étonnant. Il est normal car
tive, ce qui revient à dire que le coefficient de détermination est il exprime que par rapport à une situation européenne moyenne
suffisamment élevé. l'hectare marginal de prairies permanentes entraîne une baisse
de valeur ajoutée, la situation étant inverse pour l'hectare marg12. Si K = 1 alors R2 = R2. Si K > alors R2 < R2. inal de terres labourables ou de cultures permanentes. De même 13. Le compte de production décompose la production finale (PFIN) en on trouve que la valeur ajoutée marginale (b4 supérieure à b2 au consommations intermédiaires (Cl) et valeur ajoutée brute (VA). seuil de 0,05) procurée par les cultures permanentes est plus éle14. Il s'agit des départements des régions Bretagne, Pays de Loire et vée que celle par les terres labourables. Poitou-Charentes.
-40- cultures permanentes A Rj = 0,05 Il est intéressant de calculer les élasticités de la variable dépen
dante par rapport aux différentes variables indépendantes. Ce ARj = 0,03 cheptel calcul n'a de sens qu'au point moyen et donne pour l'élasticité
de Y par rapport à Xh, l'expression 6hXh/y(15). Appliqué à A R* = 0,21 actifs agri. % l'exemple on trouve des élasticités assez faibles :
L'étude comparée des contributions marginales des différent
terres labourables 62 X2/Y = 0,23 es variables indépendantes permet de se faire une idée de leur
pouvoir explicatif marginal. Dans le cas présent les variables X2 prairies permanentes 63 X3/Y = — 0,10 et X6 apparaissent comme nettement dominantes, ce qui peut
entraîner une surestimation de leur influence. cultures 64 X4/Y = 0,06
cheptel 65X5/Y = 0,13 3-3. - Le problème de la colinéarité
(Judge et al., 1980, chapitre 12) actifs agri. <7o 66 X6/ Y = — 0,32
Si l'on considère le modèle avec un terme constant et une varia
ble explicative on constate que la variance de l'estimateur du coefL'interprétation du terme constant du modèle est plus déli
ficient de cette variable est d'autant plus élevée qu'elle varie peu. cate que celle des coefficients. Mathématiquement il correspond
A la limite si celle-ci est constante la variance est indéterà une ordonnée à l'origine et représente l'espérance mathémati minée (17). Pour obtenir une estimation précise il est donc nécesque de la variable dépendante lorsque toutes les variables indé
saire que le domaine de variations de la variable indépendante pendantes sont nulles. Sur le plan économique cette situation peut soit vaste, surtout si la variance s2 du terme aléatoire est élevée. n'avoir aucun sens, en effet n'oublions pas que le modèle n'est Dans le cas général de plusieurs variables explicatives la situavalable que dans un certain domaine de variations des variables tion est plus compliquée puisqu'il faut faire intervenir leurs explicatives, clairement. dans notre exemple nous avons à faire
variances mais aussi leurs covariances. La colinéarité coi respond à un cas où le terme constant ne peut pas être interprété directe au cas où les variables explicatives du modèle sont linéairement ment. Par contre lorsqu'on fait des ajustements sur des sous-
dépendantes. La matrice X'X est alors singulière et il est imposséchantillons, les variations de terme constant ont, comme nous ible de calculer l'estimateur des moindres carrés des paramètle verrons, des interprétations économiques particulièrement res. La dépendance linéaire est un cas limite, aussi en pratique intéressantes.
parle-t-on de colinéarité lorsque les variables explicatives sont Le coefficient de détermination donne une vue globale de la fortement liées. Il existe entre elles une ou plusieurs relations valeur de l'ajustement. Les estimateurs des coefficients des varia linéaires approximatives qui peuvent être accidentelles mais aussi bles indépendantes et les élasticités renseignent sur leur influence. traduire des dépendances générales. Enfin les tests sur les coefficients et les intervalles de confiance La colinéarité rend difficile l'estimation valable des paramètdonnent une idée de la précision de l'estimation.
res du modèle car elle entraîne plusieurs effets qui ont pour conUne analyse plus approfondie permet d'aller au-delà et doit séquence ultime de diminuer la précision et l'efficacité des estaider à mettre en évidence l'apport de chaque variable indépen imateurs des paramètres. Les variances de ces derniers augmentdante à l'explication globale des variations de la dépen ent avec le degré de colinéarité des variables explicatives, de telle dante. Les coefficients de régression étant liés aux unités de sorte qu'il devient difficile, parfois impossible, de séparer les mesure, leur comparaison ne nous instruit pas sur cette quest influences respectives des diverses variables explicatives. Suppoion. Pour hiérarchiser l'influence des variables explicatives cer sons en effet que deux variables Xh et Xk soient approximatitains auteurs utilisent la régression linéaire multiple entre varia vement liées, il est alors faux d'interpréter le coefficient de Xh bles centrées autour de leur moyenne et réduites par leur écart- comme mesurant l'influence de Xh sur Y toutes choses égales type (16). par ailleurs. Un cas typique de colinéarité, facile à détecter, est Une technique simple pour comparer l'apport des différentes celui où le coefficient de détermination est élevé tandis que les variables indépendantes consiste à évaluer leur contribution mar coefficients de variables explicatives sont significativement nuls.
ginale ; elle peut être mesurée en calculant l'accroissement du L'examen de la matrice estimée des variances et covariances des coefficient de détermination entraîné par leur introduction dans permet de détecter la colinéarité puisque celle-ci se le modèle (Theil, 1971, p. 168-171). On trouve : traduit par des écarts-types élevés et aussi des corrélations import
1 — R2 antes entre certains coefficients. p N-K h h = 2 K h Sur le plan numérique la colinéarité correspond au cas où cer
taines des valeurs propres de la matrice de corrélation des variaPlus la statistique th est élevée plus l'apport de la variable Xh bles explicatives sont très faibles (18). Un autre indicateur de coliest élevé. Appliqué à l'exemple on obtient : néarité est l'instabilité de la solution de l'équation normale au
= 0,16 sens où de faibles variations du second membre de l'équation terres labourables A R22 induisent de fortes de sa solution. = 0,03 prairies permanentes A R] Il existe différentes méthodes de nature statistique qui ont été
proposées pour étudier le problème de colinéarité. Elles sont
15. Lorsque les variables du modèle sont obtenues après transformation basées sur l'hypothèse que les variables explicatives sont aléalogarithmique les élasticités valent simplement bh et sont constantes toires ce qui est contradictoire avec le modèle de la régression dans tout le domaine de variations des variables. linéaire multiple. Ainsi si ces variables suivent la loi multinor- 16. Si S désigne l'écart-type de Y et Shh celui de Xh (h = 2 . . ^K), on fait la régression linéaire de (Y — male il est aisé de dériver les lois de probabilité de différentes Y)/Syy en fonction des (Xh — Xh)/Shh.
statistiques liées à leur matrice de corrélation et ainsi d'étudier Les coefficients estimés du modèle valent bh— — et sont connus sous
Syy 17. Dans l'espace des observations les vecteurs X1 et X2 sont proportionnle nom de coefficient « bêta ». On vérifie aisément que la matrice de l'équa els. La variable indépendante X2 est colinéaire à la variable artificielle Xv tion normale au lieu de la matrice X'X est la matrice de corrélation des
18. A la limite une valeur propre au moins est nulle, le déterminant de la variables indépendantes. La statistique qui permet de tester l'absence d'ef matrice de corrélation est donc nul. A l'inverse ce dernier est égal à l'unité, fet des variables explicatives centrées réduites est la même que pour le dans le cas idéal où les variables explicatives sont orthogonales. La modèle avant transformation des variables (Draper et Smith, 1981,
p. 262-265). Cette technique est toutefois rarement utilisée en économétrie. matrice X'X est alors diagonale.
-41- le problème de colinéarité. Bien qu'assez répandue, cette appro alors dans une situation de quasi-orthogonalité gage d'une est
che nous paraît être inadéquate car elle revient à généraliser abu imation précise du modèle. L'inconvénient étant celui spé
sivement une propriété de l'échantillon. cification incomplète.
Bien qu'elle puisse résulter de phénomènes plus généraux, la Une étude plus approfondie en raisonnant à cheptel constant
colinéarité résulte d'une structure particulière des observations, (variable X5 fixée) permet de mettre en évidence les relations
aussi nous paraît-il préférable d'aborder son étude en s'appuyant entre variables qui décrivent le mode d'utilisation du sol (X2,
sur une analyse descriptive de l'échantillon. Pour ce faire nous X3 et X4). En raisonnant sur les coefficients de corrélation part
utilisons des statistiques descriptives comme le coefficient de ielle, on trouve de faibles liaisons. Liaison légèrement négative
détermination et les coefficients de corrélation simple et partielle. entre terres labourables et prairies permanentes (coefficient de
Il est clair qu'une telle approche connaît des limites strictes et — 0,14) qui traduit à degré d'intensification fixé des productions
ne permet pas de découvrir certaines liaisons complexes. animales une concurrence entre modes d'utilisation du sol. Dans
les mêmes conditions la liaison faiblement positive entre praiLa localisation d'une colinéarité, c'est-à-dire la détermination
ries permanentes et cultures permanentes (coefficient de 0,20) des variables qui en sont principalement responsables peut être
correspond à la présence simultanée de ces deux modes d'utilmenée simplement. Pour chaque variable indépendante X,,
(h = 2 ... K) on calcule le coefficient de détermination R2 qui isation du sol dans l'Europe Méridionale.
mesure le degré d'association entre Xh et l'ensemble des autres Il est intéressant de rapprocher les estimations obtenues sur
variables explicatives du modèle. Si Rj; est élevé, proche de le modèle complet de celles que l'on trouve en supprimant la
l'unité, on peut en conclure que les variations de Xh sont décri variable X5.
tes correctement par le jeu combiné des autres variables expli Y = 32,32 + l,40X2 — 0,59X3 + 4,23 X4 + 0,41 X5 — 0,52X6 catives. Il est alors difficile de mesurer avec précision l'influence (20,43) (10,22) (4,64) (5,65) (4,48) (12,00) de Xh sur la variable dépendante du modèle. Cette approche est
R2 = 0,57 R2 = 0,56 purement descriptive. Elle est uniquement valable pour l'échant
illon considéré et aucune conclusion ne doit en être tirée quant Y = 35,41 + 1,52X2 — 0,24 X3 + 2,79 X4 — 0,55 X6 à la population.
(24,10) (10,93) (2,29) (3,99) (12,66) Appliquée à l'exemple cette approche aboutit aux valeurs sui
R2 = 0,54 R2 = 0,53 vantes du coefficient de détermination :
ainsi que les intervalles de confiance à 0,90 par les coefficients : R\ = 0,08 terres labourables
R2 = 0,35 modèle complet modèle incomplet prairies permanentes
terres labourables b2 1,17 1,62 1,29 1,74 R2 = 0,20 cultures
prairies permanentes b3 — 0,81 — 0,38 — 0,41 — 0,07 R2 = 0,47 cheptel
cultures b4 3,00 5,47 1,64 3,93 R2 = 0,06 actif agri. %
cheptel b5 0,26 0,56
Les valeurs obtenues sont faibles pour X2 et X6. A l'opposé
actifs agri. °/o b6 —0,59 0,45 —0,63 —0,48 celles de X3 et surtout de X5 sont assez élevées puisque respec
tivement 35 % et 47 % de leur variance peut être décrite par le La comparaison des coefficients des équations ajustées et des jeu des autres variables. La variable X4 est en situation inter intervalles de confiance fait apparaître une concordance entre médiaire. On observe donc un phénomène de colinéarité local les deux modèles, en particulier une stabilité élevée pour les coefisé sur X3, X4 et X5. ficients de X2 et Xg. Pour les coefficients des autres variables Le calcul précédent donne une idée précise de l'ampleur de notons qu'il n'y a pas d'incompatibilité entre intervalles de conla colinéarité et de sa localisation, il convient d'approfondir la fiance et que la précision apparaît plus élevée dans le modèle compstructure des relations entre variables explicatives. L'étude des let pour les coefficients de X3 et X4. Si on examine les coefficoefficients de corrélation simple montre une corrélation assez cients de corrélation entre coefficients estimés du modèle compélevée (coefficient de 0,58) entre X3 et X5. Cette forte liaison let, on observe deux valeurs non négligeables — 0,62 entre 63 positive est normale puisque ces variables représentent respect et 65, 0,43 entre 64 et b5. Ces résultats peuvent s'interpréter de ivement les prairies permanentes et le cheptel par actif. On note la façon suivante : il existe une combinaison linéaire de b3 et bs
aussi une corrélation négative (coefficient de — 0,45) entre X4 d'une part, de b4 et b5 d'autre part que l'on pourrait estimer et X5 qui traduit un phénomène de localisation du cheptel en avec une meilleure précision que b3, b4 et b5. En fait on condehors des zones où l'on rencontre des cultures permanentes firme, ce que l'on avait trouvé plus directement, à savoir une (variable X5). liaison entre X3 et X5 ainsi qu'entre X4 et X5.
La variable cheptel apparaît responsable des phénomènes que Pour le modèle complet le problème de colinéarité n'est pas l'on vient d'observer. Ainsi si on réduit le nombre de variables finalement crucial. Il repose sur une spécification plus exacte et explicatives en la supprimant, et en ne retenant que X2, X3, doit donc être préféré au modèle incomplet. D'autant plus qu'il X4 et X6 on constate une chute de coefficients de déterminat semble qu'en utilisant ce dernier on minore l'influence des variaion : bles X3 et X4 qui se trouve absorbée par les variables dominant
es X2 et X6 dont on tend à surestimer les effets. terres labourables R2. = 0,05
L'économètre est confronté à un dilemme. D'une part il sou
prairies permanentes R3 = 0,02 haite spécifier correctement le modèle, ce qui se traduit par la
prise en compte d'un nombre élevé de variables explicatives. cultures R2 = 0,05
D'autre part, il observe qu'il en résulte souvent une diminution
actifs agri. °/o R2 = 0,03 de la précision des estimateurs en raison du phénomène de coli
néarité. Finalement il adopte une cote mal taillée, en essayant
de réaliser un compromis entre les inconvénients d'une spécifiqui s'accompagne d'une hausse brutale du déterminant de la
cation incomplète et ceux de la colinéarité. matrice de corrélation qui passe de 0,43 à 0,90. On se trouve
-42- ERREURS DE SPÉCIFICATION Supposons que pour des raisons de simplicité, on souhaite 4.
décrire l'agriculture régionale au moyen d'une seule variable :
la surface agricole utilisée par actif, notée X7. Celle-ci est obteLes résultats obtenus à partir d'un modèle économétrique
sont conditionnels puisqu'ils dépendent d'un ensemble d'hypot nue par addition des variables X2 (termes labourables), X3 (prai
hèses. Or celles-ci ne sont pas rigoureusement vérifiées dans la ries permanentes) et x4 (cultures permanentes). Après calculs on
obtient l'équation ajustée : réalité. Il convient donc de s'interroger sur la robustesse des résul
tats lorsque certaines hypothèses sont contestables, c'est-à-dire
?= 40,64 — 0,62X6 + 0,38X7 R2 = 0,37 R2 = 0,37 étudier les conséquences des erreurs de spécification, en désignant
ainsi toutes les divergences entre hypothèses et propriétés du phé (25,74) (12,50) (4,00) nomène étudié.
Un tel modèle évite tous les écueils de la colinéarité (le déterLes erreurs de spécification peuvent tout d'abord concerner minant de la matrice de corrélation de X6 et X7 vaut un) ce qui la loi de probabilité du terme aléatoire du modèle, mais aussi autorise une estimation précise. Nous allons comparer cet ajusla liste des variables explicatives ou encore la forme mathémati tement au modèle supposé exact à cinq variables explicatives X2, que du modèle. Plus généralement l'étude du phénomène éc X3, X4, X5 et Xg. Comme leurs coefficients sont inconnus, nous onomique auquel on s'intéresse peut exiger un ensemble d'équat allons utiliser les estimateurs des moindres carrés en assimilant ions du fait de la simultanéité et il n'est pas possible d'en isoler valeurs des et des paramètres. une seule sans considérer les autres. Traiter des erreurs de spéci
fication nécessiterait donc de traiter de toute l'économétrie déjà terres labourables b2 — 62 = 1,40 écrite mais aussi de celle qui reste à faire. Aussi avons-nous res
treint notre champ à une catégorie particulière d'erreurs de spé prairies permanentes b3 — 63 = — 0,59
cification, celles qui concernent la liste des variables explicati cultures b4 — 64 = 4,23 ves. Quelles conséquences entraîne l'omission d'une variable per
tinente dans le modèle ou au contraire l'inclusion d'une varia cheptel b5 — 65 = 0,41 ble inutile ? Outre cette question nous aborderons dans un sous-
actifs agri. % b6 — 66 = — 0,52 paragraphe le problème de l'hétérocédasticité que nous avons
rencontré fréquemment en économie régionale.
On ne peut pas toujours estimer le modèle exact soit parce
qu'on ignore la spécification complète du modèle, soit Les La matrice colonnes — P 0,05 0,37 de est P s'obtiennent une 0,64 0,04matrice —0,01en à 0,01 2 exprimant lignes —0,08 et chacune 5 0,70 colonnes des 0, varia: ne dispose pas de données suffisantes sur toutes les varia ■C i) bles. Très souvent on est conduit à estimer un modèle incomp
let, c'est-à-dire un modèle où ont été omises une ou plusieurs bles du modèle exact (X2, X3, X4, X5 et X6) en fonction de X6 variables explicatives pertinentes. A l'inverse il arrive que l'on et X7. On obtient ainsi une approximation de l'espérance introduise des variables inutiles. Avant d'entrer dans le détail mathématique des coefficients du modèle simplifié : de ces situations spécifiques nous allons en donner une présen
tation générale. * — — 0,62
E607)~ 0,38 4-1. - Présentation générale (Theil, 1971, p. 548 et sq.)
On suppose que le phénomène étudié peut être représenté par Une comparaison avec les estimations obtenues à l'aide du
le modèle de la régression linéaire multiple à (K — 1) variables modèle simplifié fait apparaître l'absence de biais de spécifica
explicatives plus un terme constant. Les observations sur ces tion, ce qui permet une interprétation précise du modèle simplif
variables sont regroupées ^ans la matrice X à N lignes et K colon ié. Ce résultat encourageant est particulier et résulte du fait que
nes. Pour des raisons qu'il ne convient pas d'analyser pour l'ins la variable X7 est obtenue par addition de trois variables du
tant, on n'observe pas la matrice X mais une matrice Xo à N modèle complet. Son coefficient mesure la résultante d'influen
lignes et Ko colonnes. Ainsi, au lieu d'observer les vraies varia ces de sens opposés : effets positifs des terres labourables et des
bles explicatives, on observe un autre ensemble de variables cultures permanentes, négatifs des prairies permanentes. L'in
auquel on applique la méthode des moindres carrés, qui fournit fluence de la variable cheptel est captée par les variables X6 et
l'estimateur : X7 ainsi que par la perturbation aléatoire dont la variance est
60 = (X'0X0)-i X'0Y augmentée.
De façon générale les erreurs de spécification ont des conséUne question naturelle concerne la signification de cet est quences non seulement sur le biais des estimateurs mais aussi imateur vis-à-vis des coefficients du modèle exact. Il est bien évi sur leur précision et leurs propriétés asymptotiques. Nous allons dent que la réponse à cette question est très contingente car elle passer en revue deux cas simples, celui de l'omission d'une ou dépend des relations entre les variables de la matrice Xo et les plusieurs variables explicatives pertinentes et celui où on introvariables pertinentes de la matrice X. Comme le montre un duit dans le modèle des variables inutiles. calcul élémentaire, l'espérance mathématique de 6O vaut.
E(b0) = P b P = (X'oX0)-i X'0X 4-2. - Variables pertinentes et variables inutiles
(Cassidy, 1981, chapitre 6) Le vecteur espérance mathématique est lié linéairement aux L'omission de variables pertinentes se traduit par des biais de
paramètres inconnus qui forment le vecteur b par l'intermédiaire spécification dont l'ampleur dépend du degré de liaison entre
d'une matrice de pondération P. Celle-ci est en général diffé les variables omises et les variables effectivement introduites dans rente de la matrice identité donc l'estimateur obtenu b0 est un le modèle. Asymptotiquement les biais de spécification ne s'an
estimateur biaisé de b, on parle de biais de spécification. nulent pas, les estimateurs ne convergent plus en probabilité vers
Ce qui intéresse le praticien c'est l'importance du biais selon les valeurs des paramètres. L'omission d'une variable explica
les situations particulières qu'il peut rencontrer. Au prix de cer tive sera donc d'autant plus grave qu'elle est corrélée aux autres
taines simplifications appliquons l'approche précédente au pro variables. Ainsi si les corrélations sont nulles les biais de spéci
blème d'économie régionale qui nous intéresse et interrogeons- fication sur les coefficients des variables explicatives s'annulent
nous sur l'interprétation d'un modèle simplifié. et les estimateurs retrouvent leur propriété de convergence. Par
-43-

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.