Module_2_estimation

De
Publié par

s
s
s
W
·
q
·
q
s
q
s
"
q
Statistique et Probabilités : Estimation par intervalle de confiance

Chapitre 1

Estimation par intervalle de confiance

1. Estimation ponctuelle

1.1. Notion d’estimateur

Soit X une variable observée sur une population dont la loi dépend d’un paramètre
inconnu . Soit (X , X ,..., X ) une suite de variables issue de la variable X. Un 1 2 n
estimateur T de sera une variable aléatoire T = T (X , X ,..., X ) fonction de n n n 1 2 n
l’échantillon.
X + X +L + X1 2 nPar exemple, T = X = est un estimateur de . n
n
La valeur de T calculée à partir d'un échantillon observé est appelée estimation de , n
elle sera notée T (x , x ,..., x ) . n 1 2 n

1.2. Exemples d’estimateurs
1.2.1. Estimateur de la moyenne empirique

On appelle moyenne empirique du caractère X sur un échantillon
(X , X ,..., X ) la variable aléatoire X suivante : 1 2 n
n1
X = X∑ i
n
i=1

On suppose que l'échantillon (X , X ,..., X ) est formé de variables aléatoires 1 2 n
indépendantes et de même loi que X.
On pose
2E(X ) = m et Var(X ) = i. i i

On a :
Espérance de X : E(X ) = m
2
Variance de : V (X ) = X
n
En effet, on a:
 n n n1 1 1 1 E(X) = E X = E(X ) = m = (n m) = m ∑ ∑∑ ii  n n nn i=1 i=1 i =1 
 n  2n n1 1 1 1  2 2V(X) =V X = V(X ) = = (n ) = ∑ ∑∑ i i 2 2 2 nn n i=1 n i=1 n i =1 
Cours de Statistique EBAD - UCAD 4/2/2007 1:37:05 PM Abdon Privat PAMBOU 1 ...
Voir plus Voir moins
Statistique et Probabilités : Estimation par intervalle de confiance  Chapitre 1   Estimation par intervalle de confiance  1. Estimation ponctuelle  1.1. Notion d’estimateur  Soit X une variable observée sur une population W dont la loi dépend d’un paramètre inconnu q. Soit (X1,X2,...,Xn) une suite de variables issue de la variable X. Un estimateur Tn de q sera une variable aléatoire Tn1Tn(X1,X2,...,Xn) fonction de l’échantillon. X#X#L#XPar exemple, Tn1X112n est un estimateur de q& nLa valeur de Tn calculée à partir d'un échantillon observé est appelée estimation de q, elle sera notée Tn(x1,x2,...,xn).  1.2. Exemples d’estimateurs 1.2.1. Estimateur de la moyenne empirique   On appelle moyenne empirique du caractère X sur un échantillon (X1,X2,...,Xn) la variable aléatoire X suivante : n1X1nXi 1i1 On suppose que l'échantillon (X1,X2,...,Xn) est formé de variables aléatoires indépendantes et de même loi que X.  On pose E(Xi)1m  et  Var(Xi)1s2"i.  On a : Espérance de X: E(X)1m  2sVariance de X : V(X)1 nEn effet, on a: nE(X)1E1X11nE(Xi)11nm11(n´m)1m ni11ini11ni11nnnn2V(X)1V1X11V(Xi)11s211(n´s2)1s ini11n2i11n2i11n2nCours de Statistique EBAD - UCAD         1            4/2/2007 1:37:05 PM Abdon Privat PAMBOU
Statistique et Probabilités : Estimation par intervalle de confiance  1.2.2. Estimateur de la variance   On appelle variance empirique du caractère X sur un échantillon (X1,X2,...,Xn) la variable aléatoire S2 suivante : S211nXi-X2 ni11On appelle variance empirique corrigée la variable aléatoire S2suivante: nS211Xi-X2 n-1i11On a donc la relation : nS21(n-1)S2  ùo'DS21nS2 -n1On a : Espérance de S2 : ES21n-1s2 n2 Espérance de S  : ES21s2    On démontre (et nous l'admettons) que, dès lors que la loi L  admet des moments jusqu'à l'ordre 4, S2 et S2 possèdent une variance. Celle-ci tend vers zéro lorsque n augmente.  1.2.3. Estimation ponctuelle d’une proportion (pourcentage)  Supposons qu’une population  est constituée de deux catégories d’individus A e tB ; où la catégorie A est en proportion inconnue p inconnue. Si sur un échantillon représentatif donné on observe une proportion f d’individus de la catégorie A, alors on estime que:  p = f  1.2.4. Propriété d’un estimateur 1.2.4.1. Estimateur sans biais  Un estimateur Tn de q est dit sans biais si E(Tn)1q,"qÎQ  Qest appelé espace des paramètres ou espace des états de la nature. - La moyenne empirique X est un estimateur sans biais de la moyenne E(Xi)1m E(X)1m ici le paramètre q est m. Cours de Statistique EBAD - UCAD         2            4/2/2007 1:37:05 PM Abdon Privat PAMBOU
Statistique et Probabilités : Estimation par intervalle de confiance  - La variance empirique corrigée S2 est un estimateur sans biais de la variance V(Xi)1s2 E(S2)1s2 Ici le paramètre q est s2.  1.2.4.2. Estimateur asymptotiquement sans biais  Un estimateur Tn de q est dit asymptotiquement sans biais si "qÎQ,E(Tn)®qquandn®#¥. La variance empirique S2 est un estimateur asymptotique sans biais de la variance. On  : aE(S2)1n-1s2 nDonc : E(S2)®s2quandn®#¥   1.2.4.3. Estimateur convergent  Un estimateur sans biais ou asymptotiquement sans biais dont la variance tend vers zéro lorsque n tend vers l'infini est convergent. 2 •  X est un estimateur convergent de m car il est sans biais et sa variance s  ntend vers zéro lorsque n®¥.  2  • S2 et Ssont des estimateurs convergents de 2 .  En rfésumé En l’absence de tout autre information sur la variable X, on estime - que la moyenne inconnue m de la variable X sur la population  est égale à la moyenne de X sur l’échantillon ; c’est-à-direm  1x  .  - que la meilleure estimation ponctuelle de l’éca rttype inconnu  σ  (de la population) est donnée en fonction de l’écart type de l’échantillon (se) par la formule : s1sn-11sn-1. enn     Cours de Statistique EBAD - UCAD         3            4/2/2007 1:37:05 PM Abdon Privat PAMBOU
Statistique et Probabilités : Estimation par intervalle de confiance  1.2.5. Comparaison des estimateurs  ~Soient Tn  et  Tn deux estimateurs sans biais d’un paramètreq . Tn  est dit plus ~efficace que Tn si : ~"qÎQ, V(Tn)£V(Tn)  2. Estimation par intervalle de confiance  Entreprendre une estimation ponctuelle est une démarche naturelle. En effet si l'on se trouve placé face à un phénomène aléatoire dépendant d'un paramètre inconnu q, il est logique de chercher à disposer d'une valeur numérique de ce paramètre. Cependant il existe de nombreuses situations où une telle estimation ponctuelle n'est pas, en elle-même d'un grand intérêt.  La méthode d’estimation ponctuelle est une méthode qui n’est donc pas entièrement satisfaisante. En effet, les valeurs estimées varient d’un échantillon à l’autre, et peuvent parfois être très éloignées des vraies caractéristiques m, σ et p de la population . Cette estimation est donc peu précise. Pour palier à ce défaut de précision, on définit à partir de l ‘échantillon, un intervalle dans leque,l on est sûr de trouver la valeur inconnue du paramètre avec un risque donné. Estimer un paramètre en montrant qu'il appartient avec une probabilité donnée (par exemple 95%) à un intervalle, est ce que l'on appelle réaliser une estimation par intervalle de confiance.  Remarque  Dans la suite nous distinguerons deux types d’échatnillons : - Les petits échantillons dont la taille est inférieure à 30. - Les grands échantillons dont la taille est supérieure ou égale à 30.  2.1. Intervalle de confiance pour un paramètre réel Définition  Soit (X1, …, Xn) un échantillon issu d'une variable aléatoire dont la  loi de probabilité dépend d’un paramètre inconnu q. Soit aÎ]0,1[ un réel quelconque fixé a prior. On appelle intervalle de confiance pour le paramètre q au niveau de confiance 1-a, tout intervalle de la forme [An,Bn], où An et Bn sont deux statistiques sur l'échantillon (X1, …, Xn) telles que : Pr[An£q£,Bn]11-a   Cours de Statistique EBAD - UCAD         4            4/2/2007 1:37:05 PM Abdon Privat PAMBOU
Statistique et Probabilités : Estimation par intervalle de confiance  Remarques   • Le  rée l a  peut être interprété comme le risque que l'intervalle de confiance [An,Bn] ne contienne pas la vraie valeur du paramètre.  • Si AnetBn sont toutes deux finies et aléatoires, on dit que l'intervalle [An,Bn] est bilatéral. Si l'une des statistiques Anou Bn, est certaine ou infinie, l'intervalle est dit unilatéral.  2.2. Intervalle de confiance d’une moyenn e Soit (X1, …, Xn) un échantillon issu d'une variable aléatoire suivant une loi normale de moyenne inconnue m et d’écart typeσ . Soit  a  un réel quelconque fixé a priori, aÎ]0,1[. On se propose de déterminer un intervalle de confiance pour le paramètre q au niveau de confiance 1 - a :  Pr[An£m£,Bn]11-a  Pour construire un intervalle de confiance pour la moyenne m inconnue de la variable X suivant une loi normale N (m, s), on considère la variable suivante :  T1Xn-m1nXn-m ssnnLa quantité T1Xn-m est une variable aléatoire qui dépend du paramètre que l'on scherche à estimer, m, mais dont la loi ne dépend pas de ce paramètre et est parfaitement connue si l’on connaît le paramètre s. Si s  est connu, nXn-m  est une variable aléatoire pivotable pour le sn- paramètre m de N (m, s ). Dans ce cas Xn-m®N(0,1)sn- Si s est inconnu, on l’estime par S. Dans ce cas Xn -msuit une loi de sStudent à (n-1)degrés de liberté. nXn-md®T(n-1)s  -    Cours de Statistique EBAD - UCAD          5            4/2/2007 1:37:05 PM Abdon Privat PAMBOU
Statistique et Probabilités : Estimation par intervalle de confiance   2.2.1. Cas où s est connu  Soit (X1, …, Xn) l'échantillon indépendant. On utilise comme estimateur de m, la n1moyenne empirique X1nXi. 1i1X suit alors une loi normale  Nm,s. La variable nX-m suit une loi normale N(0 sn, 1). N (0 , 1)a -1a/ 2a/ 2 -ttaanX-mPr-ta£s£ta11-a PrX-sta£m£X#sta11-ann Ceci conduit à l'intervalle bilatéral symétrique centré en X:  X-sta£m£X#sta nn Connaissant la moyenne et l’écart type de l’échalnltoin, on obtient l’intervalle  ssmÎx-ta;x#ta nn ta est lu sur la table de la loi normale centrée réduite.    2.2.2. Cas où s est inconnu (situation la plus fréquente) :et n < 30  La loi deX dépendant de s, on utilise comme estimateur de s2 la variance empirique n122Sn1n-1Xi-X. 1i1(n-1)S2On sait que la variable aléatoire 2nsuit une loi du Khi-Deux à (n-1) degrés de sliberté. Cours de Statistique EBAD - UCAD         6            4/2/2007 1:37:05 PM Abdon Privat PAMBOU
Statistique et Probabilités : Estimation par intervalle de confiance  22Par suite on a Sn suit une loi c(n-1) . 2n-1s nX-msnX-mLe rapport 1   suit une loi de Student à (n-1)degrés de liberté. sSSnnT1 -na -1a/ 2a/ 2-tata Pr-ta£nX-m£ta11-aSn PrX-Snta£m£X#Snta11-ann Ce qui conduit à l'intervalle bilatéral symétrique :  X-Snta£m£X#Snta nnnOn sait Sn1Sn, on a : n-1 X-Snta£m£X#Sntan-1n-1  Connaissant la moyenne et l’écart type de l’échalnltoin, on obtient l’intervalle  mÎx-tas;x#tas n-1n-1 ta est lu sur la table de la loi de Student à (n-1)degrés de liberté.       Cours de Statistique EBAD - UCAD         7            4/2/2007 1:37:05 PM Abdon Privat PAMBOU
Statistique et Probabilités : Estimation par intervalle de confiance        2.2.3 Cas où s est inconnu et n  30 ("grands échantillons")  Si la taille de l’échantillon est supérieure à 30,l a loi de Student est remplacée par la loi normale. ta est lu sur la table de la loi normale. Dans ce cas l'intervalle de confiance s'écrit aussi :  X-Snta£m£X#Snta nnConnaissant la moyenne et l’écart type de l’échalnltoin, on obtient l’intervalle  mÎx-tas;x#tas nn ta est lu sur la table de la loi normale.  Exemple  Un analyste financier étudie les comptes de 200 clients ayant souscrit un emprunt. A partir d'un échantillon de 20 comptes, il trouve que le solde moyen d'un compte est de 1514,69 Francs avec un écart type égal à 453,34 Francs. Donner un intervalle de confiance à 95% du solde moyen d'un compte.  Corrigé Les hypothèses se traduisent par :   n = 20   x11514,69   s = 453,34 L'écart type de la population est inconnu, nous devons utiliser la loi de Student à(n-1) degrés de liberté : T19. a  =  0,05  ta12,093  L'intervalle de confiance ayant 95 chances sur 100 de contenir la valeur vraie de la moyenne m est : ssx-ta£m£x#ta n-1n-11514,69-2,093´453,34£m£1514,69#2,093´453,34 9191 1297,02   m    1732,36  Cours de Statistique EBAD - UCAD         8            4/2/2007 1:37:05 PM Abdon Privat PAMBOU
Statistique et Probabilités : Estimation par intervalle de confiance  2.3. Estimation par intervalle de confiance d'une proportion 2.3.1. Intervalle de confiance d’une proportion  q est la proportion p d'individus de P qui possèdent la propriété Q. La variable aléatoire Xi associée au ième individu ai d'un échantillon de taille n est définie par : Xi11siaipossédelapropriétéQi Xi10sinon                                      nTn11Xi1Nn1Fn nn11iFn  est la fréquence de Q dans l'échantillon, Xi suit une loi de Bernoulli de paramètre p. Nn®B(n,p!: loi binomiale    E ( Nn ) =  n p  E ( Fn )  = p   Var ( Nn )  = n p q   Var(Fn)1pq  nOn suppose que l'on est dans les conditions d'approximation de la loi binomiale B(n, p) par la loi normale. Une approximation de la loi de Fn est alors la loi normaleNp,p(1-p!. nOn considère donc que la variable : Tn1Fn-p®N(0,1). p(1-p!nOn a alors : P-tp(1-p)£F-p£tp(1-p)11-a annanConnaissant la fréquence f0du caractère dans un échantillon de taille n, dans la pratique on remplace dans la racine carrée p par f0. D'où  P-tf0(1-f0)£f-p£tf0(1-f0)11-a an0anSi on pose s1f0(1-f0), alors on a : fnPf0-tasf£p£f0#tasf11-a Cours de Statistique EBAD - UCAD         9            4/2/2007 1:37:05 PM Abdon Privat PAMBOU
Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.