Université des Sciences et Technologies de Lille U F R de Mathématiques Pures et Appliquées

pages

Français

Documents

Écrit par
Charles Suquet

Publié par
ondey

Lire un extrait

Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

pages

Français

Ebook

Lire un extrait

Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus

Publié par

ondey

Nombre de lectures

Langue

Français

Niveau: Supérieur, Licence, Bac+3
Université des Sciences et Technologies de Lille U.F.R. de Mathématiques Pures et Appliquées L3 Année 2011 Initiation à la Statistique Corrigé du D.S. du 25 mars 2011 Ex 1. Intervalle de confiance Le tableau ci-dessous donne un 100-échantillon observé d'une loi de Bernoulli de paramètre inconnu p. 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 1 1 1 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 1 0 0 0 1 1 1 0 1 1 0 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 1) Si Sn X1 Xn où les Xi sont indépendantes de même loi de Bernoulli et de paramètre p, l'intervalle de confiance pour p, au niveau 95%, bâti sur l'échantillon observé X1p?q, . . . , Xnp?q par la méthode avec variance majorée est : Ip?q Snp?q n 1,96 2 ? n , Snp?q n 1,96 2 ? n . (1) Ici n 100 et les valeurs observées X1p?q, .

p1 ?q

question de l'éventuelle nullité du dénominateur sn

variance de la variable aléatoire de loi binomiale

variable aléatoire

?ptq

sn ?

Voir

Publié par

ondey

Nombre de lectures

Langue

Français

Variable aléatoire

Université des Sciences et Technologies de Lille
U.F.R. de Mathématiques Pures et Appliquées
L3 Année 2011
Initiation à la Statistique
Corrigé du D.S. du 25 mars 2011
Ex 1. Intervalle de conﬁance
Le tableau ci-dessous donne un 100-échantillon observé d’une loi de Bernoulli de
paramètre inconnu p.
1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
0 0 0 1 0 0 0 1 1 1 0 0 0 0 1 0 0 0 0 0
1 0 0 1 1 0 0 0 0 0 1 0 0 0 1 1 1 0 1 1
0 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0
0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0
1) Si S X X où les X sont indépendantes de même loi de Bernoullin 1 n i
et de paramètrep, l’intervalle de conﬁance pourp, au niveau 95%, bâti sur l’échantillon
observé X ω ,...,X ω par la méthode avec variance majorée est :1 n
S ω 1,96 S ω 1,96n n
I ω , . (1)
n 2 n n 2 n
Ici n 100 et les valeurs observées X ω ,...,X ω sont données dans le tableau1 100
ci-dessus. Pour calculer S ω , il suﬃt de compter le nombre de 1 dans ce :100
S ω 23, d’où100
I ω 0,132; 0,328 .
Pour justiﬁer la formule employée, on rappelle qu’en posant
n Sn
S : p ,n
p 1 p n
le théorème de de Moivre-Laplace nous donne pour tout t 0,
P t S t Φ t Φ t 2Φ t 1,n n
où Φ désigne la fonction de répartition de la loi normaleN 0, 1 . Ceci peut se réécrire :
P t S t 2Φ t 1 ε ,nn
p?q?qq
qq??p?p?q?p?qq?8pppppcqqsprq?pppq?q?pqppqqqqp?pLille I U.F.R. Math.
où l’erreur d’approximation gaussienneε tend vers 0 quandn tend vers l’inﬁni. On noten
ensuite que l’encadrement t S t se résout en un encadrement de p :n
S t p 1 p S t p 1 pn n
t S t p .n n n n n
Cet encadrement ne fournit pas un intervalle de conﬁance, car les bornes dépendent du
paramètre inconnu p. Pour y rémédier, on élargit cet encadrement en remarquant que
p 1 p est maximal pour p 1 2, d’où
S t S t S t p 1 p S t p 1 pn n n n
P p P p .
n 2 n n 2 n n n n n
On en déduit que
S t S tn n
P p 2Φ t 1 ε .n
n 2 n n 2 n
En particulier on peut appliquer ceci avec t 1,96 pour lequel 2Φ t 1 0,95.
En négligeant l’erreur d’approximation ε , on voit que la probabilité que l’intervalle100
aléatoire I déﬁni par (1) contienne p est d’au moins 0,95.
Ex 2. Dé
On lance 3600 fois un dé équilibré et on note nombre X de « cinq » obtenus. On
cherche une valeur approchée de P 578 X 622 . Posons pour i 1, 3600 ,
eA obtention d’un cinq au i lancer , Y 1 .i i Ai
Avec ces notations, il est clair que
3600
X Y.i
i 1
1Les A sont indépendants et de même probabilité p , les Y sont donc des variablei i6
1aléatoires de Bernoulli indépendantes et de paramètre p . On en déduit que X suit
6
1la loi binomiale de paramètres n 3 600 et p . En particulier :
6
622 k 3600 k1 5kP 578 X 622 C .3600 6 6
k 578
Le calcul exact de cette probabilité n’est pas possible avec les moyens usuels.
On va donc en donner une valeur approchée en utilisant le théorème de de Moivre
Laplace qui nous permet d’approximer la loi de
X EX
X :
VarX
page 2 9
v??{?a?????p?q?q
????q?w?{p?a?Pqt?p?qp?app
qpqp????qq?u?pa????Licence Initiation à la Statistique 2011
par la loi normale N 0, 1 , puisque X est la somme d’un grand nombre de variables
aléatoires de Bernoulli indépendantes et de même paramètre. En particulier pour tout
t 0,
P t X t 2Φ t 1, (2)
où Φ désigne la fonction de répartition de la loiN 0, 1 . L’espérance et la variance de la
variable aléatoire de loi binomiale X sont données par :
1 1 5
EX 3 600 600, VarX 3 600 500,
6 6 6
d’où
X 600
X .
10 5
On remarque ensuite que
578 600 622 600 2,2 2,2
578 X 622 X X .
10 5 10 5 5 5
2,2En appliquant (2) avec t , on en déduit que :
5
2,2
P 578 X 622 2Φ 1 2Φ 0,984 1.
5
Ici l’auteur du sujet (et du corrigé) présente ses excuses aux étudiants pour avoir, par
souci d’économie, inclus dans l’énoncé un fragment de la table de Φ, suﬃsant pour les
exercices 1 et 3, mais pas pour achever le calcul numérique ci-dessus. La notation des
copies tient évidemment compte de cette erreur.
Voici comment compléter à partir de l’extrait de table de Φ suivant :
x 0,90 0,91 0,92 0,93 0,94 0,95 0,96 0,97 0,98 0,99
Φ x 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
La table donne Φ 0,98 0,836 5 et Φ 0,99 0,838 9. On calcule une valeur approchée
de Φ 0,984 par interpolation linéaire.
0,984 0,98
Φ 0,984 Φ 0,98 Φ 0,99 Φ 0,98 0,836 5 0,4 0,002 4 0,837 46.
0,99 0,98
Et ﬁnalement,
P 578 X 622 0,674 92 0,675.
Ex 3. Estimation du paramètre d’une loi géométrique
La loi géométrique de paramètre θ 0, 1 est celle du temps d’attente du premier
succès dans une suite d’épreuves répétées indépendantes avec pour chaque épreuve pro-
babilité de succèsθ. Une variable aléatoireX sur l’espace probabilisé Ω,F,P suit cetteθ
loi si
k 1k N , P X k 1 θ θ. (3)θ
On se propose dans cet exercice d’estimer θ.
page 3 9
?p?p???qpq?Pp?qrqq?pq@?p
qqp??q??qppppqq?pp??p??q?qpqpqqp?p?q?{PsLille I U.F.R. Math.
1) Pour voir que (3) déﬁnit bien une loi de probabilité de variable aléatoire discrète,
k 1il suﬁt de vériﬁer que la série à termes positifs 1 θ θ est convergente de somme
k 1
1. Il s’agit d’une série géométrique de raison q 1 θ et comme 0 θ 1, il en va de
même pour q. La série est donc bien convergente. Sa somme se calcule en se ramenant
à la série géométrique standard :
θ
k 1 j1 θ θ θ 1 θ 1.
1 1 θ
j 0k 1
2) Calculons l’espérance
dk 1 k 1 kE X kP X k k 1 θ θ θ k 1 θ θ x .θ θ
dx x 1 θk 1 k 1 k 1 k 1
kLa série entière f x x a pour rayon de convergence 1 et est donc indéﬁniment
k 0
k 1dérivable terme à terme sur 1, 1 . Ainsi, pour tout x 1, 1 , f x kx .k 1
1 2Par ailleurs f x 1 x , d’où f x 1 x . En appliquant ces égalités avec
x 1 θ, il vient :
θ 1k 1E X θ k 1 θ .θ 21 1 θ θ
k 1
Pour calculer la variance de la loi de X sous P , on utilise la formule de Koenig :θ
2 2Var X E X E X ,θ θ θ
2qui nous ramène au calcul de E X .θ
2 2 2 k 1 k 1E X k P X k θ k 1 θ θ k k 1 k 1 θ .θ θ
k 1 k 1 k 1
1On peut découper cette dernière série en somme de deux séries à termes positifs :
k 1 k 2 k 1θ k k 1 k 1 θ θ 1 θ k k 1 1 θ θ k 1 θ
k 1 k 2 k 1
1
θ 1 θ f 1 θ
θ
2 1
θ 1 θ
31 1 θ θ
2 1 θ 1
.
2θ θ
1. Donc sans se préoccuper à ce stade de la convergence dansR qui sera obtenue en ﬁn de calcul. Par
kailleurs la série entière Q k x oùQ est un polynôme de degréd a aussi pour rayon de convergencek 0
1, donc il n’y a pas à s’inquiéter.
page 4 9
8??8pq?ppqq1qpppqp?8p?88qqqp8pppqq?qqpqp?r8pq??8q8p?pqpqqqp8?qqqpqppprqqqp?8qp?Ps8?8pq1pp8q8???pp?q8qq2pp?pqqpsqq8p{pLicence Initiation à la Statistique 2011
En reportant ceci dans la formule de Koenig ci-dessus on obtient :
2 1 θ 1 1 1 θ
Var X .θ 2 2 2θ θ θ θ
3) On considère désormais le modèle statistique Ω,F,P et unn-échantillonθ θ 0,1
X ,...,X associé.Autrementdit,pourtoutevaleurdeθ,lesvariablesaléatoiresX sont1 n i
P -indépendantes et de même loi sous P donnée par (3). On note S X Xθ θ n 1 n
la somme de cet échantillon.
Montrons que n S est un estimateur fortement consistant de θ, c’est-à-dire que :n
n P p.s.θ
θ 0, 1 , θ. (4)
nSn
Réglons d’abord la question de l’éventuelle nullité du dénominateur S . Posonsn
Ω : X 1 .1 i
i N
On vériﬁe que pour tout θ 0, 1 , P Ω 1. En eﬀet en passant à l’évènement com-θ 1
plémentaire, en notant que pour tout i N , P X 1 1 et en utilisant la sous-σ-θ i
additivité de P , on obtient :θ
cP Ω P X 1 P X 1 0,θ θ i θ i1
i N i 1
2 cpuisque tous les termes de cette série sont nuls . Donc P Ω 0 et P Ω 1. Onθ θ 11
remarque alors que
ω Ω , n 1, S ω n 0.1 n
Sur l’espace probabilisé Ω,F,P , l’application de la loi forte des grands nombresθ
à la suite des variables aléatoires X qui sont indépendantes et de même loi vériﬁanti
1E X E X , nous donne la convergence :θ 1 θ 1 θ
S 1n P p.s.θ .
nn θ
Cela signiﬁe qu’il existe un évènement Ω tel que P Ω 1 et2,θ θ 2,θ
S ω 1n
ω Ω , .2,θ
nn θ
Posons Ω Ω Ω . Pour tout ω Ω , S ω n est non nul. Par continuité sur R1 2,θ nθ θ
de la fonction t 1 t, la convergence ci-dessus entraîne alors que :
n
ω Ω , θ.θ nS ωn
2. Le même argument montre plus gnéralement qu’une intersection au plus dénombrable d’évène-
ments de probabilité 1 est encore un évènement de probabilité 1.
page 5 9
{?p??????qp1{?8??P?@Xp?q?p@?8q??????8?rPu??1qpq?Pqpq?@q{Ps@qP1qp8p?qr?Ps?Pu?ttPsq8|pPq???|?{?8?p?q?p?p??@PrppLille I U.F.R. Math.
Or Ω

Voir