Introductionàlastatistiquedesvaleursextrêmes Stéphane Girard

Publié par

  • exposé
1Introduction à la statistique des valeurs extrêmes Stéphane Girard INRIA Rhône-Alpes, projet Mistis http ://mistis.inrialpes.fr/˜girard novembre 2007
  • loi asymptotique de la moyenne x¯n
  • approche semi-paramétrique
  • échantillon de hauteurs d'eau annuelles
  • x¯n −
  • hauteur
  • échantillons
  • echantillon
  • échantillon
Publié le : mercredi 28 mars 2012
Lecture(s) : 45
Source : ens-lyon.fr
Nombre de pages : 48
Voir plus Voir moins

Introduction à la statistique des valeurs extrêmes
Stéphane Girard
INRIA Rhône-Alpes, projet Mistis
http ://mistis.inrialpes.fr/˜girard
novembre 2007
1Plan
1 Motivation
2 Etude du maximum
3 Etude des excès
4 Approche semi-paramétrique
5 Recherches actuelles
2Plan de l’exposé
1 Motivation
2 Etude du maximum
3 Etude des excès
4 Approche semi-paramétrique
5 Recherches actuelles
3Exemple
Hydrologie.
La hauteur d’une rivière est modélisée par une v.a. X. On dispose
de{X ,...,X } un échantillon de hauteurs d’eau annuelles. On1 n
note X ≤ X ≤···≤ X l’échantillon ordonné.1,n 2,n n,n
Deux problèmes complémentaires :
Calculer la probabilité p d’une hauteur d’eau h extrême
p =P(X > h) avec h > X .n,n
Calculer le niveau d’eau h qui est dépassé une seule fois sur T
années avec T > n, i.e. résoudre 1/T =P(X > h).
4Deux problèmes complémentaires
Définition de la fonction de survie :
¯F(x) =P(X > x) = 1−F(x) où F est la fonction de répartition.
1) Estimation de la queue de la fonction de survie. Etant
¯donné h, estimer p = F(h) avec h > Xn,n
2) Estimation de quantiles extrêmes. Etant donné p, estimer h
−1¯ ¯tel que p = F(h) avec p < 1/n, i.e. estimer h = F (p).
¯Difficulté commune : La fonction de survie F(x) est inconnue et
difficile à estimer au-delà du maximum (x > X ).n,n
5Approche paramétrique
Démarche :
On suppose un modèle paramétrique a priori pour la fonction
¯ ¯de survie : F ∈{F , θ∈ Θ}.θ
ˆOn estime θ par θ .n
Problème : Un bon ajustement sur l’échantillon ne garantit pas une
bonne modélisation au-delà du maximum.
6Illustration
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 1.00
En abscisse : p. En ordonnée, écart relatif entre le quantile d’ordre
p calculé avec un modèleN(0,1) et Student à 4 degrés de liberté.
7Approche non-paramétrique
Fonction de survie empirique. On estime P(X > x) par la
proportion d’observations qui dépassent x :
nX1ˆ¯F (x) = I{X > x}n i
n
i=1
ˆ¯Problème : F (x) = 0 si x > X .n n,n
8Plan de l’exposé
1 Motivation
2 Etude du maximum
3 Etude des excès
4 Approche semi-paramétrique
5 Recherches actuelles
9Objectif
Le Théorème de la Limite Centrale (TCL) donne, sous des
conditions standards, la loi asymptotique de la moyenne
nX1¯X = Xn i
n
i=1
d’un échantillon{X ,...,X } de variables indépendantes et1 n
identiquement distribuées :
¯√ X −E(X)n L
n −→N(0,1),
σ(X)
ou en termes de fonctions de répartition (fdr)
¯√ X −E(X)nlim P n ≤ x = Φ(x),
n→∞ σ(X)
où Φ est la fdr de la loiN(0,1). Le théorème des valeurs extrêmes
est un résultat similaire pour le maximum.
10

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.