ESTIMATION DE LA FONCTION DE DENSITE PAR LA METHODE DU NOYAU DE CONVOLUTION
13 pages
Français

ESTIMATION DE LA FONCTION DE DENSITE PAR LA METHODE DU NOYAU DE CONVOLUTION

-

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
13 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

ESTIMATION DE LA FONCTION DE DENSITE PAR LA METHODE DU NOYAU DE CONVOLUTION

Informations

Publié par
Publié le 30 août 2013
Nombre de lectures 439
Langue Français

Extrait

RÉPUBLIQUE DE CÔTE D’IVOIRE
Union-Discipline-Travail


Ministère d’Etat, Ministère du Plan et du
Développement
École Nationale Supérieure de Statistique et d’Économie
Appliquée

STATISTIQUE NON PARAMETRIQUE

ESTIM ATION DE LA FONCTION DE DENSITE
PAR LA M ETHODE DU NOYAU DE
CONVOLUTION


Rédigés par : Sous la direction de :
KOUPGANG Seumou Patrick M. KOUADIO Jean-Marc
GOHOUNGBE Franck Jacque Enseignant Chercheur à l’ENSEA
ZIBA Noufou
Elèves Ingénieurs Statisticiens Economistes
Juin 2012 Sommaire
INTRODUCTION ......................................................................................................................................... 3
I. Position du problème d’estimation de la densi té................... 3
II. Estimation par la méthode du noyau de convolution ................................................................................ 5
I.1. Définition d’un noyau ......................................................... 5
II.2. Notion de convolution ....................................................................................... 5
II.3. Méthode du noyau de convolution ..................................... 6
III. Convergence des estimateurs ............................................................................ 7
IV. APPLICATION : UN FILTRAGE UTILISANT LE NOYAU DE CONVOLUTION ........................................... 8
CONCLUSION ........................................... 12


KOUPGANG S Patrick, GOHOUNGBE P. Franck Jacques, ZIBA Noufou Page 2
INTRODUCTION
Dans l’étude de la loide la population mère d’un échantillon à vadaleur ns , la fonction de
répartition joue un rôle crucial. Elle nous permet certes d’avoir uneidé e sur la nature de cette loi,
mais elle ne nous permet pas de cerner avec précision la structure de la loi sous-jacente.
Cependant lorsque cet échantillon admet une densité, celle-ci fournie plus d’information sur la
population mère (dispersion, modes, etc.). Ceci justifie l’intérêt que porte la statistique non
paramétrique à l’estimation de cette fonction de densit é.
La non-existence d’un estimateur sans biais ou d’un estimateur adu ximmum de vraisemblance
rend le problème délicat : il faut construire des estimateurs spécifiques qui prennent en compte le
caractère local du paramètre f. Pour l’estimation de cette densité plusieurs méthodes peuvent être
utilisées, il s’agit par exemple de l’estimation par la méthode du noyau par projection,
l’estimation de la densité par la méthode du noyau géné, ralli’eséstimation de la densité par la
méthode du noyau de convolution, etc.
Dans le cadre de cette étude nous porterons notre intérêt sur la méthode d’estimation de la densité
par la méthode du noyau de convolution.
Notre travail comporte 3 points essentiels. D’abord, nous formulerons mathématiquement le
problème d’estimation de la densit . éEnsuite, nous présenterons la résolution de ce problème par
la méthode de convolution ainsi les propriétés des estimateurs obtenus. Enfin, nous présenterons
un exemple d’application.
I. Position du problème d’estimation de la densité

Nous disposons d’un n-échantillon de variables aléatoires indépendantes et
identiquement distribuées selon une loi (sur IR, pour simplifier). Nous supposons que cette loi
est absolument continue par rapport à la mesure de Lebesgue , de densité f. Le but est d’estimer
f ;
L’idée la plus naturelle consiste à estimer la densité en un point x en comptant le nombre
d’observations situées dans un certain voisinage de ; sur x R on peut choisir un voisinage de la
KOUPGANG S Patrick, GOHOUNGBE P. Franck Jacques, ZIBA Noufou Page 3
forme , où est un réel strictement positif, ce qui conduit à l’estimate ur:
F (X h / 2) F (X h / 2)n n n nˆfx()  n
hn
Où désignant la fonction de répartition empirique associée à un échantillon de taille n.
Cette expression peut encore s’écrire:
n xX1 jˆf (x)  K( ) n nh hj 1nn
Où sont les v.a de l’échantillon eoùt .

Sous cette forme apparaît comme la densité obtenue en régularisant la mesure empirique
par convolution avec Ceci suggère de définir une classe d’estimateurs
en choisissant une famille convenable de fonctions K que nous appellerons « noyaux de
convolution » ou plus simplement « noyaux » (kernels).
Pour juger de la qualité d’un tel estimateur, il nous faut définir sa proximité à la vraie densité et
trouver un bon critère (par exemple, une distance). La densité f de étant caractérisée par le fait
que pour tout ensemble A borélien, On requiert donc que pour tout borélien A,
et soient proches.
Cette proximité est mesurée par la distance en variation (où le supremum est pris sur tous les
boréliens), qui se trouve ici être égale à la moitié de la distance ,
11ˆ ˆ ˆ ˆsup (A)  f d   (f  f ) d   f  f d   f  f A n n  n n   122A
Cette quantité est appelée le risque de (contre f).
Remarquons que contrairement aux notions de mesure ou de fonction de répartition, qui
admettent des expressions empiriques canoniques avec de bonnes propriétés, il n’existe pas de
telle définition universellement admise de densité empirique. Par exemple, la mesure
empirique . la mesure de probabilité qui donne un poids 1/n à chacune des observations
KOUPGANG S Patrick, GOHOUNGBE P. Franck Jacques, ZIBA Noufou Page 4
n’est pas absolument continue par rapport à la mesurde Lee besgue; et sa distance
en variation à f (à ) est mêmeégale à 1. Il s’agdeit la mesure empirique (non canonique) à
qui l’on compare ait elle-même une densité .
L’estimateur par noyaux que nous introduisons dans le paragraphe suivant procédera par
convolution pour régulariser la mesure de telle sorte qu’ell soit absolument continue par
rapport à la mesure de Lebesgue.
II. Estimation par la méthode du noyau de convolution
I.1. Définition d’un noyau
Un noyau K est une application de , dans , bornée, intégrable par rapport à la mesure de
Lebesgue et d’intégrale 1 .
Un noyau est dit de Parzen-Rosenblatt si,
s
lim x K(x)  0
x 

II.2. Notion de convolution
La convolution par des mesures : lorsque la mesure borélienne ν par laquelle on convole est
donnée par une densité g par rapport à la mesure de Lebesgue, alors on aura, pour toute
, que Précisément, lorsque pour presque tout est v-
intégrable, alors on définit,
v g(x)  g(x y)dv(y) 
Pour tout n-échantillon , chaque étant une densité de probabilité, comme on peut
le voir par changement de variable linéaire, on a (par combinaison convexe) que pour tout n,
n1ˆf  K()x X   K n,h  h t n hn n nn t 1
existe et est également une densité de probabilité. Le raisonnement s’applique pour montrequer
existe et est aussi une densité.
KOUPGANG S Patrick, GOHOUNGBE P. Franck Jacques, ZIBA Noufou Page 5
On note que ces résultats sont encore valables lorsque les sont des variables
aléatoires.
Le texte fait allusion à une plus grande régularité possible des estimateurs par noyaux. En fait,
l’estimateur fondé sur est et il a exactement, comme fonction , la
régularité déterminée en fonction des estimations a priori que l’on a su cr onti f nueest , il s’agira
de prendre K continue également ; si f est à support compact, alors, si K est également à support
compact, les , de même que les sont à support compact, inclus dans les -
voisinages du support de f.
II.3. Méthode du noyau de convolution
Nous considérons les noyaux positifs, c’est à dire, les fonc ti ons telles que
Nous supposons en outre qu’elles admettent un moment d’ordre deux (sans que cette condition
fasse partie de la défi

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents