//img.uscri.be/pth/f991ef00dde4d8265e4a7beb12520d815add9737
La lecture en ligne est gratuite
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
Télécharger Lire

these

209 pages
THESEpresentee en vue de l’obtention duDOCTORAT DE L’UNIVERSITE PAUL SABATIERTOULOUSE IIIDiscipline : MathematiquesSpecialite : StatistiqueparChristophe CrambesModeles de regression lineaire pour variablesexplicatives fonctionnellesDirecteurs de these : Herve Cardot et Pascal SardaSoutenue le 23 novembre 2006 devant le jury compose de Messieurs :Beno^ t Cadre Universite Montpellier II RapporteurHerve Cardot CESAER - ENESAD INRA Dijon DirecteurAntonio Cuevas Universidad Aut onoma de Madrid RapporteurFrederic Ferraty Universite Paul Sabatier ExaminateurAlois Kneip Universit at BonnPascal Sarda Universite Paul Sabatier DirecteurLaboratoire de Statistique et ProbabilitesUMR CNRS 5583, Universite Paul Sabatier, Toulouse III2Memoire de these de doctoratModeles de regression lineaire pour variablesexplicatives fonctionnellesChristophe CrambesREMERCIEMENTSJe voudrais tout d’abord remercier Pascal Sarda et Herve Cardot pouravoir accepte d’encadrer ma these. Je tiens a les remercier de m’avoir accordeleur con ance depuis l’annee de mon DESS, ou ils ont encadre mon stage de n d’annee, et m’ont alors encourage a poursuivre en DEA et en these. Ils onttoujours fait preuve d’une tres grande disponibilite a mon egard et je realiseaujourd’hui a quel point travailler avec eux a ete enrichissant.Je tiens ensuite a remercier Beno^ t Cadre et Antonio Cuevas pour avoiraccepte d’^etre les rapporteurs de cette ...
Voir plus Voir moins

THESE
presentee en vue de l’obtention du
DOCTORAT DE L’UNIVERSITE PAUL SABATIER
TOULOUSE III
Discipline : Mathematiques
Specialite : Statistique
par
Christophe Crambes
Modeles de regression lineaire pour variables
explicatives fonctionnelles
Directeurs de these : Herve Cardot et Pascal Sarda
Soutenue le 23 novembre 2006 devant le jury compose de Messieurs :
Beno^ t Cadre Universite Montpellier II Rapporteur
Herve Cardot CESAER - ENESAD INRA Dijon Directeur
Antonio Cuevas Universidad Aut onoma de Madrid Rapporteur
Frederic Ferraty Universite Paul Sabatier Examinateur
Alois Kneip Universit at Bonn
Pascal Sarda Universite Paul Sabatier Directeur
Laboratoire de Statistique et Probabilites
UMR CNRS 5583, Universite Paul Sabatier, Toulouse III2Memoire de these de doctorat
Modeles de regression lineaire pour variables
explicatives fonctionnelles
Christophe CrambesREMERCIEMENTS
Je voudrais tout d’abord remercier Pascal Sarda et Herve Cardot pour
avoir accepte d’encadrer ma these. Je tiens a les remercier de m’avoir accorde
leur con ance depuis l’annee de mon DESS, ou ils ont encadre mon stage de
n d’annee, et m’ont alors encourage a poursuivre en DEA et en these. Ils ont
toujours fait preuve d’une tres grande disponibilite a mon egard et je realise
aujourd’hui a quel point travailler avec eux a ete enrichissant.
Je tiens ensuite a remercier Beno^ t Cadre et Antonio Cuevas pour avoir
accepte d’^etre les rapporteurs de cette these. Je suis tres att e de l’inter^et
qu’ils ont porte a ce travail. Leur relecture attentive du manuscript ainsi que
leurs remarques pertinentes ont contribue a ameliorer la version nale de ce
document.
Je suis tres heureux qu’Alois Kneip ait accepte de faire partie de mon jury.
Les deux sejours au cours desquels il m’a accueilli a Mayence puis a Bonn
m’ont enormement apporte aussi bien sur le plan mathematique que sur le
plan humain, et les travaux que nous avons en cours vont nous permettre de
poursuivre notre collaboration au-del a de cette these.
Je souhaite egalement remercier Frederic Ferraty de faire partie de mon
jury. Il m’a toujours apporte de bons conseils par rapport a mon travail, et j’ai
toujours pu trouver la porte de son bureau ouverte chaque fois que j’en ai eu
besoin.
Je voudrais a present remercier les professeurs du Laboratoire de Statis-
tique et Probabilites que j’ai pu cotoyer pendant ces trois annees de these,4 REMERCIEMENTS
notamment les membres du groupe travail STAPH : Philippe Vieu, Yves Ro-
main, Alain Boudou, Sylvie Viguier, et Lubos que j’ai plaisir a voir chaque
fois qu’il revient a Toulouse. Je remercie egalement Fabrice Gamboa pour la
con ance qu’il m’a accordee pendant mon annee de DEA, je garde un tres bon
souvenir de son enseignement. Je souhaite egalement remercier Anne Ruiz-
ereGazen, que je connais mieux depuis la 1 Rencontre des Jeunes Statisticiens
a Aussois. Elle s’est montree tres disponible pour repondre a mes questions et
discuter avec elle m’a permis d’envisager de nouvelles pistes de recherche.
Je tiens aussi a remercier particulierement Fran coise Michel pour sa dispo-
nibilite, sa bonne humeur et son e cacit e pour prendre en charge les problemes
administratifs que l’on rencontre au quotidien.
Ces trois annees de these m’ont egalement permis de rencontrer des doc-
torants avec qui je passe de tres bons moments. Les doctorants arrives l’an
dernier, Maxime, Laurent, Florent et Amelie, ont apporte leur bonne humeur
pendant la pause quizz de midi. Mes remerciements vont aussi aux doctorants
arrives en these la m^eme annee que moi ou l’annee suivante, qui vont me laisser
de tres bons souvenirs : Delphine (avec qui ca a ete un plaisir de partager le
bureau ces deux dernieres annees), Marielle, Agnes, Solenn, Myriam et Diana.
Je ne saurais oublier les doctorants qui m’ont accueilli a mon arrivee en these,
et tous les bons moments qu’on a passe : Renaud, Clement, Cecile, Yan, Elie,
Abdela^ ati, Nicolas et Jean-Pierre. Je souhaite aussi remercier Sebastien, a qui
Aj’ai pose d’innombrables questions sur LT X, sur R, et je retiens avant toutE
sa disponibilite et sa bonne humeur. En n, je connais Lionel depuis le DEA
et on partage le m^eme bureau depuis le debut de notre these, et je tiens a lui
dire quel plaisir j’ai eu de pouvoir faire ma these en m^eme temps que lui, pour
tous les bons moments passes pendant ces annees.
En n, je voudrais remercier ma famille, plus particulierement mes parents
qui m’ont toujours soutenu dans les etudes et qui m’ont permis de les realiser
dans les meilleures conditions possibles. Je remercie aussi ma s ur Magali,
ainsi que Marc, Julie et Anthony pour tous les moments qu’on passe ensemble
chaque fois que je reviens a Perpignan. En n, pour tout ce qu’elle m’apporte,
je remercie Marine.TABLE DES MATIERES
Remerciements . . . .. .. .. .. .. .. .. .. ... .. .. .. . .. .. .. .. .. .. .. ... .. .. .. .. 3
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Partie I. Estimation spline de quantiles conditionnels pour variable
explicative fonctionnelle . . . . .. .. .. .. .. .. . .. .. .. . . .. .. .. .. .. .. . .. .. .. 29
I.1. Presentation de l’estimateur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
I.2. Quantile regression when the covariates are functions . . . . . . 35
I.4.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
I.4.2. Construction of the estimator . . .. . .. .. . .. . .. . .. .. .. . .. . .. . .. . .. 37
I.4.3. Convergence result . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
I.4.4. Some comments . . .............................................. 42
I.4.5. Proof of the convergence result . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
I.3. Commentaires et perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 616 TABLE DES MATIERES
Partie II. Estimateur par splines de lissage dans le modele lineaire
fonctionnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
II.1. Construction de l’estimateur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
II.2. Resultat de convergence . . . .. . . . .. . . .. . . . .. . . .. . . .. . . . .. . . .. . . 71
II.3. Commentaires et perspectives . . ...... ...... ..... ...... ...... . 73
Partie III. Modele lineaire fonctionnel lorsque la variable explicative
est bruitee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
III.1. Moindres carres orthogonaux - Cas multivarie . . . . . . . . . . . . 77
III.2. Moindres carres orthogonaux - Cas fonctionnel . . . . . . . . . . 83
III.2.1. Construction de l’estimateur (splines de regression) . . . . . . . . . . 84
III.2.2. Resultat de convergence . . . ... ... .... ... ... .. ... .... ... ... .... 87
III.2.3. Commentaires . . .............................................. 89
III.2.4. Estimateur par splines de lissage . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
III.2.5. Perspectives . . ............... ......................... ........ 90
III.3. Functional linear regression with errors-in-variables . . . . . . 91
III.3.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
III.3.2. Estimation of in the non-noisy case . . . . . . . . . . . . . . . . . . . . . . . . 94
III.3.3. Total Least Squares method for functional covariates . . . . . . . . 99
III.3.4. Some comments . . .... ..... .... ..... .... ... ..... .... ..... .... . 103TABLE DES MATIERES 7
III.3.5. A simulation study . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
III.3.6. Proof of the results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
III.4. Regression sur composantes principales . . . . . .. . . . . . . . . . .. . . 121
III.4.1. Procedure d’estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
III.4.2. Integrale du carre de la regression . . . . . .. . . . .. . . . . . . . .. . . . .. . . 126
III.4.3. Resultats asymptotiques . . .................................... 129
III.4.4. Perspectives . . ............... ......................... ........ 131
Partie IV. Application a la prevision de pics de pollution . . . . 133
IV.1. Prevision par les quantiles conditionnels . . . . . . . . . . . . . . . . . . 135
IV.1.1. Algorithme d’estimation . . .... ........ ...... ........ ........ .. 135
IV.1.2. Choix des parametres . . .. . . . .. . . . .. . . . .. . . .. . . . .. . . . .. . . . .. . . 137
IV.1.3. Modele avec plusieurs variables explicatives . . . . . . . . . . . . . . . . . . 138
IV.2. Prevision par la moyenne conditionnelle . . . . . . . . . . . . . . . . . . 141
IV.2.1. Estimation par splines de regression . . . . . .. . . . . .. . . . .. . . . . .. . . 141
IV.2.2. Estimation par splines de lissage . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
IV.3. Donnees de pollution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
IV.4. Ozone pollution forecasting . . . ..... ..... ..... .... ...... ..... . 147
IV.4.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
IV.4.2. A brief analysis of the data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1488 TABLE DES MATIERES
IV.4.3. Functional linear model . . .. . . . .. . . . .. . . . . .. . . . .. . . . .. . . . . .. . . 151
IV.4.4. Conditional quantiles estimation . . ............................ 156
IV.4.5. Application to Ozone prediction . . .. .. .. ... .. .. . ... .. .. .. ... .. 160
Partie V. Annexe . . .. .. . .. .. . .. .. . .. .. .. . .. .. .. . .. .. .. . .. .. . .. .. . .. 167
V.1. Variable explicative bruitee - Preuves . . . . . . . . . . . . . . . . . . . . . . 169
V.2. Integrale du carre de la regression - Preuves . . . . . . . . . . . . . . 175
V.3. Regression sur composantes principales - Preuves . . . . . . . . 193
Bibliographie . . . . .. .. . .. .. . .. .. . .. . .. .. . .. . . .. .. . .. .. . .. . .. .. . .. .. . .. 199