Classification de données multivariées multitypes basée sur des modèles de mélange : application à l étude d assemblages d espèces en écologie, Model-based clustering for multivariate and mixed-mode data : application to multi-species spatial ecological data
167 pages
Français

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Classification de données multivariées multitypes basée sur des modèles de mélange : application à l'étude d'assemblages d'espèces en écologie, Model-based clustering for multivariate and mixed-mode data : application to multi-species spatial ecological data

-

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
167 pages
Français
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Sous la direction de Rachid Senoussi, André Kretzschmar, Samuel Soubeyrand
Thèse soutenue le 17 décembre 2010: Avignon
En écologie des populations, les distributions spatiales d'espèces sont étudiées afin d'inférer l'existence de processus sous-jacents, tels que les interactions intra- et interspécifiques et les réponses des espèces à l'hétérogénéité de l'environnement. Nous proposons d'analyser les données spatiales multi-spécifiques sous l'angle des assemblages d'espèces, que nous considérons en termes d'abondances absolues et non de diversité des espèces. Les assemblages d'espèces sont une des signatures des interactions spatiales locales des espèces entre elles et avec leur environnement. L'étude des assemblages d'espèces peut permettre de détecter plusieurs types d'équilibres spatialisés et de les associer à l'effet de variables environnementales. Les assemblages d'espèces sont définis ici par classification non spatiale des observations multivariées d'abondances d'espèces. Les méthodes de classification basées sur les modèles de mélange ont été choisies afin d'avoir une mesure de l'incertitude de la classification et de modéliser un assemblage par une loi de probabilité multivariée. Dans ce cadre, nous proposons : 1. une méthode d'analyse exploratoire de données spatiales multivariées d'abondances d'espèces, qui permet de détecter des assemblages d'espèces par classification, de les cartographier et d'analyser leur structure spatiale. Des lois usuelles, telle que la Gaussienne multivariée, sont utilisées pour modéliser les assemblages, 2. un modèle hiérarchique pour les assemblages d'abondances lorsque les lois usuelles ne suffisent pas. Ce modèle peut facilement s'adapter à des données contenant des variables de types différents, qui sont fréquemment rencontrées en écologie, 3. une méthode de classification de données contenant des variables de types différents basée sur des mélanges de lois à structure hiérarchique (définies en 2.). Deux applications en écologie ont guidé et illustré ce travail : l'étude à petite échelle des assemblages de deux espèces de pucerons sur des feuilles de clémentinier et l'étude à large échelle des assemblages d'une plante hôte, le plantain lancéolé, et de son pathogène, l'oïdium, sur les îles Aland en Finlande
-Assemblage d'espèces
-Classification basée sur des modèles de mélange
-Coexistence
-Données mixtes
-Données multivariées spatiales
-Modèle gaussien latent
-Modèle hiérarchique
-Monte Carlo EM
In population ecology, species spatial patterns are studied in order to infer the existence of underlying processes, such as interactions within and between species, and species response to environmental heterogeneity. We propose to analyze spatial multi-species data by defining species abundance assemblages. Species assemblages are one of the signatures of the local spatial interactions between species and with their environment. Species assemblages are defined here by a non spatial classification of the multivariate observations of species abundances. Model-based clustering procedures using mixture models were chosen in order to have an estimation of the classification uncertainty and to model an assemblage by a multivariate probability distribution. We propose : 1. An exploratory tool for the study of spatial multivariate observations of species abundances, which defines species assemblages by a model-based clustering procedure, and then maps and analyzes the spatial structure of the assemblages. Common distributions, such as the multivariate Gaussian, are used to model the assemblages. 2. A hierarchical model for abundance assemblages which cannot be modeled with common distributions. This model can be easily adapted to mixed mode data, which are frequent in ecology. 3. A clustering procedure for mixed-mode data based on mixtures of hierarchical models. Two ecological case-studies guided and illustrated this work: the small-scale study of the assemblages of two aphid species on leaves of Citrus trees, and the large-scale study of the assemblages of a host plant, Plantago lanceolata, and its pathogen, the powdery mildew, on the Aland islands in south-west Finland
-Species assemblages
-Finite mixture models
-Coexistence
-Mixed mode data
-Multivariate data
-Latent gaussian model
-Hierarchical model
-Monte Carlo Expectation Maximization (MCEM) algorithm
-Model-based clustering
-Spatial data
Source: http://www.theses.fr/2010AVIG0321/document

Informations

Publié par
Nombre de lectures 28
Langue Français
Poids de l'ouvrage 4 Mo

Extrait

Mon
t
ellier
CADÉMIE
A
D'AIX-MARSEILLE
e
UNIVERSITÉ
h
D'A
thèse
VIGNON
M.
ET
ersité
DES
Chargé
P
INRA
A
de
YS
Directeur
DE
Système
V
M.
A
eyrand
UCLUSE
I
THÈSE
de
présen
cque
tée
he,
p
herc
our
Directeur
obtenir
A
le
INRA
grade
orteur
de
de
Do
ED
cteur
B
en
hid
Sciences
Kretzsc
de
uel
l'Univ
Univ
ersité
ellier
d'A
Professeur,
vignon
Liège
et
herc
des
INRIA
P
c
a
rec
ys
Mon
de
de
V
e
aucluse
vi
Sp
rec
écialité
,
:
gnon
Biostatistique
herc
Classifica
vignon
tion
jury
de
orteur
données
thèse
mul
Directeur
tiv
do
ariées
Information,
mul
Lab
t
oSP
itypes
vignon
basée
Senoussi
sur
André
des
hmar
modèles
Sam
de
Soub
mélange
Professeur,
Applica
ersité
tion
tp
à
I
l
I
'étude
Univ
d'assembla
de
ges
Directeur
d'espèces
rec
en
h
écologie
,
par
Ro
V
n
era
ourt
GEOR
de
GE
herc
SCU
CIRAD
souten
tp
ue
Directeur
publiquemen
rec
t
h
le
,
17
A
décem
gnon
bre
de
2010
herc
dev
e
an
INRA
t
vi
un
Chargé
jury
rec
comp
he,
osé
A
de
Présiden
:
du
M.
Rapp
Christian
Rapp
La
Examinateur
v
de
ergne
Directeur
M.
thèse
Jean-Jacques
de
Boreux
École
M.
ctorale
Gil
166
les
Structures,
Celeux
s
M.
oratoire
F
i
rédéric
INRA
Mortier
Rac
M.
A
tel-00624382, version 1 - 16 Sep 2011tel-00624382, version 1 - 16 Sep 2011Remerciements
Cette th`ese est le fruit d’un heureux hasard. Je ne voulais pas faire une th`ese, je ne l’ai pas
cherch´ee et je ne m’attendais pas non plus a` une telle proposition, lorsqu’en juin 2007 je suis all´ee
aux “Premi`eres rencontres de statistiques spatiales de Niolon” sur l’invitation de Pascal Monestiez.
C’est Andr´e Kretzschmar, par la suite mon directeur de th`ese, qui m’a propos´e ce projet, un soir,
autour d’une bi`ere, dans l’unique bar de Niolon.
Une desraisonspourlesquellesj’aichoisidefairecette th`esea´et´emacuriosit´eded´ecouvrirenfin
le laboratoire BioSP d’Avignon, dont plusieurs sources m’avaient vant´e l’ambiance exceptionnelle.
Ce fut un privil`ege de travailler dans un cadre aussi chaleureux et propice au travail en ´equipe que
l’a ´et´e le laboratoire BioSP de l’INRA d’Avignon. Je remercie tous les membres de cette unit´e pour
leur accueil et je tiens a` remercier certains de mes coll`egues tout particuli`erement pour leur aide
pr´ecieuse au cours de mon s´ejour.
J’ai eu la chance d’avoir, non pas un, mais trois directeurs de th`ese, qui se sont tous impliqu´es
et m’ont apport´e des points de vue diff´erents, des aides et connaissances compl´ementaires. Je les
remercie pour le temps et l’attention qu’ils m’ont consacr´e durant ces trois ann´ees.
Andr´e sans qui il n’y aurait rien eu : ni la th`ese, ni le projet, ni le financement, et puis surtout
sans qui je n’aurais probablement jamais emprunt´e ce chemin. Merci d’avoir veill´e `a ce que tout se
passe bien, de m’avoir pouss´ee a` me fixer des objectifs et a` m’y tenir et de m’avoir encourag´ee et
soutenue dans les moments difficiles. Je garde d’excellents souvenirs de nos deux voyagesen Corse a`
la recherche de pucerons, mˆeme si les quelques rares colonies que nous avons d´enich´e n’ont pas suffi
pour alimenter le mod`ele spatio-temporel ambitieux vers lequel on tendait.
Merci a` Rachid Senoussi pour sa patience face a` mes lacunes th´eoriques, qu’il a r´eussi `a combler
en partie, ses v´erificationspointilleuses de mes calculs et ses relecturesattentives. Il a´et´emon appui
et r´ef´erent th´eorique face aux calculs et d´emonstrations.
Je remercie Samuel Soubeyrand, qui, bien que sans rapport direct avec ma th`ese au d´epart, est
rapidementdevenumontroisi`emedirecteurdeth`ese.Sonimplicationa´et´etelle qu’ila´et´e`a l’origine
desgrandeslignesdirectricesdemath`ese.Sonimagination,sacomp´etenceetsonpragmatismem’ont
´et´e d’une aide inestimable.
Je tiens `a leur dire a` quel point j’ai appr´eci´e leur gentillesse et leur sens de l’humour, que j’ai
1´eprouv´e plus d’une fois.
1 notamment en leur envoyantpar mail, un mois avantla date pr´evuepour la soumission demon manuscrit
de th`ese, ma soi-disant d´ecision d’arrˆeter la science pour me consacrer `a des activit´es artistiques. L’effet
escompt´e s’est produit et j’ai ainsi r´eussi `a fixer une r´eunion en un temps record.
tel-00624382, version 1 - 16 Sep 2011VI
Un grand merci `a tous mes autres collaborateurs et en particulier a` Nicolas Desassis, qui a
rendu possible toute la deuxi`eme partie de ma th`ese grˆace a` ses comp´etences algorithmiques et
son enthousiasme a` toute ´epreuve, et Anna-Liisa Laine, qui m’a donn´e la possibilit´e de me pencher
sur d’autres jeux de donn´ees que les donn´ees de pucerons Corses. L’application biologique qui en a
d´ecoul´e a sans aucun doute jou´e un rˆole d´ecisif dans la publication de mon premier article.
Jeremercie´egalementles membresde moncomit´edepilotagepour leursuivietleurcontribution
au bon d´eroulement de ma th`ese : Radu Stoica (Universit´e Lille 1), Jean-No¨el Bacro (Universit´e
Montpellier 2), et tout sp´ecialement Dominique Agostini (Pr´esidente du Centre INRA de Corse)
pour son accueil en Corse et son aide dans la mise en place de notre travail de collecte de donn´ees.
Je remercie mon jury de th`ese qui m’a fait l’honneur de venir (malgr´e quelques ´emotions) un
vendredi 17 d´ecembre avant les vacances de No¨el.
Cetteth`esea´et´efinanc´eeparl’INRAetlar´egionPACA,maiscefinancementa´et´erendupossible
graˆce`alaparticipationduGRCETAdeBasseDurance.JeremercieenparticulierPascalBoriolipour
sa bienveillance et sa compr´ehension lorsque les circonstances (certaines lacunes dans les donn´ees
pucerons que nous n’avons pas r´eussi a` combler graˆce `a de nouvelles donn´ees) ont ´eloign´e ma th`ese
de la probl´ematique initiale des pucerons pour lui faire prendre une tournure plus m´ethodologique
et g´en´erale.
Lath`eseaaussi´et´el’occasionde fairedes rencontresformidables,je pense notammentaugroupe
de Rochebrune (sensiblement le mˆeme que celui de Niolon), ainsi qu’au groupe de Model-Based
Clustering.Bienplusquelescongr`es,cesgroupesdetravaild’unesemainem’ontpermisdeconnaˆıtre
2des chercheurs franc¸ais et ´etrangers dans une bonne ambiance et un esprit de collaboration.
J’ai´egalementune pens´ee pour Gilles Caraux,mon professeur de statistiques en deuxi`eme ann´ee
a` l’Agro Montpellier, qui a ´eveill´e mon int´erˆet pour les statistiques.
Je suis tr`es reconnaissante `a tous mes coll`egues et amis du labo BioSP d’avoir ´et´e l`a :
Flo, mon amie de longue date, toujours l`a pour discuter et aider, dont les conseils avis´es m’ont
permis d’avancer et de voir plus loin dans ma th`ese,
Julien, dont l’insouciance contagieuse a eu raison de mes doutes et inqui´etudes du d´ebut,
Emily,quim’aencourag´eeetaid´eetoutaulongdelar´edactionfinalemalgr´emonhumeurmorose,
Jimmy, de bonne humeur en toutes circonstances,
Lionel, toujours cynique et toujours prˆet `a rire de tout,
Etienne, pour sa gentillesse, ses relectures et ses conseils,
Pascal, dont j’ai toujours appr´eci´e les discussions malgr´e son point de vue rarement optimiste,
3Joel, grand esprit critique, qui a contribu´e a` mettre ma th`ese sur les rails,
Denis, pour ses coups de pouce qui m’ont ouvert des nouvelles opportunit´es,
Sylvie, qui a toujours veill´e `a ce que tout se passe bien dans le labo,
Herv´e, mon soutien informatique et Linux (c’est les meilleurs!),
Franck, pour son soutien Matlab et sa bonne humeur,
Marie-Odile, qui, sans pouvoir ˆetre l`a a` mon pot de th`ese, a pens´e a` pr´eparer quelque chose.
Merci encore a` Emily et Andr´e pour mes pneus neufs en p´eriode de crise.
2 ainsi que d’am´eliorer mon niveau de ski
3 je dirais mˆeme excellent
tel-00624382, version 1 - 16 Sep 2011VII
Ces trois ann´ees ont ´et´e marqu´ees par des moments inoubliables, concours de p´etanque, nom-
breuses soir´ees entre amis chez

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents