Observatoire de StrasbourgAnnée universitaire 2002-2003 Karim-Pierre MAALEJ Mémoire de stage DEA Astrophysique et Analyse statistique de données !odélisa"on sta"s"que de Pearso# $our l’imagerie mul"bande en As%onomi& 1 '1080 nm' '1130 nm' '1640 nm' '1660 nm' 1.5 1.5 '2120 nm' '2150 nm' 2 2 2.5 3 3.5 4 4.5 4.5 5 5 5.5 0 0.2 0.4 0.6 0.8 1 Soutenu le 24 juin 2003 devant le jury présidé par Mme Agnès Acker et composé de MM. H. Baty, R. Freire-Ferrero, J. Heyvaerts et J. Köppen Stage effectué au Centre de Données astronomiques de Strasbourg (Observatoire de Strasbourg, UMR 7550), en collaboration avec le Laboratoire des Sciences de l'Image, de l'Informatique et de la Télédétection (UMR 7005), sous la direction de Mme Mireille Louys (Maître de Conférences) et M. Christophe Collet (Professeur). CDS, Observatoire de Strasbourg, 11 rue de l'Université, 67000 Strasbourg — http://cdsweb.u-strasbg.fr/ LSIIT, Pôle API, boulevard Sébastien Brant, 67400 Illkirch-Graffenstaden — http://lsiit.u-strasbg.fr/REMERCIEMENTS Je voudrais ici remercier Mireille Louys, pour m’avoir offert l’opportunite´ de ce stage, ainsi que Christophe Collet, pour avoir bien voulu assurer l’encadrement de mon travail plus activement que ´ `prevu. Je tiens aussi a remercier toutes les personnes avec qui j’ai eu l’occasion de travailler pendant ce stage, notamment Farid Flitti et Ana¨ıs Oberto pour leur aide et leur gentillesse. Merci eg´ alement aux personnes qui m’ont soutenu tout au long du DEA ...
JevoudraisiciremercierMireilleLouys,pourm’avoiroffertl’opportunit´edecestage,ainsique Christophe Collet, pour avoir bien voulu assurer l’encadrement de mon travail plus activement que pr´evu.Jetiensaussiaremerciertouteslespersonnesavecquij’aieul’occasiondetravaillerpendantce stage,notammentFaridFlittietAna¨sObertopourleuraideetleurgentillesse.
Merci´egalementauxpersonnesquim’ontsoutenutoutaulongduDEA,etnotammentAgnes Acker pour son enthousiasme communicatif, mes parents pour leurs encouragements, et bien entendu macompagneFannypoursapr´esenceamescoˆt´es.
Enn, ces remerciements ne seraient pas complets si je ne mentionnais pas mon ami Nicolas Martin, avec qui j’ai partag e´ chaque midi plus que des repas, puisque c’est aces moments que nous ´echangionsdesconseilssouventbienutiles.
iii
R´ES´ UME
Dans le cadre du projet d’observatoire virtuel, des techniques d’analyse d’images multispectrales sont de´veloppe´es an de permettre de localiser l’information. Parmi celles-ci, le projet MARSIAA ex-plorelesvoiesoffertesparlasegmentationmarkoviennepour´etablirunecartepartageantl’imageen classeshomogenesspatialementetdemeˆmedistributionspectrale.Aucoursdecettesegmentation, lesdistributionssontmode´lis´eespardesloisgaussiennes.L’objectifdecettee´tudeestd’´etudierdans quellemesurecemodelegagneraitaeˆtre´etenduad’autrestypesdelois.LesystemedePearsonoffre encesensuneperspectiveinte´ressantepuisqu’ilpre´sentel’avantaged’offrirunetresgrandediversit´ede prolspourseulementquatreparametresaestimer. Lesrechercheseffectu´eesontport´esurl’expressiondesparametresdesloisstatistiquesdusysteme dePearsonenfonctiondesparametresestim´ssurlesclassessegment´ees.Andevaliderlad´emarche, e ilae´te´proce´de´adessimulationsnume´riquesd’imagesmultibandescomportantdiversobjetsbruit´es selondesloisGaussienne,Gamma,Beˆtasym´etriqueetBeˆtaasyme´trique.Nousavonse´galemente´tudie´ leseffetsdelar´eductiondedimensionnalite´pardeuxme´thodesd’analysemultivarie´e:l’analyseen composantes inde´pendantes (ACI) et l’analyse en composantes principales (ACP). Cesd´eveloppementsont´ete´misenœuvresurdesimagesmultibandesdansledomaineinfrarouge de la galaxie M82. Il ressort de cette application qu’une grande part des distributions sont proches des distributions gaussiennes, ce qui valide les travaux mene´s avant cette e´tude, mais qu’un rafnement du modeleint´egrantlesloisissuesdusystemedePearsonpermettraitd’accroˆtrel’efcaci´etdelasegmen-tation.
AB STRACT
Within the framework of the virtual observatory project are developed several multispectral image analysis techniques so that it becomes possible to localize and extract the information. Among those, the MARSIAA project experiments Markovian segmentations to generate a label map dividing the image into spatially homogeneous classes according to the spectral distribution. During this process, the dis-tributions are modelled by Gaussian laws. The aim of this study is to study how much this model could be improved by extending it to other common distributions. Pearson’s system offers in this direction an interesting prospect as it offers a great diversity of proles for only four parameters to estimate.
We carried out the research about the link between the parameters of a distribution from Pearson’s system and the estimated parameters from the segmentation classes. With a purpose of validating the step, we processed digital simulations of multiband images composed of various objects noised with Gaussian, Gamma, and symmetrical and asymmetrical Beta distributions. We also studied the effects of the reduction of dimensionnality by two multivariate analysis methods: independent components analysis (ICA) and principal components analysis (PCA).
These developments were implemented on multiband images in the infrared range of M82. The outcome is that a great part of the distributions are close to the Gaussian, which validates the work undertaken before this study, but also that a renement of the model using distributions from Pearson’s system would increase the efciency of the segmentation process.
L’OmBeJnEtaCtiToIFnamkrvo-imagesasiennedesmseuitlunortqimoelevp´opndbad´esegseseatdrcemeeiralibueontrtdecednoitaroile´ma’egesedqunichtelarprlepeepatroje MARSIAA.Acetten,nouse´tudionsl’apportdenouveauxmodelesdeloisstatistiquesauprocessus de segmentation.
Cestravauxs’inserentdanslecadrege´n´eralduprojetd’ObservatoireVirtuel,cequiestdeveloppe ´ ´ dans le premier chapitre de ce rapport. Nous exposons ensuite dans le chapitre deux les recherches que nousavonsmen´eesetlesde´veloppementsquenousavonseffectue´s.Letroisiemechapitrede´critles resultats de la mise en oeuvre de ces travaux. Enn, un bilan termine cet expose´. ´
1
CHAPITREPREMIER CONTEXTE DES TRAVAUX
1–L’OBSERVATOIRE VIRTUEL
Un projet devenu essentiel
Notre Univers est un objet physique incroyablement complexe. On y est confronte´ en meˆme temps adetresgrandes´echellesdedistancesetdetemps,etaunegrandediversite´d’objets,allantdesgrains de poussiere interstellaire aux gigantesques amas galactiques. Pour appr´hender ce monde, les astrophysiciens ont sans cesse recours aux techniques les plus e r´ecentesetlesplussophistiqu´ees.Ilsaccumulentainsid’immensesquantite´sdedonn´eesdetoutenature, maisellessontdispers´eessurlesarchivesnume´riquesdumondeentier.Deplus,toutescesobservations sontfaitesavecdesinstrumentsdiff´erents,travaillantdansdeslongueursd’ondesdiff´erentes,ades re´solutionsdiff´erentes,etilestdifciledereliertoutescesdonn´eeshe´te´rogenespourentirersens. C’estpourquoiilyaaujourd’huiunbesoinurgentdanslacommunaut´eastronomiqueinternatio-nalepourdesoutilsdetraitementdel’informationcapablesdecroisertoutescesbanquesdedonne´es et en tirer une image de l’Univers aussi compl ete que possible. C’est justement l’objectif poursuivi par lesdiffe´rentsprojetsd’observatoiresvirtuelsne´sdansdiversesr´egionsdumonde,etregroupesdans ´ l’International Virtual Observatory Alliance[12]. Le concept d’observatoire virtuel
Un observatoire virtuel est de fait une collection d’archives de donn e´es interactives et d’outils logiciels qui utilisent l’Internet pour b aˆtir un environnement de recherche scientique dans lequel les programmesderechercheenastronomiepourronteˆtreconduits.Delameˆmefa¸conqu’unobservatoire r´eelestunensembledete´lescopes,chacunavecunecollectionuniqued’instrumentsastronomiques, l’observatoirevirtuelconsisteenunensembledecentresdedonn´ees,chacunavecunecollectionunique dedonn´eesastronomiques,logicielsetcapacit´esdecalcul. L’observatoirevirtuelpourraautomatiserlaproc´edure,actuellementp´enible,derechercheetde rassemblementdedonn´eesastronomiques,etrecouperl’informationpourcre´eruntoutsup´erieurala somme de ses parties. Ceci sera rendu possible d’une part par un immense effort de standardisation aussi biendesdonne´esquedesme´thodesetoutilsutilis´esparlesastronomes,etd’autrepartenutilisantla technologie GRID1artereinamedredraagalentrepansedactie´pacadnceedanartir´eplculslesouracc´ep diverscentresdedonn´eesatraverslemonde,adistanceapartirdesonbureau.
1Globalisation des Ressources Informatiques et des Donne´es