Modèles et méthodes pour l'information spatio-temporelle évolutive, Models and methods for handling of evolutive spatio-temporal data

-

Documents
330 pages
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Sous la direction de Jerôme Gensel, Claude Grasland
Thèse soutenue le 22 septembre 2011: Grenoble
Cette thèse se situe dans le domaine de la modélisation spatio-temporelle, et nos travaux portent plus particulièrement sur la gestion de l'information statistique territoriale. Aujourd'hui, la mise à disposition d'un grand volume d'informations statistiques territoriales par différents producteurs (Eurostat, l'INSEE, l'Agence Européenne de l'Environnement, l'ONU, etc.) offre une perspective d'analyses riches, permettant de combiner des données portant sur des thématiques diverses (économiques, sociales, environnementales), à des niveaux d'étude du territoire multiples : du local (les communes) au global (les états). Cependant, il apparaît que les supports, les définitions, les modalités de classification, et le niveau de fiabilité de ces données ne sont pas homogènes, ni dans l'espace, ni dans le temps. De ce fait, les données sont difficilement comparables. Cette hétérogénéité est au cœur de notre problématique, et pour lui faire face, c'est-à-dire l'appréhender, la mesurer et la contrôler, nous faisons dans cette thèse trois propositions pour permettre in fine une exploitation avisée de ce type de données. La première proposition a pour cible le support de l'information statistique territoriale, et cherche à rendre compte à la fois de son caractère évolutif et de son caractère hiérarchique. La deuxième proposition traite du problème de variabilité sémantique des valeurs statistiques associées au support, au moyen de métadonnées. Nous proposons un profil adapté du standard ISO 19115, facilitant l'acquisition de ces métadonnées pour des producteurs de données. La troisième proposition explore la mise à disposition d'outils pour analyser et explorer ces informations dans un mode interactif. Nous proposons une plate-forme dédiée aux analyses statistiques et visant à repérer des valeurs exceptionnelles (outliers en anglais), et à les mettre en relation avec leur origine, et les modalités de leur production.
-Espace géographique
-Dimension temporelle
-Estimation
-Généalogie
-Tracabilité
-Qualité des données
This thesis is in the field of spatiotemporal modelling, and our work focuses specifically on the management of territorial statistical information. Today, the availability of large amounts of statistical information by different regional producers (Eurostat, INSEE, the European Environment Agency, the UN, etc..) offers a rich analytical perspective, by the combination of data on various topics (economic, social, environmental), at various levels of study: from the local (municipalities) to global (states). However, it appears that the spatial supports, the definitions, the various classifications and the reliability level of those data are very heterogeneous. This heterogeneity is at the core of our problem. In order to cope with that, that is to say to measure, control and analyse this heterogeneity, we are drawing three proposals allowing for a wiser exploitation of this kind of data. The first proposal aims at taking into account the change of the support through the time, modelling both the evolutive aspect of the territories and their hierarchical organisation. The second proposal deals with the semantic variability of the data values associated to this support, through the use of metadata. A profile of the ISO 19115 standard is defined, in order to ease the edition of those metadata for data producers. The last proposal defines a platform dedicated to spatiotemporal data exploration and comparison. In particular, outliers can be discovered though the use of statistical methods, and their values can be discussed and documented further through the use of metadata showing their origin and how they have been produced.
-Geographic space
-Time dimension
-Estimation
-Genealogy
-Tracability
-Data quality
Source: http://www.theses.fr/2011GRENM037/document

Sujets

Informations

Publié par
Nombre de visites sur la page 52
Langue Français
Signaler un problème

THÈSE
Pour obtenir le grade de
DOCTEUR DE L’UNIVERSITÉ DE GRENOBLE
Spécialité : Informatique
Arrêté ministériel : 7 août 2006
Présentée par
Christine PLUMEJEAUD
Thèse dirigée par M. Jérôme Gensel
et codirigée par M. Claude Grasland
préparée au sein du Laboratoire d’Informatique de Grenoble
et de Mathématiques, Sciences et Technologies de l’Information, Infor-
matique
Modèles et méthodes pour l’infor-
mation spatio-temporelle évolutive
Thèse soutenue publiquement le 22 septembre 2011,
devant le jury composé de :
Monsieur Jean-Pierre Giraudin
Professeur d’informatique, Université Pierre Mendès-France, Président
Madame Thérèse Rougé-Libourel
Professeur d’informatique, Université Montpellier II, Rapporteur
Monsieur Christophe Claramunt
Professeur d’informatique, Institut de Recherche de l’Ecole Navale, Rapporteur
Madame Anne Ruas
Directrice de Recherche en Géomatique, Institut Géographique National,
Examinatrice
Madame Sophie de Ruffray
Professeur de géographie, Université de Rouen, Examinatrice
Monsieur Jérôme Gensel
Professeur d’informatique, Université Pierre Mendès-France, Directeur de thèse Claude Grasland
Professeur de géographie, Université Paris VII, Co-Directeur de thèse
tel-00630984, version 1 - 11 Oct 2011ii
tel-00630984, version 1 - 11 Oct 2011« La pensée est le labeur de l’intelligence, la rêverie
en est la volupté. »
(Victor Hugo)
tel-00630984, version 1 - 11 Oct 2011iv
tel-00630984, version 1 - 11 Oct 2011Remerciements
Je souhaite exprimer ma plus grande reconnaissance aux membres de mon jury qui ont accepté d’éva-
luer mes travaux. Je remercie d’abord mon Président de jury, Jean-Pierre Giraudin, Professeur d’infor-
matique et responsable de la filière informatique au CNAM de Grenoble, et qui, à ce titre, m’a suivi dès
le début dans cette grande aventure. Je le remercie également pour ses judicieux conseils pédagogiques
lorsqu’il était mon tuteur de monitorat.
Je remercie ensuite mes rapporteurs, les Professeurs d’informatique Thérèse Rougé-Libourel et Chris-
tophe Claramunt, dont les remarques ont permis d’améliorer la qualité de ce travail.
Merci aussi à Sophie de Ruffray, Professeur de Géographie à l’université de Rouen, et à Anne Ruas,
directrice de recherche en Géomatique à l’Institut Géographique National, pour leur examen attentif de
ce travail. Je remercie aussi Anne pour avoir cru en moi et m’avoir emmené dans une nouvelle aventure
de recherche à l’IGN.
Je tiens à exprimer mon immense reconnaissance à mes directeurs de thèse, les Professeurs Jérôme
Gensel et Claude Grasland. Je les remercie pour m’avoir placé face à un problème aussi passionnant que
difficile, et pour la confiance qu’ils ont su porter en moi. Ces travaux ont bénéficié de leur complémen-
tarité, tant sur le plan humain que scientifique. Ainsi, Jérôme, ta patience, ta gentillesse et ta résistance
sont des vertus que je m’efforce de cultiver. Avant de réagir au quart de tour, je repense désormais à ce
que tu ferais. Claude, ton talent pour jeter des ponts au dessus du vide, vers les autres et vers d’autres
idées, ont su donner un souffle créateur à ma thèse. Je prends comme modèle ton ouverture et ta façon
de cultiver des relations professionnelles enrichissantes.
En dehors de ce jury, mes premiers remerciements vont à Hélène Mathian qui, en plus d’être une
collègue très compétente, est une personne sur qui j’ai toujours pu compter. Hélène, tu as su m’écouter,
m’aiguiller de bon conseils et me redonner courage dans les moments difficiles : je te remercie pour ta
grande humanité et ta bienveillance.
Cette recherche pluridisciplinaire m’a amené à travailler avec de « vrais » informaticiens (ceux qui
compilent du code, n’est-ce pas Serge ? ;-)), comme avec des géographes, des statisticiens, voire même
des archéologues, et c’est une chance exceptionnelle. Ainsi, je remercie ces professionnels de la géo-
statistique pour leur conseil et les bonnes bières partagées ensemble : Martin Charlton, Edzer Pebesma
(dites « monsieur R »), et Tomislav Hengl. J’ai une pensée affectueuse pour les ingénieurs statisticiens et
cartographes de RIATE, dits « les parisiens », dont la gaité a éclairé nos rencontres de travail. Cependant,
il y a un géographe en particulier à qui vont mes pensées, c’est Guillaume Vergnaud, car non seulement
notre collaboration a été des plus fructueuses, mais aussi nous avons partagé de très bons moments en-
semble à Grenoble et Barcelone. Guillaume, j’espère que tu vas bien. Merci aussi aux informaticiens,
ceux de chez Mescal en particulier, comme Jean-Marc Vincent ou Grégory Mounié, dont l’intérêt pour
mes travaux me convainc encore plus que la Géomatique a un grand avenir devant elle, fait de collabora-
tions, d’échanges et d’amitiés interdisciplinaires.
Après ce petit détour par les chemins interdisciplinaires, j’en reviens à mon équipe et mes collègues
au quotidien.
tel-00630984, version 1 - 11 Oct 2011vi
– Je remercie les permanents de l’équipe Steamer. Merci à Marlène et Paule-Annick, pour leur co-
opération constante et leur générosité. Merci surtout, Marlène, pour ton regard sur les métadonnées
et ta relecture approfondie de cette partie du travail, qui m’a donné le courage de terminer. Je re-
mercie aussi les nouveaux venus, Danielle et Philippe, pour leur gentillesse, mais aussi le regard
scientifique qu’ils ont su porter sur mes travaux, ne serait-ce qu’un bref instant.
– Merci à mes collègues d’équipe, mais surtout à José, pour LaTeX bien-sûr ;-), et aussi pour tous
nos ennuis consolés, et nos joies partagées.
– Merci aux autres, les thésards (Raffaella, Betul, Mouna, Angela, ...), les post-doc (Sandro, Sidonie,
et Mathieu), les ingénieurs (Anton, Laurent G., Laurent P., Benoit, Gael, Benjamin, Bruno, ...) et
les stagiaires (Dounia, Marion, Rong-Rong, Socrates, ...).
Cette thèse n’aurait pas été la même sans Dounia ni Anton. Avec leur aide efficace, des prototypes
ont vu le jour, des idées ont pu se concrétiser, et d’autres naître. Je les remercie aussi de leur grande
honnêteté, et de leur amitié sincère. Merci aussi à Benoit pour avoir repris le flambeau sur HyperCarte,
et m’avoir soulagée d’une tâche omniprésente, celle de faire vivre tous les Hyper* au quotidien. Enfin,
Alban, Nadine et les moyens informatiques du LIG m’ont dépatouillé suffisamment souvent pour que je
les remercie de leur aide, et de l’intérêt vif qu’ils ont porté à cette recherche.
Cette thèse s’est déroulée dans un grand laboratoire, plein de gens, très affairés, souvent pré-occupés,
mais qui gardent quand même l’envie de partager des moments ensemble. Je remercie Charlotte et Sattis-
var, dont le goût des autres ne s’est jamais démenti, pour la solidarité dont ils savent faire preuve. Grâce
à eux, j’ai eu envie de participer au lancement de LIG Synergy, avec Rémi, Javier, Yves, Emeric et les
autres. Notre barbecue reste un succès mémorable pour moi. L’aventure continue pour cette association,
et j’espère qu’elle se poursuivra longtemps.
Enfin, en parlant d’association, mon rôle de secrétaire de l’AI CNAM PST, Association des Ingé-
nieurs du CNAM et de la Promotion Supérieure du Travail a été très gratifiant, et la réunion du bureau de
l’association était toujours un événement très agréable. Je remercie Eric Boniface, mon Président d’as-
sociation, et André Plisson, directeur du CNAM de Grenoble, pour la grande confiance qu’ils ont bien
voulu m’accorder. Je te dois un grand merci Eric pour une raison plus personnelle : tu m’as déniché un
mari fantastique !
Je ne peux pas remercier tous les membres de ma famille comme je l’aurais aimé, mais je dis merci à
ma tante Bernadette, qui a su prendre régulièrement des nouvelles du front et de mon cœur, et m’a offert
des beaux moments d’air pur et de plaisir partagé. Je dois aussi un petit quelque chose à mes amis qui
m’ont encouragée, comme Jean-Philippe et Laurence, pour que je continue mes progrès, et à Nathalie,
qui n’a pas ménagé sa peine pour me voir finir cette thèse.
Merci enfin à Cyril, mon mari, qui pour l’instant n’a pas vraiment vécu les meilleurs jours avec moi
(on sait bien que la rédaction d’une thèse n’est pas une sinécure pour l’entourage). Merci pour ton amour
et ta patience.
Bientôt la lune de miel !
tel-00630984, version 1 - 11 Oct 2011Table des matières
Prolégomènes - Définition de l’objet d’étude 1
A Constitution de l’information statistique territoriale . . . . . . . . . . . . . . . . . . . . 1
A.1 Statistique ou statistiques ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
A.1.1 Objectif des statistiques . . . . . . . . . . . . . . . . . . . . . . . . . 2
A.1.2 Qui produit l’information statistique ? . . . . . . . . . . . . . . . . . . 3
A.1.3 Comment est produite l’information statistique ? . . . . . . . . . . . . 4
A.1.4 Le secret statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
A.1.5 Transformation des données statistiques . . . . . . . . . . . . . . . . 6
A.2 La spatialisation de l’information statistique . . . . . . . . . . . . . . . . . . . . 8
A.2.1 Agrégation spatiale . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
A.2.2 Unités de recensement : zonages ou maillages ? . . . . . . . . . . . . 11
A.2.3 Critique des découpages territoriaux . . . . . . . . . . . . . . . . . . 13
A.3 Représentation des données statistiques . . . . . . . . . . . . . . . . . . . . . . 16
A.3.1 Les tableaux d’information géographique . . . . . . . . . . . . . . . . 16
A.3.2 Les de contingence . . . . . . . . . . . . . . . . . . . . . . . 17
B Une approche pluri-disciplinaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
B.1 Définition de la géomatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
B.2 Objectif de la . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Introduction 21
1.1 Problématique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.2 Contribution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2.1 Un modèle pour des hiérarchies multiples et évolutives. . . . . . . . . . . . . . . 23
1.2.2 Adaptation de la norme ISO 19115 pour l’information statistique territoriale. . . 24
1.2.3 Exploration et analyse interactive des données. . . . . . . . . . . . . . . . . . . 24
1.3 Plan de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
I Etat de l’Art 27
2 Approches pour la modélisation spatio-temporelle 29
2.1 Le temps et l’espace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.1.1 Le temps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.1.1.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.1.1.2 Représentation du temps dans les systèmes informatiques . . . . . . . 35
2.1.2 L’espace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.1.2.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
tel-00630984, version 1 - 11 Oct 2011viii TABLEDESMATIÈRES
2.1.2.2 Représentation quantitative de l’espace dans les systèmes informatiques 40
2.2 Mettre en correspondance le temps et l’espace . . . . . . . . . . . . . . . . . . . . . . . 53
2.2.1 Des modèles pour enregistrer les changements . . . . . . . . . . . . . . . . . . 55
2.2.1.1 Datation du support de collecte . . . . . . . . . . . . . . . . . . . . . 55
2.2.1.2 Définition d’un support stable dans le temps . . . . . . . . . . . . . . 56
2.2.2 Des modèles pour répondre aux questions du Quoi, Où, Quand ? . . . . . . . . . 60
2.2.2.1 La dynamique des entités spatio-temporelles . . . . . . . . . . . . . . 60
2.2.2.2 Implémentations du paradigme identitaire . . . . . . . . . . . . . . . 61
2.2.2.3 La question de l’identité . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.2.3 Des modèles pour répondre à la question du Comment ? . . . . . . . . . . . . . 65
2.2.3.1 Modélisation des processus de changements territoriaux . . . . . . . . 65
2.2.3.2 Exemples de modèles intégrant des évènements . . . . . . . . . . . . 68
2.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3 Description de l’information statistique territoriale 73
3.1 Usage des métadonnées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.2 Le Dublin-Core . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.3 Les normes de l’information géographique . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.3.1 Etude approfondie de la norme ISO 19115 . . . . . . . . . . . . . . . . . . . . . 78
3.3.2 Les limites de la norme ISO 19115 . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.4 SDMX, un modèle pour l’échange de données statistiques . . . . . . . . . . . . . . . . 84
3.4.1 Utilisation de SDMX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
3.4.1.1 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
3.4.1.2 Fichier d’échange SDMX-ML . . . . . . . . . . . . . . . . . . . . . 91
3.4.2 Les limites de SDMX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.5 Aller plus loin que les métadonnées et résoudre l’interopérabilité sémantique . . . . . . 93
3.5.1 Calcul d’une ontologie de domaine pour résoudre l’interopérabilité sémantique . 93
3.5.2 Travaux relatifs à la capture d’un lignage . . . . . . . . . . . . . . . . . . . . . 94
3.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4 Analyse de la qualité des données par recherche de valeurs exceptionnelles 97
4.1 Définition de la qualité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.1.1 Les critères de mesure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.1.2 L’évaluation de la précision sémantique par recherche de valeurs exceptionnelles 100
4.2 Méthodes de recherche de valeurs exceptionnelles . . . . . . . . . . . . . . . . . . . . . 101
4.2.1 L’étude thématique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.2.1.1 La boîte à moustaches . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.2.1.2 Les matrices de diagrammes de dispersion . . . . . . . . . . . . . . . 103
4.2.1.3 Le bagplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.2.1.4 La distance de Mahalanobis . . . . . . . . . . . . . . . . . . . . . . 104
4.2.1.5 L’Analyse en Composantes Principales . . . . . . . . . . . . . . . . 105
4.2.2 L’étude spatiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.2.2.1 Les indices globaux d’autocorrélation spatiale . . . . . . . . . . . . . 109
4.2.2.2 Les locaux . . . . . . . . . . . . . . 112
4.2.2.3 L’analyse des résidus géographiquement pondérée (GWR) . . . . . . 114
4.2.2.4 Recherche de valeurs exceptionnelles par l’analyse multi-niveau . . . 116
tel-00630984, version 1 - 11 Oct 2011TABLEDESMATIÈRES ix
4.2.3 L’étude temporelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
4.2.3.1 L’analyse des séries temporelles . . . . . . . . . . . . . . . . . . . . . 117
4.2.3.2 Le problème du changement de support . . . . . . . . . . . . . . . . . 118
4.2.3.3 Aperçu des principales méthodes de « transfert » . . . . . . . . . . . . 120
4.2.3.4 Mise en oeuvre du transfert . . . . . . . . . . . . . . . . . . . . . . . 127
4.3 Les outils pour l’évaluation de la qualité . . . . . . . . . . . . . . . . . . . . . . . . . . 128
4.3.1 Les outils de l’ESDA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
4.3.1.1 Fonctionalités et architecture requises . . . . . . . . . . . . . . . . . . 129
4.3.1.2 Critiques des outils existants . . . . . . . . . . . . . . . . . . . . . . 131
4.3.2 Prise en compte des relations d’appartenance avec HyperAtlas . . . . . . . . . . 132
4.3.3 Prise en compte de l’utilisateur et des métadonnées dans l’évaluation de la qualité 135
4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
II Proposition 139
5 Un modèle pour des hiérarchies multiples et évolutives 141
5.1 Un modèle objet indexé par des événements de changement . . . . . . . . . . . . . . . . 141
5.1.1 Motivations du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
5.1.1.1 Des supports multiples, multi-niveaux, non-alignés . . . . . . . . . . 142
5.1.1.2 Un support qui change . . . . . . . . . . . . . . . . . . . . . . . . . . 145
5.1.2 Description du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
5.1.2.1 Description d’une unité géographique . . . . . . . . . . . . . . . . . . 149
5.1.2.2 La généalogie et la transformation des unités géographiques . . . . . . 152
5.1.2.3 Exemples d’instanciation du modèle . . . . . . . . . . . . . . . . . . 154
5.2 Mise à jour et maintenance du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
5.2.1 Appariement automatique de deux versions de nomenclature . . . . . . . . . . . 162
5.2.1.1 Comparaison de deux empreintes spatiales . . . . . . . . . . . . . . . 163
5.2.1.2 Algorithme de détection des évènements territoriaux . . . . . . . . . . 165
5.2.1.3 Construction d’une matrice d’appariement global . . . . . . . . . . . 173
5.2.1.4 Calcul des hypothèses . . . . . . . . . . . . . . . . . . 174
5.2.1.5 Validation et expérimentations . . . . . . . . . . . . . . . . . . . . . 176
5.2.2 Pilotage de l’appariement par un expert . . . . . . . . . . . . . . . . . . . . . . 180
5.2.2.1 Description des tâches . . . . . . . . . . . . . . . . . . . . . . . . . . 180
5.2.2.2 Proposition d’interface . . . . . . . . . . . . . . . . . . . . . . . . . 182
5.3 Exploitation du modèle pour l’exploration interactive du changement . . . . . . . . . . . 187
5.3.1 Conception de la carte de densité de changement . . . . . . . . . . . . . . . . . 187
5.3.2 Illustration avec l’exemple du Danemark . . . . . . . . . . . . . . . . . . . . . 190
5.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
6 Définition et utilisation d’un profil de métadonnées pour l’information statistique
territoriale 195
6.1 Définition d’un profil de métadonnées pour l’information statistique territoriale . . . . . 195
6.1.1 Motivations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
6.1.2 Structure de l’information statistique territoriale . . . . . . . . . . . . . . . . . . 196
6.1.3 Etude de la compatibilité avec la norme ISO 19115 . . . . . . . . . . . . . . . . 198
tel-00630984, version 1 - 11 Oct 2011x TABLEDESMATIÈRES
6.1.4 Création d’un profil de la norme ISO 19115 . . . . . . . . . . . . . . . . . . . . 200
6.1.4.1 Gestion des différents niveaux d’information . . . . . . . . . . . . . . 200
6.1.4.2 Adaptation de l’élément MD_Identification pour un indicateur . . . . 201
6.1.4.3 Simplification des éléments renseignant sur la qualité . . . . . . . . . 202
6.1.4.4 Modification des contraintes légales portant sur l’usage et la publica-
tion des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
6.2 Proposition d’un flux d’acquisition et de diffusion des données et métadonnées . . . . . 204
6.2.1 Structuration des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
6.2.2 Contrôle de la saisie des métadonnées . . . . . . . . . . . . . . . . . . . . . . . 207
6.2.2.1 Cahier des charges de l’éditeur idéal . . . . . . . . . . . . . . . . . . 207
6.2.2.2 Etude des éditeurs disponibles . . . . . . . . . . . . . . . . . . . . . . 209
6.2.2.3 Un éditeur dédié au profil esponMD . . . . . . . . . . . . . . . . . . 211
6.2.3 Stockage conjoint des données et des métadonnées . . . . . . . . . . . . . . . . 215
6.2.3.1 Le niveau des valeurs . . . . . . . . . . . . . . . . . . . . . . . . . . 216
6.2.3.2 Le niveau des indicateurs . . . . . . . . . . . . . . . . . . . . . . . . 217
6.2.3.3 Le niveau du jeu de données . . . . . . . . . . . . . . . . . . . . . . . 217
6.2.3.4 Exploitation du modèle . . . . . . . . . . . . . . . . . . . . . . . . . 217
6.2.4 Diffusion des données et des métadonnées via SDMX . . . . . . . . . . . . . . 219
6.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
7 Méthodes pour l’exploration et l’analyse de l’information statistique territoriale 225
7.1 Exploration interactive de la qualité des données . . . . . . . . . . . . . . . . . . . . . . 225
7.1.1 Motivations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
7.1.2 Un système interactif dédié à l’évaluation de la qualité . . . . . . . . . . . . . . 226
7.1.2.1 Sélection des données . . . . . . . . . . . . . . . . . . . . . . . . . . 228
7.1.2.2 Choix, paramétrage et exécution de méthodes statistiques . . . . . . . 230
7.1.2.3 Exploitation et interprétation des résultats . . . . . . . . . . . . . . . 230
7.1.2.4 des métadonnées . . . . . . . . . . . . . . . . . . . . . . 231
7.1.3 Mise en œuvre dans QualESTIM . . . . . . . . . . . . . . . . . . . . . . . . . . 233
7.1.3.1 Implementation de QualESTIM . . . . . . . . . . . . . . . . . . . . . 233
7.1.3.2 Validation de l’approche exploratoire QualESTIM . . . . . . . . . . . 237
7.1.3.3 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
7.2 Une analyse multi-scalaire contextualisée . . . . . . . . . . . . . . . . . . . . . . . . . 244
7.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
III Bilan et perspectives 247
8 Conclusion et perspectives 249
8.1 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
8.1.1 Gestion de hiérarchies multiples et évolutives . . . . . . . . . . . . . . . . . . . 249
8.1.2 de métadonnées pour l’information statistique territoriale . . . . . . . . 250
8.1.3 Exploration et analyse interactive et contextualisée de l’information . . . . . . . 250
8.2 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
8.2.1 Gestion de l’incertitude sur les évènements . . . . . . . . . . . . . . . . . . . . 251
8.2.2 Aller plus loin que les métadonnées . . . . . . . . . . . . . . . . . . . . . . . . 252
tel-00630984, version 1 - 11 Oct 2011