La lecture à portée de main
Découvre YouScribe en t'inscrivant gratuitement
Je m'inscrisDécouvre YouScribe en t'inscrivant gratuitement
Je m'inscrisDescription
Informations
Publié par | Thesee |
Nombre de lectures | 70 |
Langue | Français |
Poids de l'ouvrage | 3 Mo |
Extrait
Î
AVERTISSEMENT
Ce document est le fruit d'un long travail approuvé par le
jury de soutenance et mis à disposition de l'ensemble de la
communauté universitaire élargie.
Il est soumis à la propriété intellectuelle de l'auteur. Ceci
implique une obligation de citation et de référencement lors
de l’utilisation de ce document.
D’autre part, toute contrefaçon, plagiat, reproduction
illicite encourt une poursuite pénale.
Contact SCD Nancy 1 : theses.sciences@scd.uhp-nancy.fr
LIENS
Code de la Propriété Intellectuelle. articles L 122. 4
Code de la Propriété Intellectuelle. articles L 335.2- L 335.10
http://www.cfcopies.com/V2/leg/leg_droi.php
http://www.culture.gouv.fr/culture/infos-pratiques/droits/protection.htm ´D´ epartement de formation doctorale en informatique Ecole doctorale IAEM Lorraine
UFR STMIA
Analyse de concepts formels guid´ee par
des connaissances de domaine :
Application `alad´ecouverte de
ressources g´enomiques sur le Web
`THESE
pr´esent´ee et soutenue publiquement le 20 Mars 2009
pour l’obtention du
Doctorat de l’universit´e Henri Poincar´e – Nancy 1
(sp´ecialit´e informatique)
par
Nizar Messai
Composition du jury
Pr´esident : Claude Godart Professeur, Universit´e Henri Poicar´e - Nancy1
Rapporteurs : Jean Diatta Universit´edeLaR´eunion
Marianne Huchard Professeur, Universit´e Montpellier 2
Examinateurs : Fran¸ cois Brucker Maˆıtre de conf´erences, Universit´e Paul Verlaine-Metz
Amedeo Napoli Directeur de recherches, CNRS, Nancy
Henri Soldano Maˆıtre de conf´erences, Universit´e Paris 13
Invit´e: Marie-Dominique Devignes Charg´ee de recherches, CNRS, Nancy
Laboratoire Lorrain de Recherche en Informatique et ses Applications — UMR 7503Mis en page avec la classe thloria.Remerciements
Je tiens en premier lieu à remercier Amedeo Napoli qui m’a permis d’effectuer cette thèse
dans son équipe. Son soutien scientifique et sa confiance en moi m’ont permis de mener à bien
ce travail.
Je remercie Mme Marie-Dominique Devignes et Mme Malika Smaïl-Tabbone qui m’ont en-
cadré pendant cette thèse et qui ont su m’encourager et m’orienter dans les différentes étapes de
ce travail.
Je souhaite également remercier tous les professeurs et maîtres de conférence qui m’ont fait
l’honneur de participer à mon jury de thèse : Pr Jean Diatta de l’Université de La Réunion et
Pr Marianne Huchard de l’Université Montpellier 2 en tant que rapporteurs, Pr Claude Godart
de l’Université Henry Poincaré - Nancy 1, Dr François Brucker de l’Université Paul Verlaine -
Metz et Dr Henry Soldano de l’Université Paris 13 en tant qu’examinateurs. Merci donc pour
l’attention qu’ils ont apportée à ce travail ainsi que pour leurs remarques et critiques.
Merci à tous les membres de l’équipe ORPAILLEUR pour leur accueil et leur sympathie.
Merci à Adrien, pour son amitié et la bonne entente dans les bureaux que nous avons partagés.
Merci à Rokia pour sa grande amitié et sa généreusité. Merci à Zainab et à Mehdi pour leur
amitié et pour l’intérêt qu’ils ont accordé à mon travail. Merci à Saliha, Lazslo, Frédéric, Fadi,
Sidahmed, ...
Merci à tous les tunisiens et tunisiennes du LORIA : Hatem, Walid, Khaled, Anis, Sami,
Tarek, Adnène, Mohamed, Mehdi, Mohsen, Mounir, Ahmed, Bilel, Najah, Hanen, Inès, Najet ...
Merci à tous les amis et collègues du LORIA : Randa, Yves, Szilard, Michael, Nicolas, Seb ...
Merci à mes parents pour tous les sacrifices qu’ils ont consenti pour moi, je ne les remercierai
vraiment jamais assez.
Merci à ma chère et tendre épouse Nada pour son amour, sa confiance, son aide et sa patience
pendant les moments difficiles.
Merci à ma petite sœur Amira et deux petit frères Houssem et Amir pour avoir cru en moi
et m’avoir soutenu et encouragé.
Merci à mes beaux parents et à toute la famille, en particulier Chaouki et Sonia, pour leurs
encouragements continus et leur affection.
Comme je suis certain d’avoir oublié beaucoup de personnes, un merci général s’impose. Merci
donc à tous ceux qui ont contribué de près ou de loin à l’aboutissement de ce travail.
iiiTable des matières
Table des figures ix
Liste des tableaux xiii
1 Introduction générale 1
1.1 Contexte de travail ................................... 1
1.1.1 Les ressources Web ............................... 1
1.1.2 La découverte de ressources biologiques sur le Web ............. 4
1.2 Objectif de la thèse et principales contributions ................... 6
1.3 Organisation du manuscrit 7
2 Contexte de l’étude : découverte de ressources biologiques sur le Web 9
2.1 Introduction....................................... 9
2.2 Description de l’existant ................................ 10
2.2.1 Principales caractéristiques des sources de données biologiques....... 10
2.2.2 Méthodes existantes pour l’identification et l’exploitation des sources de
données biologiques............................... 10
2.2.3 Limites ..................................... 13
2.3 BioRegistry : un annuaire sémantique de sources de données biologiques ..... 13
2.3.1 Prise en compte des connaissances de domaine dans la modélisation de
l’annuaire BioRegistry ............................. 13
2.3.2 Peuplement de l’annuaire BioRegistry .................... 16
2.3.3 Interrogation de l’annuaire . ................... 17
2.4 Découverte de sources de données biologiques “guidée par des connaissances” . . . 18
3 Analyse de Concepts Formels : fondement théorique, applications et exten-
sions 21
3.1 Introduction....................................... 22
3.2 Théorie des treillis : Notions de base ......................... 22
3.2.1 Ensemble ordonné ............................... 22
iiiTable des matières
3.2.2 Treillis ...................................... 23
3.2.3 Fermeture .................................... 24
3.2.4 Connexion de Galois . . . ........................... 24
3.3 Analyse de concepts formels .............................. 25
3.3.1 Origine et contexte philosophique....................... 25
3.3.2 Contexte formel................................. 25
3.3.3 Connexion de Galois dans un contexte formel ................ 25
3.3.4 Concept formel 26
3.3.5 Treillis de concepts ............................... 27
3.3.6 Algorithmes de construction de treillis de concepts ............. 28
3.3.7 Implications dans un contexte formel ..................... 33
3.4 ACF et découverte de ressources ........................... 35
3.4.1 Principales motivations ............................ 36
3.4.2 ACF et Recherche d’Information ....................... 36
3.5 ACF et données complexes 39
3.5.1 Contexte formel multivalué .......................... 39
3.5.2 Échelonnage conceptuel 40
3.6 Les extensions de l’ACF ................................ 42
3.6.1 Analyse de Concepts Formels Flous...................... 43
3.6.2 de Logiques......................... 46
3.6.3 Extensions Relationnelles de l’ACF . ..................... 48
3.6.4 Extension aux objets symboliques....................... 53
3.6.5 Autres extensions................................ 54
4 Découverte de ressources par treillis de concepts dans BioRegistry 55
4.1 Introduction . . ..................................... 55
4.2 Représentation du contenu de BioRegistry en ACF ................. 56
4.2.1 Classification flexible du contenu de BioRegistry .............. 58
4.3 Exploitation du contenu de BioRegistry ....................... 58
4.3.1 Navigation ................................... 58
4.3.2 Interrogation .................................. 59
4.4 Formalisation : l’algorithme BR-Explorer 61
4.4.1 Définitions 61
4.4.2 L’algorithme BR-Explorer ........................... 63
4.4.3 Déroulement de sur un exemple ................ 63
4.4.4 Expressivité des requêtes dans BR-Explorer ................. 66
4.4.5 Correction et complétude de .................. 67
iv4.4.6 Complexité de BR-Explorer .......................... 68
4.5 Raffinement de requête à partir de ressources sémantiques ............. 68
4.5.1 Raffinement de requête par généralisation .................. 70
4.5.2t de requête par spécialisation 71
4.5.3 Raffinement mixte ............................... 72
4.5.4 Choix du type de raffinement ......................... 72
4.6 Dépendances entre attributs : hiérarchie d’attributs dans BR-Explorer ...... 73
4.6.1 Le besoin d’exprimer les dépendances entre attributs ............ 73
4.6.2 Formalisation .................................. 74
4.6.3 Application des hiérarchies d’attributs à un treillis de concepts ...... 75
4.6.4 Hiérarchies d’attributs pour la découverte de ressources guidée p