ROMIE, une approche d'alignement d'ontologies à base d'instances, ROMIE, Resource based Ontology Mapping within an Interactive and Extensible environment

De
Publié par

Sous la direction de Bruno Defude
Thèse soutenue le 16 octobre 2009: Institut national des télécommunications d'Evry
L'interoperabilite semantique est une question importante, largement identifiee dans les technologies d’organisation et de l'information et dans la communaute de recherche en systemes d'information. L’adoption large du Web afin d’acceder a des informations distribuees necessite l'interoperabilite des systemes qui gerent ces informations. Des solutions et reflexions comme le Web Semantique facilitent la localisation et l’integration des donnees d'une maniere plus intelligente par l'intermediaire des ontologies. Il offre une vision plus semantique et comprehensible du web. Pourtant, il souleve un certain nombre de defis de recherche. Un des principaux defis est de comparer et aligner les differentes ontologies qui apparaissent dans des taches d'integration. Le principal objectif de cette these est de proposer une approche d’alignement pour identifier les liens de correspondance entre des ontologies. Notre approche combine les techniques et les methodes d’appariement linguistiques, syntaxiques, structurelles ou encore semantiques (basees sur les instances). Elle se compose de deux phases principales : la phase d'enrichissement semantique des ontologies a comparer et la phase d’alignement ou de mapping. La phase d'enrichissement est basee sur l'analyse des informations que les ontologies developpent (des ressources web, des donnees, des documents, etc.) et qui sont associes aux concepts de l’ontologie. Notre intuition est que ces informations ainsi que les relations qui peuvent exister entre elles participent a l’enrichissement semantique entre les concepts. A l’issue de la phase d'enrichissement, une ontologie contient plus de relations semantiques entre les concepts qui seront exploitees dans la deuxieme phase. La phase de mapping prend deux ontologies enrichies et calcule la similarite entre les couples de concepts. Un processus de filtrage nous permet de reduire automatiquement le nombre de fausses relations. La validation des correspondances est un processus interactif direct (avec un expert) ou indirect (en mesurant le degre de satisfaction de l’utilisateur). Notre approche a donne lieu a un systeme de mapping appele ROMIE (Resource based Ontology Mapping within an Interactive and Extensible environment). Il a ete experimente et evalue dans deux differentes applications : une application biomedicale et une application dans le domaine de l’apprentissage enrichi par les technologies (ou e-learning).
-Web sémantique
-Système multi-agent
-Alignement d'ontologies
System interoperability is an important issue, widely recognized in information technology intensive organizations and in the research community of information systems. The wide adoption of the World Wide Web to access and distribute information further stresses the need for system interoperability. Initiative solutions like the Semantic Web facilitate the localization and the integration of the data in a more intelligent way via the use of ontologies. The Semantic Web offers a compelling vision, yet it raises a number of research challenges. One of the key challenges is to compare and map different ontologies, which evidently appears in integration tasks. The main goal of the work is to introduce a method for finding semantic correspondences among ontologies with the intention to support interoperability of Information Systems. The approach brings together syntactic, linguistic, structural and semantic (based on instance information) matching methods in order to provide a semi-automatic mapping. The approach consists of two phases: semantic enrichment phase and mapping phase. The enrichment phase is based on the analysis of the information developed by the ontologies (like web resources, data, documents, etc.) and that are associated to the concepts in the ontologies. Our intuition is that this information as well as the relations that can exist between them is used in semantic enrichment between the concepts. At the end of enrichment phase, the ontology contains more semantic relations between its concepts that will be exploited in the second phase. The phase of mapping takes two enriched ontologies and calculates the similarity between the couples of concepts. A process of filtering enables us to automatically reduce the number of false relations. The validation of the correspondences is a direct interactive process (with an expert) or indirect (by measuring the satisfaction level of the user). The approach has been implemented in a prototype system called ROMIE (Resource based Ontology Mapping within and Interactive and Extensible environment). It was tested and evaluated in two applications: a biomedical application and technology enhanced learning (or e-learning) domain application.
Source: http://www.theses.fr/2009TELE0014/document
Publié le : jeudi 27 octobre 2011
Lecture(s) : 52
Nombre de pages : 182
Voir plus Voir moins



Thèse de doctorat de l’INSTITUT NATIONAL DES TELECOMMUNICATIONS dans le cadre
de l’école doctorale S&I en co-accréditation avec
l’UNIVERSITE D’EVRY-VAL D’ESSONNE



Spécialité :
Informatique



Par
M Abdeltif ELBYED



Thèse présentée pour l’obtention du grade de Docteur
de l’INSTITUT NATIONAL DES TELECOMMUNICATIONS



ROMIE, une approche d’alignement d’ontologies à base d’instances

Soutenue le 16 Octobre 2009 devant le jury composé de :
Rapporteurs :
Mme. Chantal Reynaud professeur à l’université Paris-Sud & INRIA Saclay
Mr. Jean Charlet HDR, chargé de mission AP-HP, professeur associé à l'ECP INSERM
Examinateurs :
Mr. Djamal Benslimane Professeur à l’université Claude Bernard Lyon
Mme. Christine Froidevaux Professeur à l’université Paris-Sud
Mr. Bruno Defude Professeur à Télécom SudParis (Directeur de thèse)
Mme. Amel Bouzeghoub Maître de conférences à Télécom SudParis (co-encadrant)
Mme. Fariza Tahi Maître de conférences à l’université d’Evry-Val d’Essonne (co-encadrant)

Thèse n° 2009TELE0014
1
tel-00541874, version 1 - 1 Dec 2010
2
tel-00541874, version 1 - 1 Dec 2010
Toutes les lettres ne sauraient trouver les mots qu’il faut…
Tous les mots ne sauraient exprimer la gratitude, l’amour, le respect, la
reconnaissance…
Aussi c’est tout simplement que…







Je dédie cette thèse ...
A Mes parents,
A mes frères et sœurs,
A Ma femme Hind


3
tel-00541874, version 1 - 1 Dec 2010
4
tel-00541874, version 1 - 1 Dec 2010
Remerciements
Je tiens vivement à remercier toutes les personnes qui ont participé de près ou de loin à l’élaboration de
ce travail, en particulier mes encadrantes Amel Bouzeghoub et Fariza Tahi.
Je tiens à exprimer ma gratitude envers mon directeur de thèse Bruno Defude pour la qualité de ses
conseils, sa disponibilité ainsi que le degré de responsabilisation de son encadrement qui m’a permis de
développer mon goût pour la recherche.
Je remercie également Guy Bernard pour avoir facilité mon inscription en thèse et pour son aide.
Je suis profondément reconnaissant à Amel Bouzeghoub pour le temps qu’elle a investi pour suivre et
analyser les résultats de ce travail ainsi que pour les nombreuses discussions enrichissantes.
Je tiens à remercier Fariza Tahi pour m’avoir aidé et soutenu tout le long de cette thèse et pour ses
conseils et son expertise dans le domaine biomédical.
Je tiens à remercier mes deux rapporteurs Mme Chantal Reynaud et Mr Jean Charlet pour l’intérêt qu’ils
ont porté à ce travail en acceptant de le juger et pour le temps qu’ils ont consacré pour la lecture de ce
mémoire. Je remercie également Mme Christine Froidevaux et Mr Djamal Benslimane de m’avoir honoré en
acceptant d’examiner la thèse.
Je remercie les enseignants du département informatique de Télécom SudParis et les enseignants du
laboratoire IBISC pour leur accueil, leur bonne humeur et leur convivialité, qui ont rendu plus légères les
nombreuses heures de cours que j’ai dû assurer durant ma thèse.
Je salue également les membres du Laboratoire d’Informatique de Télécom SudParis et du laboratoire
IBSC et en particulier les thésards et les stagiaires du département informatique.
Enfin, je remercie mes parents, ma femme et mon frère pour leur soutien et leur amour, depuis toujours.
5
tel-00541874, version 1 - 1 Dec 2010

6
tel-00541874, version 1 - 1 Dec 2010
Abstract
System interoperability is an important issue, widely recognized in information technology intensive
organizations and in the research community of information systems. The wide adoption of the World Wide Web
to access and distribute information further stresses the need for system interoperability. Initiative solutions like
the Semantic Web facilitate the localization and the integration of the data in a more intelligent way via the use
of ontologies. The Semantic Web offers a compelling vision, yet it raises a number of research challenges. One of
the key challenges is to compare and map different ontologies, which evidently appears in integration tasks.
The main goal of the work is to introduce a method for finding semantic correspondences among
ontologies with the intention to support interoperability of Information Systems. The approach brings together
syntactic, linguistic, structural and semantic (based on instance information) matching methods in order to
provide a semi-automatic mapping. The approach consists of two phases: semantic enrichment phase and
mapping phase. The enrichment phase is based on the analysis of the information developed by the ontologies
(like web resources, data, documents, etc.) and that are associated to the concepts in the ontologies. Our
intuition is that this information as well as the relations that can exist between them is used in semantic
enrichment between the concepts. At the end of enrichment phase, the ontology contains more semantic
relations between its concepts that will be exploited in the second phase. The phase of mapping takes two
enriched ontologies and calculates the similarity between the couples of concepts. A process of filtering enables
us to automatically reduce the number of false relations. The validation of the correspondences is a direct
interactive process (with an expert) or indirect (by measuring the satisfaction level of the user). The approach
has been implemented in a prototype system called ROMIE (Resource based Ontology Mapping within and
Interactive and Extensible environment). It was tested and evaluated in two applications: a biomedical
application and technology enhanced learning (or e-learning) domain application.
Keywords: semantic web, mapping and alignment ontologies, biomedical domain, e-learning, multi agent
system.
7
tel-00541874, version 1 - 1 Dec 2010
8
tel-00541874, version 1 - 1 Dec 2010Introduction


Résumé
L'interopérabilité sémantique est une question importante, largement identifiée dans les technologies
d’organisation et de l'information et dans la communauté de recherche en systèmes d'information. L’adoption
large du Web afin d’accéder à des informations distribuées nécessite l'interopérabilité des systèmes qui gèrent
ces informations. Des solutions et réflexions comme le Web Sémantique facilitent la localisation et l’intégration
des données d'une manière plus intelligente par l'intermédiaire des ontologies. Il offre une vision plus
sémantique et compréhensible du web. Pourtant, il soulève un certain nombre de défis de recherche. Un des
principaux défis est de comparer et aligner les différentes ontologies qui apparaissent dans des tâches
d'intégration.
Le principal objectif de cette thèse est de proposer une approche d’alignement pour identifier les liens de
correspondance entre des ontologies. Notre approche combine les techniques et les méthodes d’appariement
linguistiques, syntaxiques, structurelles ou encore sémantiques (basées sur les instances). Elle se compose de
deux phases principales : la phase d'enrichissement sémantique des ontologies à comparer et la phase
d’alignement ou de mapping. La phase d'enrichissement est basée sur l'analyse des informations que les
ontologies développent (des ressources web, des données, des documents, etc.) et qui sont associés aux
concepts de l’ontologie. Notre intuition est que ces informations ainsi que les relations qui peuvent exister entre
elles participent à l’enrichissement sémantique entre les concepts. A l’issue de la phase d'enrichissement, une
ontologie contient plus de relations sémantiques entre les concepts qui seront exploitées dans la deuxième
phase. La phase de mapping prend deux ontologies enrichies et calcule la similarité entre les couples de
concepts. Un processus de filtrage nous permet de réduire automatiquement le nombre de fausses relations. La
validation des correspondances est un processus interactif direct (avec un expert) ou indirect (en mesurant le
degré de satisfaction de l’utilisateur). Notre approche a donné lieu à un système de mapping appelé ROMIE
(Resource based Ontology Mapping within an Interactive and Extensible environment). Il a été expérimenté et
évalué dans deux différentes applications : une application biomédicale et une application dans le domaine de
l’apprentissage enrichi par les technologies (ou e-learning).
Mots clés : web sémantique, alignement et mapping d’ontologies, domaine biomédical, e-learning,
systèmes multi-agent.
9
tel-00541874, version 1 - 1 Dec 2010


10
tel-00541874, version 1 - 1 Dec 2010

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.

Diffusez cette publication

Vous aimerez aussi