Approche intelligente fondée sur le modèle des Topic Maps
261 pages
Français

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Approche intelligente fondée sur le modèle des Topic Maps

-

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
261 pages
Français
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Sous la direction de Elisabeth Metais
Thèse soutenue le 03 décembre 2010: ENSI -Université de la Manouba, CNAM
Cette thèse aborde les problématiques liées à la construction de Topic Maps et à leur utilisation pour la recherche d’information dans le cadre défini par le Web sémantique (WS). Le WS a pour objectif de structurer les informations disponibles sur le Web. Pour cela, les ressources doivent être sémantiquement étiquetées par des métadonnées afin de permettre d'optimiser l'accès à ces ressources. Ces métadonnées sont actuellement spécifiées à l'aide des deux standards qui utilisent le langage XML : RDF et les Topic Maps. Un contenu à organiser étant très souvent volumineux et sujet à enrichissement perpétuel, il est pratiquement impossible d’envisager une création et gestion d’une Topic Map, le décrivant, de façon manuelle. Plusieurs travaux de recherche ont concerné la construction de Topic Maps à partir de documents textuels [Ellouze et al. 2008a]. Cependant, aucune d’elles ne permet de traiter un contenu multilingue. De plus, bien que les Topic Maps soient, par définition, orientées utilisation (recherche d’information), peu d’entre elles prennent en compte les requêtes des utilisateurs.Dans le cadre de cette thèse, nous avons donc conçu une approche que nous avons nommée ACTOM pour « Approche de Construction d’une TOpic Map Multilingue ». Cette dernière sert à organiser un contenu multilingue composé de documents textuels. Elle a pour avantage de faciliter la recherche d’information dans ce contenu. Notre approche est incrémentale et évolutive, elle est basée sur un processus automatisé, qui prend en compte des documents multilingues et l’évolution de la Topic Map selon le changement du contenu en entrée et l’usage de la Topic Map. Elle prend comme entrée un référentiel de documents que nous construisons suite à la segmentation thématique et à l’indexation sémantique de ces documents et un thésaurus du domaine pour l’ajout de liens ontologiques. Pour enrichir la Topic Map, nous nous basons sur deux ontologies générales et nous explorons toutes les questions potentielles relatives aux documents sources. Dans ACTOM, en plus des liens d’occurrences reliant un Topic à ses ressources, nous catégorisons les liens en deux catégories: (a) les liens ontologiques et (b) les liens d’usage. Nous proposons également d’étendre le modèle des Topic Maps défini par l’ISO en rajoutant aux caractéristiques d’un Topic des méta-propriétés servant à mesurer la pertinence des Topics plus précisément pour l’évaluation de la qualité et l’élagage dynamique de la Topic Map.
-Topic Map
-Recherche d’information
-Enrichissement
-Multilingue
-Thésaurus
-Elagage
-Incrémental
-Requêtes
-Fusion
-Evolution
The research work in this thesis is related to Topic Map construction and their use in semantic annotation of web resources in order to help users find relevant information in these resources. The amount of information sources available today is very huge and continuously increasing, for that, it is impossible to create and maintain manually a Topic Map to represent and organize all these information. Many Topic Maps building approaches can be found in the literature [Ellouze et al. 2008a]. However, none of these approaches takes as input multilingual document content. In addition, although Topic Maps are basically dedicated to users navigation and information search, no one approach takes into consideration users requests in the Topic Map building process. In this context, we have proposed ACTOM, a Topic Map building approach based on an automated process taking into account multilingual documents and Topic Map evolution according to content and usage changes. To enrich the Topic Map, we are based on a domain thesaurus and we propose also to explore all potential questions related to source documents in order to represent usage in the Topic Map. In our approach, we extend the Topic Map model that already exists by defining the usage links and a list of meta-properties associated to each Topic, these meta-properties are used in the Topic Map pruning process. In our approach ACTOM, we propose also to precise and enrich semantics of Topic Map links so, except occurrences links between Topics and resources, we classify Topic Map links in two different classes, those that we have called “ontological links” and those that we have named “usage links”.
-Topic Map
-Information search
-Enrichment
-Multilingual
-Thesaurus
-Pruning
-Users requests
-Merging
-Evolution
Source: http://www.theses.fr/2010CNAM0736/document

Sujets

Informations

Publié par
Nombre de lectures 35
Langue Français
Poids de l'ouvrage 8 Mo

Extrait

CONSERVATOIRE NATIONAL ECOLE NATIONALE DES
DES ARTS ET METIERS SCIENCES DE
L‟INFORMATIQUE



THESE EN COTUTELLE
Préparée au sein des laboratoires RIADI-GDL (ENSI) et CEDRIC (Equipe ISID)


présentée par :

Nebrasse ELLOUZE

pour l’obtention du Diplôme de Doctorat en Informatique du CNAM (Paris) et de
l’ENSI (Université de La Manouba)

Discipline/ Spécialité : Informatique


Approche de recherche intelligente fondée sur le modèle
des Topic Maps
Application au domaine de la construction durable



Soutenue le 3 décembre 2010 au CNAM devant le jury d’examen :

Pr. Jacky Akoka, Professeur au CNAM, France Examinateur
Pr. Mohamed Ben Ahmed, Professeur Emérite à l‟université de la Manouba, Tunisie Co-directeur de thèse
Pr. Mokrane Bouzeghoub, Professeur à l‟UVSQ, France Rapporteur
Dr. Zoubida Kedad, Maître de Conférences à l‟UVSQ, France Examinatrice
Dr. Nadira Lammari, Maître de Conférences au CNAM, France Co-encadrante
Pr. Elisabeth Métais, Professeur au CNAM, France Co-directrice de thèse
Pr. Yacine Rezgui, Professeur à l‟université de Salford, UK Rapporteur
Pr. Max Silberztein, Professeur à l‟université de Franche-Conté, France Examinateur

tel-00555929, version 1 - 14 Jan 2011


Dédicace









A mes très chers parents
A tous ceux que j'aime















2

tel-00555929, version 1 - 14 Jan 2011Remerciements
C'est avec une grande émotion et beaucoup de sincérité que je voudrais exprimer ma
gratitude à toutes les personnes ayant participé, soutenu et apprécié mon travail.
Tout d'abord, je tiens à remercier et exprimer toute ma reconnaissance auprès de mon
directeur de thèse Pr. émérite Mohamed Ben Ahmed qui m'a initiée à la recherche et m'a
toujours motivé, soutenu et encouragé. Méticuleux et perfectionniste, il m'a prodigué des
conseils inestimables, dans tous les domaines, tout au long de ma thèse. Ses idées, son
expérience et ses précieux conseils m'ont énormément aidée dans ce travail. Je le remercie
pour sa disponibilité, son soutien et ses conseils nombreux et importants. Il a beaucoup
contribué à la mise en valeur de mon travail, n'a cessé de m'encourager à avancer et m'a aidée
à progresser à travers les difficultés et les doutes inhérents à tout travail de recherche.
Je souhaite remercier très vivement ma co-directrice de thèse Pr. Elisabeth Métais qui
m'a accueilli pendant de longs séjours au laboratoire Cedric du Conservatoire National des
Arts et Métiers, au cours desquels elle s'est montrée très disponible et accueillante pour
discuter de mes travaux de thèse pendant de longues heures. Je la remercie également pour
m'avoir guidé dans mes travaux, conseillé avec professionnalisme et une très grande expertise,
sans jamais compter son temps ni perdre sa bonne humeur. Ses apports majeurs me
permettent aujourd'hui de vous présenter cette thèse.
Je souhaite également remercier très chaleureusement ma co-encadrante, Dr. Nadira
Lammari pour l‟intérêt et la disponibilité qu‟elle a manifestée à l‟égard de mes recherches
ainsi que pour tous les conseils et encouragements dont j‟ai bénéficié tout au long de ce
travail. Qu'elle trouve ici le témoignage de tout mon respect et ma reconnaissance et du plaisir
que j‟ai eu à travailler avec elle tout au long de ma thèse.
Qu'il me soit permis d'exprimer mes sincères remerciements à Pr. Mokrane
Bouzeghoub et Pr. Yacine Rezgui pour accepter d'être mes rapporteurs de thèse. J'exprime
également toute ma gratitude à Pr. Jacky Akoka et Dr. Zoubida Kedad qui m‟ont fait
l'honneur d‟avoir accepté d‟examiner ce travail.
Mes remerciements s'adressent aussi aux membres de l‟équipe ISID pour les discussions
scientifiques enrichissantes et l'ambiance amicale que nous avons partagée durant mes séjours
au CNAM.
Enfin, mes sentiments les plus chaleureux sont pour ma famille. Je remercie mes parents
qui m'ont toujours soutenue dans mes choix et qui m'ont toujours encouragée à aller de
l'avant.
3

tel-00555929, version 1 - 14 Jan 2011Résumé
Cette thèse aborde les problématiques liées à la construction de Topic Maps et à leur
utilisation pour la recherche d‟information dans le cadre défini par le Web sémantique (WS).
Le WS a pour objectif de structurer les informations disponibles sur le Web. Pour cela, les
ressources doivent être sémantiquement étiquetées par des métadonnées afin de permettre
d'optimiser l'accès à ces ressources. Ces métadonnées sont actuellement spécifiées à l'aide des
deux standards qui utilisent le langage XML : RDF et les Topic Maps.
Un contenu à organiser étant très souvent volumineux et sujet à enrichissement
perpétuel, il est pratiquement impossible d‟envisager une création et gestion d‟une Topic
Map, le décrivant, de façon manuelle. Plusieurs travaux de recherche ont concerné la
construction de Topic Maps à partir de documents textuels [Ellouze et al. 2008a]. Cependant,
aucune d‟elles ne permet de traiter un contenu multilingue. De plus, bien que les Topic Maps
soient, par définition, orientées utilisation (recherche d‟information), peu d‟entre elles
prennent en compte les requêtes des utilisateurs.
Dans le cadre de cette thèse, nous avons donc conçu une approche que nous avons
nommée ACTOM pour « Approche de Construction d‟une TOpic Map Multilingue ». Cette
dernière sert à organiser un contenu multilingue composé de documents textuels. Elle a pour
avantage de faciliter la recherche d‟information dans ce contenu. Notre approche est
incrémentale et évolutive, elle est basée sur un processus automatisé, qui prend en compte des
documents multilingues et l‟évolution de la Topic Map selon le changement du contenu en
entrée et l‟usage de la Topic Map. Elle prend comme entrée un référentiel de documents que
nous construisons suite à la segmentation thématique et à l‟indexation sémantique de ces
documents et un thésaurus du domaine pour l‟ajout de liens ontologiques. Pour enrichir la
Topic Map, nous nous basons sur deux ontologies générales et nous explorons toutes les
questions potentielles relatives aux documents sources. Dans ACTOM, en plus des liens
d‟occurrences reliant un Topic à ses ressources, nous catégorisons les liens en deux
catégories: (a) les liens ontologiques et (b) les liens d‟usage. Nous proposons également
d‟étendre le modèle des Topic Maps défini par l‟ISO en rajoutant aux caractéristiques d‟un
Topic des méta-propriétés servant à mesurer la pertinence des Topics plus précisément pour
l‟évaluation de la qualité et l‟élagage dynamique de la Topic Map.
Mots clés : Topic Map, recherche d‟information, enrichissement, documents multilingues,
thésaurus, requêtes des utilisateurs, fusion, élagage, évolution.
4

tel-00555929, version 1 - 14 Jan 2011 Abstract
The research work in this thesis is related to Topic Map construction and their use in
semantic annotation of web resources in order to help users find relevant information in these
resources. The amount of information sources available today is very huge and continuously
increasing, for that, it is impossible to create and maintain manually a Topic Map to represent
and organize all these information. Many Topic Maps building approaches can be found in the
literature [Ellouze et al. 2008a]. However, none of these approaches takes as input
multilingual document content. In addition, although Topic Maps are basically dedicated to
users navigation and information search, no one approach takes into consideration users
requests in the Topic Map building process.
In this context, we have proposed ACTOM, a Topic Map building approach based on an
automated process taking into account multilingual documents and Topic Map evolution
according to content and usage changes. To enrich the Topic Map, we are based on a domain
thesaurus and we propose also to explore all potential questions related to source documents
in order to represent usage in the Topic Map. In our approach, we extend the Topic Map
model that already exists by defining the usage links and a list of meta-properties associated
to each Topic, these m

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents