Publiez

S'identifier

S'inscrire

Technologies du Web Sémantique pour l’Entreprise 2.0, Semantic Web Technologies for Enterprise 2.0

de Alexandre Passant (Auteur)

publié par

Thesee

s'abonner

Sous la direction de Jean-Pierre Desclés
Thèse soutenue le 09 juin 2009: Paris 4
Les travaux présentés dans cette thèse proposent différentes méthodes, réflexions et réalisations associant Web 2.0 et Web Sémantique. Après avoir introduit ces deux notions, nous présentons les limites actuelles de certains outils, comme les blogs ou les wikis, et des pratiques de tagging dans un contexte d’Entreprise 2.0. Nous proposons ensuite la méthode SemSLATES et la vision globale d’une architecture de médiation reposant sur les standards du Web Sémantique (langages, modèles, outils et protocoles) pour pallier à ces limites. Nous détaillons par la suite différentes ontologies (au sens informatique) développées pour mener à bien cette vision : d’une part, en contribuant activement au projet SIOC - Semantically-Interlinked Online Communities -, des modèles destinés aux méta-données socio-structurelles, d’autre part des modèles, étendant des ontologies publiques, destinés aux données métier. De plus, la définition de l’ontologie MOAT - Meaning Of A Tag - nous permet de coupler la souplesse du tagging et la puissance de l'indexation à base d’ontologies. Nous revenons ensuite sur différentes implémentations logicielles que nous avons mises en place à EDF R&D pour permettre de manière intuitive la production et l'utilisation d'annotations sémantiques afin d’enrichir les outils initiaux : wikis sémantiques, interfaces avancées de visualisation (navigation à facettes, mash-up sémantique, etc.) et moteur de recherche sémantique. Plusieurs contributions ont été publiées sous forme d'ontologies publiques ou de logiciels libres, contribuant de manière plus large à cette convergence entre Web 2.0 et Web Sémantique non seulement en entreprise mais sur le Web dans son ensemble.
-Web 2.0
-Entreprise 2.0
-Web sémantique
-Ontologies
-Folksonomies
-Wikis
-SIOC
-MOAT
The work described in this thesis provides different methods, thoughts and implementations combining Web 2.0 and the Semantic Web. After introducing those terms, we present the current shortcomings of tools such as blogs and wikis as well as tagging practices in an Enterprise 2.0 context. We define the SemSLATES methodology and the global vision of a middleware architecture based on Semantic Web technologies (languages, models, tools and protocols) to solve these issues. Then, we detail the various ontologies (as in computer science) that we build to achieve this goal: on the one hand models dedicated to socio-structural meta-data, by actively contributing to SIOC - Semantically-Interlinked Online Communities -, and on the other hands models extending public ontologies for domain data. Moreover, the MOAT ontology - Meaning Of A Tag – allows us to combine the flexibility of tagging and the power of ontology-based indexing. We then describe several software implementations, at EDF R&D, dedicated to easily produce and use semantic annotations to enrich original tools: semantic wikis, advanced visualization interfaces (faceted browsing, semantic mash-ups, etc.) and a semantic search engine. Several contributions have been published as public ontologies or open-source software, contributing more generally to this convergence between Web 2.0 and the Semantic Web, not only in enterprise but on the Web as a whole.
Source: http://www.theses.fr/2009PA040077/document
lire la suite replier
Télécharger
 ⁄   

Partager

Université Paris IV - Sorbonne
École doctorale V - Concepts et Langages
Technologies du Web Sémantique pour
l’Entreprise 2.0
Thèse
Pour l’obtention du grade de
Docteur de l’Université Paris IV - Sorbonne
Discipline: Informatique
Présentée et soutenue publiquement
Le 9 Juin 2009 par
Alexandre Passant
Défendue devant un jury composé de:
– Fabien L. Gandon, INRIA Sophia-Antipolis, Rapporteur
– Gilles Kassel, Université de Picardie, Rapporteur
– Jean-Pierre Desclés, Université Paris IV - Sorbonne, Directeur
– Philippe Laublet, Paris IV - Sorbonne, Co-directeur
– Ivan Herman, CWI Amsterdam / W3C, Examinateur
– François-Xavier Testard-Vaillant, Électricité de France, Examinateur
|_|_|_|_|_|_|_|_|_|_|
(Numéro d’enregistrement attribué par la bibliothèque)Ce mémoire est mis à disposition sous un contrat Creative Commons "Paternité-
Pas d’Utilisation Commerciale-Pas de Modification 2.0 France". Les détails de
ce contrat sont disponibles à l’adresse suivante : http://creativecommons.
org/licenses/by-nc-nd/2.0/fr/À JulieRésumé
Cette thèse s’inscrit dans le cadre des récents travaux relatifs à la complémentarité entre
Web Sémantique et Web 2.0, deux visions du Web qui ont souvent été considérées, à tort,
comme disjointes. Plus particulièrement, nous nous intéressons à l’utilisation des techno-
logies du Web Sémantique (i.e. langages, modèles, outils et protocoles) dans le contexte de
l’Entreprise 2.0, vision où les outils de plus en plus courants du Web 2.0 (blogs, wikis, ser-
vices de partage de contenus, pratiques de tagging ...) font leur apparition dans les systèmes
d’information organisationnels. Si ces outils facilitent le partage et la collaboration entre
individus, dans l’objectif de faire émerger une Intelligence Collective au sein de telles struc-
tures, ils introduisent de nouvelles problématiques en termes d’exploitation pertinente des
informations produites. D’une part, la diversité des outils utilisés complexifie l’intégration
d’informations provenant de diverses sources (blogs, wikis, flux RSS ...) fragmentées au sein
du réseau d’entreprise. D’autre part, la nature plein-texte des outils utilisés rend délicate la
réutilisation de manière autonome des connaissances ainsi produites, notamment au sein
des wikis qui permettent pourtant l’élaboration de bases de connaissances pérennes. Enfin,
les pratiques de tagging soulèvent différents problèmes en terme de recherche d’informa-
tions, dus notamment à l’ambiguïté et l’hétérogénéité des mots-clés utilisés, ainsi qu’a leur
manque d’organisation.
Afin de répondre à ces différentes problèmes et en reprenant l’acronyme SLATES (Search,
Links, Authoring, Tags, Extension, Signals) utilisé pour identifier l’Entreprise 2.0, nous définis-
sons le paradigme SemSLATES, proposant la mise en place d’une architecture de médiation
sociale et sémantique venant en support d’un ensemble d’outils existants. Cette évolution
implique la définition et l’implémentation de différents composants, aussi bien en termes de
représentation des connaissances que d’architecture logicielle, composants que nous avons
mis en place dans le cadre de cette thèse, en s’appuyant essentiellement sur les technologies
du Web Sémantique via les standards du W3C.
Ainsi, nos travaux ont consisté d’une part en la mise en place d’ontologies formelles,
aussi bien en terme de métadonnées socio-structurelles (afin de représenter les interactions
sociales produites au sein des différents applications utilisées et les contenus issus de ces
interactions) que de métier (afin d’annoter les contenus eux-mêmes). En ce qui
concerne le premier type, nous avons participé activement au projet SIOC – Semantically-
Interlinked Online Communities –, définissant une ontologie permettant de représenter les
activités des communautés en ligne et les contributions associées. En rapport au second
point, nous avons défini un certain nombre d’ontologies de domaine, légères et extensibles,
ireposant sur des modèles déjà existants et adoptés sur le Web, proposant ainsi certaines
bonnes pratiques relatives à la modélisation de telles ontologies. Enfin, afin d’établir un
lien entre ces deux niveaux de représentation, nous avons mis en place le modèle MOAT –
Meaning Of A Tag – permettant de faire le lien entre tags et ressources du Web Sémantique
(classes et instances d’ontologies), dans l’objectif de coupler la souplesse des folksonomies
et la puissance de l’indexation sémantique basée sur des ontologies. Bien qu’indépendants,
l’ensemble de ces modèles s’articule ainsi de manière cohérente afin de prendre en compte
les différentes strates de représentations des connaissances nécessaires à de tels écosystèmes
sémantiques.
Nous avons également mis en place différents composants logiciels permettant la pro-
duction et l’exploitation d’annotations sémantiques de manière intuitive pour les utilisa-
teurs finals et communiquant au travers d’un ensemble de protocoles dédiés. En termes de
production d’annotations, nous avons développé différents services permettant l’export au-
tomatique d’annotations représentées avec SIOC depuis des outils de blogs, wikis et flux
RSS dans ce contexte d’entreprise. Nos travaux se sont également concentrés sur la défi-
nition d’un service de wiki sémantique afin de permettre une constitution collaborative,
ouverte et incrémentale de bases de connaissances formelles reposant sur des ontologies,
sans pour autant confronter les utilisateurs à la complexité des modèles sous-jacents. Nous
avons également proposé différents services innovants venant tirer parti des graphes d’an-
notation produits. C’est ainsi le cas d’un moteur de recherche sémantique que nous avons
mis en place et qui permet de visualiser des informations (agrégées depuis différents outils
d’entreprise) au sujet des instances d’ontologies peuplées depuis les wikis, tout en propo-
sant d’étendre la recherche en considérant l’ensemble des différents graphes d’annotations
disponibles au sein du système. Nous avons également proposé de nouvelles manières de
visualiser ces informations, notamment au travers d’un système de mash-up combinant don-
nées internes au système organisationnel et données RDF publiques et reposant sur une
interface à facettes.
Alors que l’ensemble de nos recherches ont été validés dans un contexte industriel, la
portée de certaines de nos propositions est plus large que ce cadre d’entreprise, et plus géné-
ralement que ce contexte d’Entreprise 2.0. Différents travaux ont ainsi été publiés sous forme
d’ontologies publiques ou de logiciels libres, permettant leur utilisation a grande échelle sur
le Web. Ainsi, ce manuscrit propose, plus globalement, différentes réflexions sur la complé-
mentarité, selon nous nécessaire, entre Web 2.0 et Web Sémantique, pour conduire le Web à
son plus haut potentiel.
Mots-clés :
Web 2.0, Entreprise 2.0, Web Sémantique, Ontologies, Folksonomies, Wikis, SIOC, MOAT,
Linked DataAbstract
This Ph.D. thesis is part of some recent works regarding the complementarity between
the Semantic Web and the Web 2.0, two visions of the Web that have often been conside-
red, wrongly, as disjoints. Especially, our focus is the use of Semantic Web technologies (i.e
languages, models, tools and protocols) in Enterprise 2.0 contexts, a vision in which most
of the commonly used Web 2.0 tools (such as blogs, wikis, content-sharing services, tagging
practices ...) became popular in corporate information systems.
Yet, while these tools can ease the process of information sharing and collaborations
between individuals, with the global aim to create a Collective Intelligence within such
structures, they introduce new issues regarding how to efficiently use the information they
helped to produce. On the one hand, the nature and diversity of the services used makes
the information integration process a complex task, from various sources fragmented in the
corporate network (blogs, wikis, RSS feeds ...). On the other hand, the plain-text nature of
these tools makes also difficult to reuse the created knowledge, especially regarding wikis,
generally used as valuable knowledge bases. Finally, the practice of tagging raises several
problems in terms of information retrieval, especially due to the ambiguity and heteroge-
neity of the tags used, as well as their lack of organization.
In order to solve these different issues and considering the SLATES acronym (Search,
Links, Authoring, Tags, Extension, Signals) used to define the Enterprise 2.0 vision, we de-
fined the SemSLATES paradigm, proposing a social semantic middleware architecture on
the top of existing services. This proposal implies to define and implement various com-
ponents, both in terms of knowledge engineering and software architecture, components
that we have developed in the context of this Ph.D., relying essentially on Semantic Web
technologies via W3C standards.
Hence, our research consisted in defining formal ontologies, in order to model both the
socio-structural meta-data (in order to model community interactions happening in these
applications as well as the content emerging from these interactions) and business data (in
order to annotate the data contained in the application) Regarding the first type of ontolo-
gies, we actively participated in the SIOC project – Semantically-Interlinked Online Commu-
nities – that defines a model to represent activities of online communities and their rela-
ted contributions. Regarding the second one, we defined several domain ontologies, light-
weight, extensible and based on existing and Web-used models, hence defining some good
practices regarding lightweight ontologies modeling in such contexte. Finally, in order to
provide some relationships between these two levels of knowledge representation, we defi-
iiined MOAT – Meaning Of A Tag – that allows to create a bridge between tags and Semantic
Web resources (i.e.aclasses and instances from ontologies) in order to take into account both
the flexibility of folksonomies and the power of semantic indexing based on ontologies.
While being independant, all these models articulate themselves in a consistent manner in
order to take into account the different layers of knowledge representation for such semantic
ecosystems.
We also developed several software components (communicating thanks to a set of dedi-
cated protocols) in order to produce and use semantic annotations in a user-friendly way for
end-users. In the context of producing semantic annotations, we wrote different services that
automatically export SIOC-based annotations from blogs, wikis and RSS feeds in this enter-
prise context. We also defined a semantic wiki service in order to let end-users participate in
a collaborative, open and incremental process to define formal knowledge bases driven by
ontologies, without letting these users face the complexity of the underlying models. Mo-
reover, we also designed several innovative services using the produced annotations. We
wrote a dedicated semantic search engine allowing to browse information (aggregated from
various enterprise sources) relatd to ontologies instances populated via the wikis and also
offering a search extension system by considering the whole graphs of semantic annotations
available in the system. We also proposed new ways to browse these information, building a
dedicated mash-up system combining internal information and public RDF data and using
a faceted browsing interface.
While our research has been done in an industrial context, the scope of our proposals
goes further than this corporate context and more generally than the Enterprise 2.0 context.
Hence, various works have then been published as public ontologies or free software, allo-
wing to be used at a Web scale. Thus, this thesis suggests, more broadly, different ideas and
thoughts regarding the complementarity, in our opinion needed, between Web 2.0 and the
Semantic Web, leading the Web to its highest potential.
Keywords :
Web 2.0, Enterprise 2.0, Semantic Web, Ontologies, Folksonomies, Wikis, SIOC, MOAT,
Linked DataTable des matières
Résumé i
Abstract iii
Table des matières v
Table des gures ix
Liste des tableaux xiii
Listings xv
Introduction 1
Contexte et problématique scientifique . . . . . . . . . . . . . . . . . . . . . . . . . 1
Contexte de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Motivations et axes de recherche . . . . . . . . . . . . . . . . . . . . . . . . 2
Principaux résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Organisation du mémoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Plan due . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Guide de lecture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1 Vers une convergence entre Web Sémantique et Web 2.0 11
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1 Formalismes et structures de données avec le Web Sémantique . . . . . . . 12
1.1.1 Vers un Web interprétable par les machines . . . . . . . . . . . . . 12
1.1.2 Représentation des connaissances avec RDF(S) et OWL . . . . . . 16
1.1.3 Interrogation de données avec SPARQL . . . . . . . . . . . . . . . 25
1.1.4 Web Sémantique et Web of Data . . . . . . . . . . . . . . . . . . . . 27
1.2 Du consommateur au producteur avec le Web 2.0 . . . . . . . . . . . . . . 30
1.2.1 Une vision participative du Web . . . . . . . . . . . . . . . . . . . 30
1.2.2 Blogs, wikis, réseaux sociaux et syndication de contenu . . . . . . 33
1.2.3 Métadonnées sociales : tags et folksonomies . . . . . . . . . . . . 38
1.3 Complémentarité entre les deux domaines . . . . . . . . . . . . . . . . . . . 42
1.3.1 Synthèse des deux visions . . . . . . . . . . . . . . . . . . . . . . . 42
v1.3.2 Apports du Web 2.0 pour le Web Sémantique . . . . . . . . . . . . 43
1.3.3 du Web Sémantique pour le Web 2.0 . . . . . . . . . . . . 44
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2 SemSLATES : Une approche sémantique pour l’Entreprise 2.0 49
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.1 Web collaboratif en entreprise : le projet Athéna . . . . . . . . . . . . . . . 50
2.1.1 Origine et objectifs du projet . . . . . . . . . . . . . . . . . . . . . . 50
2.1.2 Répondre efficacement aux différents besoins . . . . . . . . . . . . 53
2.1.3 Complémentarité générale des outils . . . . . . . . . . . . . . . . . 57
2.1.4 Retour sur expérience . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.2 Limites de l’approche classique . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.2.1 Fragmentation de l’information et hétérogénéité des formats . . . 62
2.2.2 Capitalisation des connaissances . . . . . . . . . . . . . . . . . . . 63
2.2.3 Tags et recherche d’information . . . . . . . . . . . . . . . . . . . . 63
2.2.4 Synthèse des problèmes rencontrés . . . . . . . . . . . . . . . . . . 68
2.3 Écosystème sémantique pour l’Entreprise 2.0 . . . . . . . . . . . . . . . . . 69
2.3.1 Web Sémantique et méthodologie SemSLATES . . . . . . . . . . . 69
2.3.2 Définition d’une architecture sociale de médiation sémantique . . 71
2.3.3 Modèles, adaptateurs et services . . . . . . . . . . . . . . . . . . . 73
2.3.4 Situation de l’approche vis-à-vis de l’état de l’art . . . . . . . . . . 77
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3 Rôle et dénition d’un ensemble d’ontologies pour l’Entreprise 2.0 83
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.1 Métadonnées socio-structurelles pour le Web 2.0 avec SIOC . . . . . . . . . 84
3.1.1 Identification des Besoins . . . . . . . . . . . . . . . . . . . . . . . 84
3.1.2 Positionnement par rapport à de l’art . . . . . . . . . . . . . . . . 86
3.1.3 Présentation du modèle de représentation SIOC . . . . . . . . . . 89
3.1.4 Alignement avec des vocabulaires existants . . . . . . . . . . . . . 94
3.1.5 SIOC, FOAF et la portabilité des données Web 2.0 . . . . . . . . . 96
3.1.6 Adoption du modèle et évaluation . . . . . . . . . . . . . . . . . . 101
3.2 Modélisation des ontologies métier . . . . . . . . . . . . . . . . . . . . . . . 104
3.2.1 Besoins en termes de représentation métier . . . . . . . . . . . . . 104
3.2.2 FOAF pour la représentation des personnes physiques et morales 104
3.2.3 Localisation avec Geonames . . . . . . . . . . . . . . . . . . . . . . 107
3.2.4 Ontologies des rôles et utilisation de SKOS . . . . . . . . . . . . . 109
3.2.5 Articulation globale des différentes ontologies métier . . . . . . . 117
3.3 MOAT pour lier tags et ontologies . . . . . . . . . . . . . . . . . . . . . . . 120
3.3.1 Tags, folksonomies et ontologies : un état de l’art . . . . . . . . . . 120
3.3.2 Représentation de la signification des tags avec MOAT . . . . . . 127
3.3.3 Modèle de représentation MOAT . . . . . . . . . . . . . . . . . . . 128
3.3.4 Positionnement de MOAT par rapport à l’état de l’art . . . . . . . 134
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

Chargement...

Signaler un abus
  • 0 vote(s)

    0

  • 131 lecture(s)
  • 0 commentaire(s)
  • 23 téléchargement(s)
Publié le : 27/10/2011
Langue : Français
Nombre de pages : 288
Type de la publication : Rapports et thèses
Thème :

Savoirs

17/1000 caractères maximum.