Résumé de la thèse de Noureddine Chatti
3 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
3 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

ANNEXES Approche n° 1 - Le document : un objet vivant Page 44 sur 70 Publications et rapports Thèses Actions spécifiques Colloques Tutoriels Thèse de Noureddine Chatti Modélisation et manipulation de documents multistructurés Encadrement : Sylvie Calabretto (LIRIS – INSA Lyon), Jean-Marie Pinon (LIRIS – INSA Lyon) Contexte Ce projet de thèse s’inscrit dans le cadre des recherches communes menées par 17 équipes de la région Rhône-Alpes au sein de l’Institut des Sciences du Document Numérique (ISDN) autour du thème « Le document numérique dans son cycle de vie ». L’ISDN a privilégié trois axes de recherche : - Le document, un objet vivant - L’édition : un modèle en mutation qui vise à définir un nouveau modèle éditorial pour les documents numériques. - Le Web : un processus de publication à évaluer. Cette approche vise à construire et à tester des systèmes d’évaluation de sites Web pour identifier les ressorts de leur constitution. Ce projet de thèse s’intègre dans les travaux de recherche de l’axe 1 « Le document, un objet vivant». Cet axe vise à modéliser le document et son évolution dans le temps et l’espace. En effet, considérer un document comme un objet unique semble réducteur. De très nombreux documents multimédias sont plus ou moins régulièrement annotés, modifiés, enrichis, … L’objectif de cette approche est de modéliser la dynamique temporelle contenue dans les documents numériques (documents techniques et textes ...

Informations

Publié par
Nombre de lectures 98
Langue Français

Extrait

ANNEXES Publications et rapports
Approche n° 1 - Le document : un objet vivant
Actions spécifiques
Colloques
Thèse de Noureddine Chatti
Page 44 sur 70
Tutoriels
Modélisation et manipulation de documents multistructurés Encadrement : Sylvie Calabretto (LIRIS – INSA Lyon), Jean-Marie Pinon (LIRIS – INSA Lyon)
Contexte Ce projet de thèse s’inscrit dans le cadre des recherches communes menées par 17 équipes de la région Rhône-Alpes au sein de l’Institut des Sciences du Document Numérique (ISDN) autour du thème «Le document numérique dans son cycle de vie». L’ISDN a privilégié trois axes de recherche : -Le document, un objet vivant -L’édition :un modèle en mutationvise à définir un nouveau modèle éditorial pour les qui documents numériques. -Le Web: un processus de publicationà évaluer.Cette approche vise à construire et à tester des systèmes d’évaluation de sites Web pour identifier les ressorts de leur constitution. Ce projet de thèse s’intègre dans les travaux de recherche de l’axe 1 «Le document, un objet vivant». Cet axe vise à modéliser le document et son évolution dans le temps et l’espace. En effet, considérer un document comme un objet unique semble réducteur. De très nombreux documents multimédias sont plus ou moins régulièrement annotés, modifiés, enrichis, … L’objectif de cette approche est de modéliser ladynamique temporelledans les documents numériques (documents techniques contenue et textes réglementaires en particulier) et de résoudre les problèmes liés à lamultistructuralité des documents.
Problématique générale Les standards tels que Open Document Architecture et SGML (Standard Generalised Mark-up Language) [ODA 1991] [SGML 1986] considèrent que le document possède au moins deux structures de représentation : 3.La structurephysiquedéfinit la présentation du document sur le support. Cette structure est constituée d’éléments physiques tel que la première page, un bloc, une colonne. 4.La structure logiquedéfinit une organisation hiérarchique de l’information contenue dans le document. Le document logique est alors composé de titres, chapitres, paragraphes, notes, schémas, … M. Nanard [Nanard 1996], L. Poullet [Poullet 1997a&b] et B. Chabbat [Chabbat 1997] ont introduit une troisième structure : la structuresémantique. Elle représente l’information elle-même, le sens du contenu du document. La structure sémantique décrit les informations représentatives du contenu du document, c’est-à-dire les informations qu’un utilisateur ou un automate sont susceptibles de demander lors d’une recherche. Elle se superpose au document. Elle permet alors de manipuler le document selon des propriétés sémantiques particulières à l’information qui y est contenue. Par exemple, sur des documents réglementaires, la mise en œuvre de cette structure permet de manipuler desrègleset non plus des sections ou des paragraphes. D’autres types de structures liées à la nature et à l’usage des documents doivent également être représentées et manipulées. Nous pouvons respectivement citer les structures nécessaires aux documents multilingues d’une part, et à l’adaptation aux utilisateurs d’autre part, dans le cas de restitutions multiples (vue synthétique/développée, vue néophyte/expérimenté, vue français/anglais, combinaison de ces restitutions, etc.) [Chaudiron 2000]. Certaines de ces structures peuvent être déduites entre elles (exemple : la structure physique peut le plus souvent se déduire de la structure logique). D’autres sont incompatibles entre elles (exemple : structure logique et sémantique). Aujourd’hui, il paraît ainsi difficile de gérer simultanément et de manière cohérente plusieurs structures [Lefèvre 1993] [Renear 1996]. Pour aborder ce problème, il est donc nécessaire de commencer par établir unetypologie des relationsentre ces différentes structures.
ISDN – Institut des Sciences du Document Numérique – Annexes au rapport final d’activité 2000-2003 – 30 sept 2003
ANNEXES Approchen° 1 - Le document : un objet vivantPage 45 sur 70 Publications et rapports Actions spécifiquesColloques Tutoriels Les enjeux Cette problématique répond à quatre enjeux majeurs dans le domaine de la gestion documentaire : 3. Lagestion homogène de différentes représentations d’une même information documentaire, 4. Lagestion de la cohérence au sein d’un document ou d’une base documentaire, 5. Larestitution multiple d’un document, 6. Lagestion des évolutions structurelles. D’un point de vue industriel, ce dernier point est particulièrement important. En effet, une grande partie du coût d’un projet documentaire provient de la définition et de la maintenance des structures de documents. Lorsqu’une structure évolue pour un type de document, toutes les applications liées à ce type de document doivent être reprises. Les instances de ces documents doivent également souvent être transformées, ce qui engendre des coûts très importants, et parfois prohibitifs. La possibilité de gérer plusieurs structures simultanément permettrait de faire évoluer une structure de manière modulaire et souple, ce qui diminuerait considérablement les coûts liés à cette maintenance.
L’objectif Ce projet de thèse s’inscrit ainsi dans la problématique générale de lareprésentation multistructurelle de documents. Il s’agira de : 7. proposerune modélisation des documents multistructurés, 8. effectuerla conception et la réalisation d’un module de manipulation de ces documents.
Le plan d’action prévisionnel Pour débuter les travaux de recherche, nous proposons d’établir le plan d’action suivant : État de l’art du domaine, Étude concrète de différents types de documents multistructurés, Étude des interactions entre structures et typologie des relations interstructurelles, Gestion de la compatibilité et de la cohérence structurelle, Utilisation de liens pour la représentation de structures, Définition d’une fonction de transformation entre liens et structure interne, Conception de fonctions de manipulation de documents multistructurés, Réalisation d’un prototype implémentant ces fonctions. Ce plan d’action devra être précisé et adapté au fur et à mesure de l’avancement des travaux. Le doctorant pourra travailler sur des documents multistructurés concrets mis à disposition par le partenaire. Il s’agit de documents réglementaires, particulièrement représentatifs de la problématique. Ilsera ainsi possible de valider les modèles obtenus et de les faire évoluer dans un contexte d’application réelle en entreprise. Les membres de l’ISDN pourront également fournir des exemples concrets de documents multistructurés, spécifiques de la problématique d’usages ou de restitutions multiples. Mots-clés: documents multistructurés, structure sémantique, usage, gestion de la cohérence, interaction structurelle, restitutions multiples, SGML, XML, XLink.
ISDN – Institut des Sciences du Document Numérique – Annexes au rapport final d’activité 2000-2003 – 30 sept 2003
ANNEXES Approchen° 1 - Le document : un objet vivantPage 46 sur 70 Publications et rapports Actions spécifiquesColloques Tutoriels Rôle et implication du partenaire Le partenaire associé est laCaf de Lyon-section Cnedi. L’entreprise souhaite s’impliquer dans ces travaux de recherche de la manière suivante : Encadrement du doctorant par le responsable de l’équipe Base de Données Juridiques, Participation de cette équipe à la modélisation et à l’avancement des travaux, Mise à disposition de ressources bibliographiques, Mise à disposition de documents réglementaires multistructurés, Validation puis intégration des résultats dans le cadre de l’entreprise, Participation au plan d’action de la thèse, Suivi des relations avec le laboratoire.
Références bibliographiques [Chabbat 1997] B. Chabbat.Modélisation Multiparadigme de textes réglementaires.de doctorat, LISI. Lyon, Thèse décembre 1997, 392 p. [Chaudiron 2000] S. Chaudiron, F. Role, M. Ihadjadene.CodeX : un système pour la définition de vues multiples guidée par les usages.Actes du troisième Colloque International sur le Document Électronique : CIDE’2000. Lyon, 4-6 juillet 2000, pp. 71-81 [Lefèvre 1993] Lefèvre P., Reynaud F.,Choix d'un format de représentation normalisé de la structure physique des documents,Clamart : EDF, Mars 1993, 97 p. Collection de notes internes de la Direction des Études et Recherches EDF [Nanard 1996] M. Nanard, J. Nanard. Et all.La métaphore du généraliste: acquisition et utilisation de la connaissance macroscopique sur une base de documents techniques.Acquisition et Ingénierie des Connaissances - Tendances actuelles. N. Aussenac-Gilles, P. Laublet, C. Reynaud. Toulouse : CEPADUES, 1996, pp 285-304. [ODA 1991] AFNOR,Architecture des documents de bureau (ODA) et format d'échange,Norme NF ISO 8613-1 à 8613-8, 1991, 598 p. Bureautique, Traitement de l'information. [Poullet 1997a] L. Poullet.Formaliser la sémantique des documents – Un modèle unificateur.Actes de la Xème Conférence INFORSID’1997, Toulouse, juillet 1997 [Poullet 1997b] L. Poullet. J.M. Pinon S. Calabretto.Semantic Structuring of Documents.Proceedings of the Third Basque International Workshop on Information Technology , BIWIT’97, Biarritz, July 1997,pp. 118 – 124. ISBN 0-8186-8049-0 [Rastier 1994] Rastier F., Cavazza M., Abeillé A.,Sémantique pour l'analyse. De la linguistique à l'informatique,Paris : Masson, 1994, 240 p. Sciences Cognitives. [Renear 1996] A. Renear, E. Mylonas, D. Durand.Refining our Notion of What Text Really Is: The Problem of Overlaping Hierarchies.Journal of Research in Humanities Computing. 1996 http://www.stg.brown.edu/resources/stg/monographs/ohco.html. [SGML 1986] International Organization for Standardization (ISO), Information Processing – Text and Office Systems – Standard Generalized Markup Language(SGML), ISO 8879-1986 [XLink 2000] World Wide Web Consortium (W3C),XML Linking Language (XLink) Version 1.0, Proposed recommendation, 2000 http://www.w3.org/TR/xlink/[XML 2000] World Wide Web Consortium (W3C),eXtensible Markup Language (XML) 1.0 Second Edition, Recommendation, 2000 http://www.w3.org/TR/REC-xml[XTM 2000] TopicMaps.Org Authoring Group,XML Topic Maps (XTM) 1.0, Specification, 2000 http://www.topicmaps.org/xtm/1.0/
ISDN – Institut des Sciences du Document Numérique – Annexes au rapport final d’activité 2000-2003 – 30 sept 2003
  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents