Cet ouvrage et des milliers d'autres font partie de la bibliothèque YouScribe
Obtenez un accès à la bibliothèque pour les lire en ligne
En savoir plus

Partagez cette publication


Université de Paris-Est
Ecole doctorale : Information, Communication, Modélisation et Simulation (ICMS)
THÈSE
pour obtenir le grade de
Docteur de l’Université Paris-Est
Spécialité : INFORMATIQUE
présentée et soutenue publiquement par
Mehdi EMBAREK
le : 04 juillet 2008
Un système de question-réponse dans le domaine médical
Le système Esculape
A question answering system in the medical domain
The Esculape system
Directeur de thèse
Christian FLUHR
Jury
Brigitte Grau (Rapporteur)
Pierre Zweigenbaum (Rapporteur)
Christian Fluhr (Directeur)
Patrice Bellot (Examinateur)
Olivier Ferret (Examinateur)
tel-00432052, version 1 - 13 Nov 2009



2
tel-00432052, version 1 - 13 Nov 2009Remerciements
Je tiens en premier lieu à remercier Olivier Ferret pour avoir assuré le suivi de ma thèse et
pour l’attention qu’il y a portée. Sa patience, sa disponibilité, ses conseils et ses qualités
scientifiques ont été très précieux pour mener à bien cette thèse. Qu’il trouve dans ces
quelques mots l’expression de ma profonde gratitude.

Je remercie mon directeur de thèse Christian Fluhr pour m’avoir donné la possibilité de
réaliser cette thèse au sein du laboratoire LIC2M. Les remarques et corrections qu’il a
prodiguées ont été d’une aide précieuse.

Je remercie Brigitte Grau et Pierre Zweigenbaum pour avoir accepté d’être rapporteur de ce
travail. Leurs commentaires et leurs suggestions m’ont permis d’améliorer la qualité de ce
manuscrit.

Je remercie Patrice Bellot pour avoir accepté d’examiner cette thèse et de faire partie de mon
jury.

J’adresse mes sincères remerciements aux personnes qui ont accepté de relire la première
version de ma thèse et qui ont contribué à faire de ce document ce qu’il est aujourd’hui :
Delphine Lagarde et Laurent Gillard.

Je remercie respectivement Rodolph Gelin et Arnauld Leservot pour m’avoir accueilli au sein
de leur service.

Je remercie tous mes amis et collègues du LIC2M pour leur soutien, leurs encouragements
et… les croissants du matin. Ils ont dû supporter mon humeur et mes blagues durant tous ce
temps. Merci à mes colocataires de bureau : Benoît Mathieu, Delphine Lagarde et Faïza Gara,
pour leur bonne humeur et les fous rires. Merci à Pierre-Alain Moellic pour ces parties de
Squash et de Tennis. J’espère que le prochain challenger continuera à enchaîner les victoires.
Bien sûr merci à Halima Dahmani et Nasredine Semmar pour leurs conseils ainsi qu’à
Meriama Laib-Boukhari et son légendaire Tiramisu. Sans oublier Olivier Mesnard, Gregory
Grefenstette, Romaric Besançon, Gaël De Chalendar, Patrick Hède, Hervé Le Borgne,
Bertrand Delezoïde, Sofiane Souidi, Christophe Millet, Adrian Popescu et Marc Mergy. Vous
avez été une seconde famille pour moi ! Encore une fois merci.

Je remercie tous les thésards et anciens stagiaires du LIC2M pour leur soutien, nos
discussions et nos pauses.

Enfin, une pensée particulière à mes parents qui m’ont toujours encouragé et soutenu pour
mener à terme ce travail.
3
tel-00432052, version 1 - 13 Nov 2009




















4
tel-00432052, version 1 - 13 Nov 2009Ces remerciements ne seraient pas complets sans mes pensées pour les êtres qui me sont les
plus chers. Ainsi, je dédie cette thèse :

À mes grands parents,

À mes parents Mohamed et Nadia,
Nulle dédicace ne serait vous exprimer toute ma reconnaissance et tout mon amour. Vous
m’avez particulièrement encouragé et aidé durant toutes mes années d’études. Ma
reconnaissance vous est éternelle pour l’éducation et les principes que vous m’avez inculqués.
Que ce travail soit preuve de mon éternelle reconnaissance.

À mon frère et ma sœur,
À Walid et Amel

À Baghdadi Laalaouna,
L’admiration et l’estime qu’impose votre qualité humaine, m’ont poussé et incité pour mener
à terme ce travail. Merci pour votre encouragement et votre soutien.
Veuillez trouver dans ce travail l’expression de mon profond respect.

À Delphine,
Tu m’as remarquablement encouragé et réconforté dans les moments difficiles. Ton aide
morale et ton soutien m’ont été d’un immense soutien dans l’élaboration de ce manuscrit.
Merci d’avoir toujours cru en moi et pour tout le bonheur que tu me procures.
Que ce mémoire soit le témoignage de ma sincère gratitude.

À tous mes collègues de MED POINT DZ,
Vous m’avez soutenu et veillé à mon succès pendant ces années d’étude loin de vous.
J’ai pour vous l’estime et l’admiration qu’imposent vos grandes qualités humaines.
Veuillez trouver dans ce travail l’expression de mon profond respect.

Enfin, merci à tous mes proches et amis, pour leur soutien et leurs encouragements…
5
tel-00432052, version 1 - 13 Nov 2009
6
tel-00432052, version 1 - 13 Nov 2009Résumé
Le domaine médical dispose aujourd'hui d'un très grand volume de documents électroniques
permettant ainsi la recherche d’une information médicale quelconque. Cependant,
l'exploitation de cette grande quantité de données rend la recherche d’une information précise
complexe et coûteuse en termes de temps. Cette difficulté a motivé le développement de
nouveaux outils de recherche adaptés, comme les systèmes de question-réponse. En effet, ce
type de système permet à un utilisateur de poser une question en langage naturel et de
retourner une réponse précise à sa requête au lieu d'un ensemble de documents jugés
pertinents, comme c'est le cas des moteurs de recherche. Les questions soumises à un système
de question-réponse portent généralement sur un type d’objet ou sur une relation entre objets.
Dans le cas d’une question telle que « Qui a découvert l’Amérique ? » par exemple, l’objet de
la question est une personne. Dans des domaines plus spécifiques, tel que le domaine médical,
les types rencontrés sont eux-mêmes plus spécifiques. La question « Comment rechercher
l'hématurie ? » appelle ainsi une réponse de type examen médical.

L'objectif de ce travail est de mettre en place un système de question-réponse pour des
médecins généralistes portant sur les bonnes pratiques médicales. Ce système permettra au
médecin de consulter une base de connaissances lorsqu'il se trouve en consultation avec un
patient. Ainsi, dans ce travail, nous présentons une stratégie de recherche adaptée au domaine
médical. Plus précisément, nous exposerons une méthode pour l’analyse des questions
médicales et l’approche adoptée pour trouver une réponse à une question posée. Cette
approche consiste à rechercher en premier lieu une réponse dans une ontologie médicale
construite à partir de ressources sémantiques disponibles pour la spécialité. Si la réponse n’est
pas trouvée, le système applique des patrons linguistiques appris automatiquement pour
repérer la réponse recherchée dans une collection de documents candidats. L’intérêt de notre
approche a été illustré au travers du système de question-réponse « Esculape » qui a fait
l’objet d’une évaluation montrant que la prise en compte explicite de connaissances médicales
permet d’améliorer les résultats des différents modules du processus de traitement.

Mots-clés : systèmes de question-réponse, domaine médical, ontologie, patrons linguistiques.
7
tel-00432052, version 1 - 13 Nov 2009
8
tel-00432052, version 1 - 13 Nov 2009Abstract
The medical domain has currently a very high volume of electronic documents facilitating the
search of any medical information. However, the exploitation of this large quantity of data
makes the search of specific information complex and time consuming. This difficulty has
prompted the development of new adapted research tools, as question-answering systems.
Indeed, this type of system allows a user to ask a question in natural language and send a
specific answer to its request instead of a set of documents deemed pertinent, as is the case
with search engines. The questions submitted to a question-answering system concern
generally a type of object or a relationship between objects. In the case of a question such as
“Who discovered America?” the object of question is a person. In more specific areas, such as
the medical domain, the types are themselves more specific. The question “How to Search the
hematuria?” waiting for an answer type medical examination.

This dissertation studies the development of a question-answering system for physicians on
good medical practices. This system will allow the doctor to consult a knowledge base when
he is in consultation with a patient. Thus, we present an adapted research strategy to medical
domain. Specifically, we will present a method for analyzing medical questions and the
approach to find an answer to a submitted question. This approach consists to find an answer
first in a medical ontology built from semantic resources available for the domain. If the
answer is not found, the system applies linguistic patterns learned automatically to identify
the answer in a collection of documents. The interest of our approach has been illustrated
through the question answering system “Esculape” which has been the subject of an
evaluation showing that the incorporation of explicit medical knowledge can improves the
results of the different modules of the treatment processes.

Keywords: question-answering systems, medical domain, ontology, linguistic patterns.
9
tel-00432052, version 1 - 13 Nov 2009
10
tel-00432052, version 1 - 13 Nov 2009

Un pour Un
Permettre à tous d'accéder à la lecture
Pour chaque accès à la bibliothèque, YouScribe donne un accès à une personne dans le besoin