these

De
Publié par

Université de Paris-Sorbonne (Paris IV) I.S.H.A. (Institut des Sciences Humaines Appliquées) L’expression de la causalité dans les textes Contribution au filtrage sémantique par une méthode informatique d’exploration contextuelle Thèse de doctorat Spécialité : linguistique informatique présentée par Agata JACKIEWICZ sous la direction de Monsieur le Professeur Jean-Pierre DESCLÉS 21 février 1998 La préparation du présent travail s’est déroulée dans le cadre d’une convention CIFRE n°004/94 (informatique) entre : Ø le laboratoire CAMS (Centre d’Analyse et de Mathématiques Sociales, directeur Pierre Rosenstiehl), unité mixte de recherche 17 du CNRS, de l’EHESS et de l’Université Paris-SORBONNE, et Ø dans un premier temps, la société EDIAT, filiale de Decision International (DI), (où la direction du projet a été assurée par Christian Tora), et dans un deuxième temps, la société CR2A-DI (où la responsabilité du projet est alors revenue à Jacques Blin) 2Remerciements Je tiens à dire ici ma sincère gratitude à toutes les personnes qui, directement ou indirectement, ont contribué à l’aboutissement de ce travail. Je voudrais tout d’abord exprimer ma reconnaissance à Jean-Pierre Desclés pour avoir su guider ce travail, tout en me laissant une grande liberté dans mes recherches. Je lui adresse mes plus sincères remerciements pour sa disponibilité, la somme d’enseignements prodigués et ses ...
Publié le : samedi 24 septembre 2011
Lecture(s) : 31
Nombre de pages : 305
Voir plus Voir moins

Université de Paris-Sorbonne (Paris IV)
I.S.H.A. (Institut des Sciences Humaines Appliquées)





L’expression de la causalité dans les textes
Contribution au filtrage sémantique
par une méthode informatique d’exploration contextuelle



Thèse de doctorat
Spécialité : linguistique informatique
présentée par
Agata JACKIEWICZ



sous la direction de
Monsieur le Professeur Jean-Pierre DESCLÉS





21 février 1998








La préparation du présent travail s’est déroulée dans le cadre d’une convention CIFRE
n°004/94 (informatique) entre :
Ø le laboratoire CAMS (Centre d’Analyse et de Mathématiques Sociales, directeur
Pierre Rosenstiehl), unité mixte de recherche 17 du CNRS, de l’EHESS et de
l’Université Paris-SORBONNE,
et
Ø dans un premier temps, la société EDIAT, filiale de Decision International (DI), (où
la direction du projet a été assurée par Christian Tora), et dans un deuxième temps,
la société CR2A-DI (où la responsabilité du projet est alors revenue à Jacques Blin)
2Remerciements

Je tiens à dire ici ma sincère gratitude à toutes les personnes qui, directement ou indirectement,
ont contribué à l’aboutissement de ce travail.
Je voudrais tout d’abord exprimer ma reconnaissance à Jean-Pierre Desclés pour avoir su
guider ce travail, tout en me laissant une grande liberté dans mes recherches. Je lui adresse mes
plus sincères remerciements pour sa disponibilité, la somme d’enseignements prodigués et ses
commentaires toujours fructueux.
Je tiens à remercier tout particulièrement Michel Charolles et Jean-Marie Pierrel qui ont
accepté d’examiner mon travail pour en être rapporteurs. Je suis reconnaissante à Raymond
Boudon, à Gaston Gross et à Jacques Blin pour avoir accepté de participer à mon jury de thèse, et
de m’avoir ainsi témoigné leur confiance.
J’exprime ma gratitude à Christian Tora et à Jacques Blin, pour l’accueil chaleureux dans
leurs sociétés respectives, et l’intérêt porté à ce projet.
La présente recherche a grandement bénéficié d’un travail d’équipe, en collaboration avec
Jawad Berri, Emmanuel Cartier et Jean-Luc Minel. Nos nombreuses discussions n’ont pas fini de
nourrir ce travail.
J’ai trouvé dans Philippe Laublet, Chaffeekh Jeeroburkhan, Pierre Boudon et Jean-Luc Minel
des lecteurs critiques, scrupuleux et perspicaces. Qu’ils en soient remerciés.
De nombreuses personnes, et plus particulièrement Roselyne Cantarel et Michel de Glas, m’ont
offert leur aide à divers moments de la préparation du document final. Je leur adresse mes plus vifs
remerciements.
Ma pensée va enfin à l’ensemble de l’équipe LaLIC et du personnel de l’ISHA. Sans eux cette
thèse n’aurait pas bénéficié des nombreux moments d’échange d’idées, de soutien et de complicité.
3TABLE DES MATIÈRES
INTRODUCTION GENERALE 9
1 PRESENTATION DE LA THESE 12
1.1 Approche de la causalité 12
1.2 Cadre informatique 14
1.2.1 Filtrage automatique de textes : besoins, solutions et attentes 14
1.2.2 Filtrage par exploration contextuelle 17
1.2.3 La causalité pour le résumé et le filtrage sémantique de textes 18
1.2.4 Quelques travaux informatiques sur le traitement de la causalité 19
2 PLAN DU DOCUMENT 21
PARTIE I : PROBLEMATIQUE DE LA CAUSALITE ET SON TRAITEMENT
INFORMATIQUE 23
CHAPITRE 1 : COMMENT APPREHENDER LA NOTION DE CAUSALITE ? 26
1 ENQUETE SUR LA DIVERSITE DES APPROCHES 26
1.1 Diversité des domaines concernés 26
1.2 Diversité des définitions proposées 27
1.3 Dans les choses et/ou dans l’esprit ? 33
2 INDETERMINATION DE LA NOTION DE CAUSALITE 33
2.1 Flottement conceptuel du vocabulaire causal 34
2.1.1 Quelques témoignages 34
2.1.2 Quelques exemples d’énoncés 36
2.2 Typologies, une tentative de pallier à l’absence de définition ? 37
2.2.1 Saisir l’action efficiente 38
2.2.2 Saisir l’action efficiente en catégorisant ses effets 41
2.2.3 Catégoriser les contenus mis en relation 44
3 ACCEPTION LARGE DE LA CAUSALITE 47
4 CONCLUSION 49
CHAPITRE 2 : TEXTES, CAUSALITE, METHODE 51
1 ROLE DES TEXTES DANS L’ETUDE DE LA CAUSALITE 51
1.1 Travailler sur les textes : un choix ou une nécessité ? 52
1.1.1 Limites de la phrase 53
1.1.2 Observation et analyse de textes 56
1.2 Constitution de corpus et collecte de marqueurs 57
1.2.1 Choix des textes 57
1.2.2 Collecte des marqueurs linguistiques 58
1.3 Apports d’une démarche textuelle 60
2 NOTION DE CAUSALITE 62
2.1 Causalité, causativité, causation… 62
2.2 Causalité vue comme une relation 63
3 METHODE D’EXPLORATION CONTEXTUELLE 66
3.1 Principe de la méthode 66
3.2 Systèmes d’exploration contextuelle développés par l’équipe LaLIC 68
3.2.1 Système SECAT 68
3.2.2 Système SEEK 70
3.2.3 Système SERAPHIN 72
3.2.4 Système SAFIR 74
3.2.5 Système COATIS 75
43.3 Caractéristiques essentielles des systèmes d’exploration contextuelle 76
PARTIE II : ANALYSE LINGUISTIQUE DE LA CAUSALITE 77
CHAPITRE 3 : CARTE COGNITIVE DE LA CAUSALITE 80
1 ÉTUDE DES MOYENS D’EXPRESSION DE LA CAUSALITE 80
1.1 Observation des fréquences 80
1.2 Cas des connecteurs 83
1.2.1 Parce que et la causalité : diversité des cas de figure 84
1.2.2 Parce que dans les séquences textuelles 87
1.2.3 Conclusion 91
1.3 Cas des locutions conjonctives 91
1.3.1 Application au discours étayant 92
1.3.2 Les locutions conjonctives et les modalités 94
1.3.3 Particularités des marqueurs de consécution 95
1.3.4 Conclusion 96
1.4 Le lexique 96
1.4.1 Première typologie des verbes 97
1.4.2 Causalité et relations agentives 100
1.4.3 Conclusion 109
1.5 Synthèse 110
2 CARTE COGNITIVE 112
2.1 Notions distinctives 113
2.1.1 Les modalités 114
2.1.2 Découpage en situations 116
2.1.3 Action efficiente versus relation statique 117
2.2 Zones d’intersection 118
2.2.1 La causalité et l’agentivité 119
2.2.2 La causalité et l’argumentation 120
2.3 Conclusion 121
CHAPITRE 4 : NOUVELLE PERSPECTIVE D’ETUDE 123
1 MARQUES DE LA SUBJECT IVITE DANS L’EXPLICATION CAUSALE 123
1.1 Relativité explicative 123
1.2 « Fausses » explications causales 124
1.3 Construction des explications causales 126
2 DEUX DIMENSIONS DES RELATIONS CAUSALES 127
CHAPITRE 5 : PRISE EN CHARGE 131
1 PRISE EN CHARGE EN LINGUISTIQUE 131
1.1 Les modalités en logique et en linguistique 132
1.2 Modalités de dicto, modalités de re 134
1.3 Polysémie des marqueurs 135
1.4 Notion de prise en charge 137
2 PRISE EN CHARGE ET LA CAUSALITE TEXTUELLE 139
2.1 Constat empirique 139
2.2 Rôle des modalités de prise en charge 140
2.2.1 Marques du caractère incertain ou indéterminé des connaissances causales exprimées 141
2.2.2 Moyen pour rendre fiables et intelligibles les connaissances causales exprimées 141
3 DIFFERENTES MANIERES DE « PRENDRE EN CHARGE » UNE RELATION CAUSALE 142
3.1 L’énonciation avec les modalités 142
3.1.1 Modalités du possible et du nécessaire 144
3.1.2 Modalités épistémiques 147
53.1.3 Modalités de quantification temporelle 148
3.1.4 Modalités d'habitude et de généricité 151
3.1.5 Modalités d'appréciation 152
3.1.6 Modalités déontiques 153
3.1.7 Discussion 153
3.2 Point de vue et contexte 154
3.3 Modalités de prise en charge relatives à l'approche scientifique de la causalité 155
3.3.1 Observation 156
3.3.2 Hypothèse 156
3.3.3 Recours à l'expérimentation et à la théorisation 157
3.3.4 Indices de conclusion et de récapitulation 157
3.3.5 Discussion 158
4 CONCLUSION 158
CHAPITRE 6 : ORGANISATION SEMANTIQUE DE LA NOTION DE CAUSALITE 159
1 QUATRE APPROCHES DE LA CAUSALITE 159
1.1 Différentes manières d’exprimer une dépendance causale 160
1.2 De l’indéterminé vers l’intelligible 161
1.3 Quatre approches de la causalité 165
2 APPROCHE QUALITATIVE 168
2.1 Principales caractéristiques 169
2.1.1 Propriétés générales 169
2.1.2 Quelques propriétés sémantiques particulières 170
2.1.3 Saisir l’action efficiente ou établir une relation causale 174
2.2 Marqueurs 178
2.2.1 Marqueurs de l’action causale efficiente 178
2.2.2 Marqueurs de la relation causale 188
2.3 Conclusion 196
3 APPROCHE FONCTIONNELLE 198
3.1 Caractéristiques 199
3.1.1 Propriétés générales 199
3.1.2 Complémentarité avec l’approche qualitative de la causalité 199
3.2 Marqueurs et indices caractéristiques 201
3.3 Conclusion 203
4 APPROCHE ANALYTIQUE 204
4.1 Caractéristiques 205
4.2 Contribution causale 206
4.2.1 Propriétés particulières 206
4.2.2 Marqueurs et indices caractéristiques 207
4.3 Influence 209
4.3.1 Propriétés particulières 209
4.3.2 Marqueurs et indices caractéristiques 210
4.4 Conclusion 212
5 APPROCHE SYNTHETIQUE 214
5.1 Caractéristiques 215
5.2 Marqueurs et indices caractéristiques 216
5.3 Conclusion 219
6 COMPLEMENTARITE DES QUATRE APPROCHES 220
7 REMARQUES FINALES 221
6PARTIE III : VERS LA MISE EN ŒUVRE INFORMATIQUE 224
CHAPITRE 7 : DU MODELE SEMANTIQUE AU MODELE OPERATOIRE 227
1 PORTEE DE LA PRISE EN CHARGE 227
1.1 Séquences textuelles causales 229
1.1.1 Séquence argumentative 230
1.1.2 Reformulation directe 230
1.1.3 Explication causale rapportée (citation) 231
1.1.4 Mécanisme causal 232
1.1.5 Explication par un modèle 232
1.1.6 Réponse à une question causale 233
1.1.7 Énumération d’effets 233
1.1.8 Séquence portant un titre causal 234
1.1.9 Séquence résumante (espace de discours) 235
1.1.10 Point de vue (univers de discours) 235
1.1.11 Champ thématique 236
1.2 Liens de cohérence et de cohésion en tant qu’indices contextuels complémentaires 237
2 PLURALITE DE SENS DES INDICES DE LA CAUSALITE 238
2.1 Indices déclencheurs retenus 238
2.2 Polysémie, généralité du sens, sur-détermination du sens 240
3 DEUX PROCEDURES EXPLORATOIRES 241
CHAPITRE 8 : MODELE DES CONNAISSANCES DANS SAFIR 244
1 SYSTEME SAFIR 244
1.1 Présentation générale 244
1.2 Étapes du filtrage 245
1.3 Architecture et fonctionnement du système 246
1.4 Exemple d’extrait causal 248
2 METHODE D’EXPLORATION CONTEXTUELLE 249
2.1 Éléments essentiels d’un système d’exploration contextuelle 249
2.2 Règle d’exploration contextuelle 250
3 TRAITEMENT DE LA CAUSALITE PAR LE SYSTEME SAFIR 251
3.1 Base des connaissances linguistiques 251
3.2 Étapes du traitement de la causalité 252
3.2.1 Reconnaissance des marqueurs composés 253
3.2.2 Identification des indices déclencheurs 254
3.2.3 Identification des indices complémentaires éliminatoires 256
3.2.4 Identification des indices complémentaires pertinents 257
3.2.5 Prise de décision 260
3.2.6 Profils de filtrage 264
3.3 Organisation des connaissances causales 265
3.3.1 Modélisation des listes 265
3.3.2 Modélisation des règles 266
4 CONCLUSION 270
CONCLUSION GENERALE 272
ANNEXES 290
ANNEXE 1 : PRESENTATION DE L’OUVRAGE DE E. KORDI : VERBES MODAUX ET CAUSATIFS
EN FRANÇAIS CONTEMPORAIN (88) 291
71 NOTION DE CAUSATION ET SES MOYENS D’EXPRESSION EN FRANÇAIS 291
2 CHAMP D’INVESTIGATION CHOISI PAR KORDI 291
3 DESCRIPTION SEMANTIQUE DES CONSTRUCTIONS AVEC LES VERBES CAUSATIFS AUXILIAIRES 292
3.1 Signification de la construction factitive faire + Vinf 292
3.1.1 Influence d’un humain sur un autre humain 292
3.1.2 Influence d’un humain sur des événements ou des choses 293
3.1.3 Influence des événements sur un humain 293
3.1.4 Influence des événements sur d’autres événements 293
3.2 Signification de la construction permissive laisser +Vinf 293
3.2.1 Rapports entre humains 294
3.2.2 Rapport d’un humain aux objets ou aux événements 294
3.2.3 Action des choses ou des événements sur l’homme 295
3.2.4 Relation de cause à effet entre événements 295
3.3 Différences entre les constructions factitives et les constructions permissives 295
4 DESCRIPTION SEMANTIQUE DES PROPOSITIONS AVEC LES VERBES CAUSATIFS A SENS PLEIN 296
4.1 Description des propositions causatives selon les types de situations exprimées 296
4.2 Champ lexico-grammatical de la causation 297
5 ANALYSE DES VERBES CAUSATIFS A SENS PLEIN EN ELEMENTS SEMANTIQUES PLUS SIMPLES 300
6 LIENS SEMANTIQUES ENTRE VERBES MODAUX ET VERBES CAUSATIFS 301
7 DISCUSSION 302
ANNEXE 2 : CORPUS DE TEXTES 303
ANNEXE 3 : EXEMPLE D’UN TEXTE « CAUSAL » 304
8






Introduction générale

9Dans notre expérience quotidienne, nous ne cessons de chercher des causes, de peser des
conséquences, de lier entre eux des événements et d’estimer leurs influences réciproques. Il semble que
rien d’absolument isolé ne puisse être l’objet de connaissance humaine et de communication. Notre
propension à expliquer témoigne sans doute du refus du chaos, du hasard et de la fatalité comme
composants de notre quotidien. Le sens commun se nourrit de la causalité et il serait totalement
désorienté dans un monde fait de surprises. Nous sommes parfois prêts à déterminer les causes à la
1hâte , tant est grande la tentation de ne pas laisser les choses en un état de non-signification totale. En
effet, cet irrésistible besoin de mettre de l’ordre dans les choses, et d’y rechercher un sens en y décodant
ou en y établissant des relations, conduit à transformer un ensemble disparate de sensations en un tissu
organisé, signifiant et rassurant. Mais, le plus souvent, si nous cherchons des causes, ce n’est pas pour
elles-mêmes, mais pour revenir aux effets de manière utile et opératoire. Car nous ne pouvons agir sans
avoir une vision claire des fins et des moyens. Les connaissances causales nous permettent ainsi d’avoir
une attitude active par rapport à l'environnement dans lequel nous vivons : intervenir pour modifier le
cours des événements selon nos attentes, agir pour prévenir ce qui s'annonce dangereux, s’investir pour
amplifier ce qui promet des avantages… La causalité constitue donc un exemple intéressant
d’interactions complexes entre les activités du sujet d’une part, et les données de l’expérience dans le
mécanisme de connaissance, de l’autre.
Les textes constituent des lieux privilégiés d’expression des connaissances. Ils contiennent
notamment un grand nombre d’expressions relatives à des relations causales. Certains textes font
directement appel dans leurs déploiements discursifs à des causes : ce sont les textes scientifiques.
Beaucoup d’études, en particulier épistémologiques, ont été consacrées à déterminer des relations entre
un phénomène et ce qui en est la cause. On pourrait penser que ces textes scientifiques sont le lieu
privilégié des expressions de la causalité. Mais, il suffit de feuilleter la presse courante pour s’apercevoir
que les questions « causales » y sont également très présentes. Elles peuvent concerner tout objet, fait ou
domaine pour lequel l’homme manifeste un intérêt. Citons quelques titres d’articles de journaux, suivis
de courts extraits de leur contenu.
Ø Villes américaines : pourquoi ce mieux ? ( Le Monde, mercredi 26 novembre 1997, p.18)
< La baisse de la délinquance dans les grandes villes américaines n’est-elle pas sujette à manipulations
statistiques et politiques ? Peut-on hiérarchiser les explications à la lumière d’indicateurs objectifs et de
données fiables ? Au cours des cinq dernières années, la criminalité a baissé dans des proportions
variables suivant les villes, mais en général de façon significative. Beaucoup tentent de s’attribuer la
paternité de ce résultat.
Certains mettent en avant la santé « insolente » de l’économie comme cause première de la baisse de la
délinquance. Mais la « job machine » ne produit pas des effets uniformes, et la discrimination raciale
résiste aux embellies économiques. D’autres avancent la décroissance du nombre d’adolescents, ou encore
l’accalmie dans la guerre des gangs, la réorganisation du marché de la drogue et la diminution de la
consommation de crack. Mais c’est surtout le renforcement de la répression qui est invoqué. (…)>.

1 « Il faut des esprits très forts pour pouvoir résister à la tentation des explications superficielles » A. Einstein.
10

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.