LA NEBULEUSE DES SENTIMENTS

De
Publié par

LA NEBULEUSE DES SENTIMENTS

Publié le : jeudi 21 juillet 2011
Lecture(s) : 105
Nombre de pages : 33
Voir plus Voir moins
Henri BEHARetMichel BERNARD Université de Paris III 
LA NEBULEUSE DES SENTIMENTS 
On se ro ose ici d'étudier les sentiments dans le roman de lan ue française entre 1830 et 1970. À l'annonce d'un tel ro et, le lecteur serait en droit de considérer la résente étude comme une a eure, une naïveté ou un canular, selon l'estime dans la uelle il tient les auteurs des a es ui suivent. Il nous a artient donc de réciser d'emblée ce ui nous ermet d'afficher ici des rétentions aussi exorbitantes. Nous sommes bien conscients ue le cor us envisa é est i antes ue1 rale. toute lecture inté eu rèset interdit à Par ailleurs, il est bien évident ue la notion desentimentest extrêmement va ue. Un cor us démesuré, des conce ts flous : ce sont ourtant les conditions de travail habituelles  et traditionnelles  des chercheurs littéraires. Mais ce n'est as our relancer la belle uto ie d'unescience du littéraireue nous utiliserons ici l'outil informati ue. L'ordinateur, comme n'im orte uel outil, ne eut ue erfectionner, mimer et s stématiser des com ortements et des savoir-faire préexistants. Nous nous servirons ici de la Ban ue de Données d'Histoire Littéraire2 BDHL . La BDHL re rou e des informations biblio ra hi ues, bio ra hi ues et histori ues sur uel ue deux mille uvres et cin cents auteurs de lan ue française, du Mo en-A e à nos ours. En articulier, et c'est ce ui nous intéressera dans le cadre de cette étude, les uvres sont indexées selon leur enre, leur date d'édition et leur thémati ue. Donnons tout de suite un exem le our fixer les idées : Notre-Dame de ParisHu o : 1831 Éditeur : C. Gosselin Genre : Prose Fiction Roman Thèmes : amour beauté bohémien cachette cler é é lise fatalité femme homicide mal monstre, mort, passion, péché, peine de mort, peuple. Quel ues récautions de base sont indis ensables our ne as é arer le lecteur dans les faux débats ue ourrait lui su érer cette brutale mise à lat de la chose littéraire. Il est bien enterdu ue chacune des mentions figurant ci-dessus est discutable, ou plutôt que les principes qui ont présidé à l'indexation peuvent, dans
54 L'ANALYSE THÉMATIQUE DES DONNÉES TEXTUELLES le détail et dans l'ensemble, faire l'ob et de remises en uestion. La seule ambition de la BDHL est de re roduire les usa es les lus courants de l'histoire littéraire telle u'elle est rati uée au ourd'hui. Dans cette ers ective, on ne ourra s'offus uer de voir le roman de Hu o réduit à une liste de 16 conce ts-clés. Si l'on eut dire ue Notre-Dame de Paris dévelo e le« arle de l'amour », ou « u'il thème très hu olien du monstre », il est lo i ue de enser ue l'on peut dresser un inventaire de ces thèmes. L'indexation thématique des uvres figurant dans laBDHLa été menée à l'aide d'un thésaurus, c'est-à-dire une liste d'environ 800 termes dans la uelle les indexeurs étaient tenus de uiser. Cette techni ue évite les roblèmes dus à la ol sémie il serait im ossible sans cela de ra rocher une uvre indexée avec r dbeosh éétmuideina P ed stnus l, so IIIaris eoc ertedninu'dua e xée avecgnittraônl)e.   sruesneanéciesxtén  ieae ll atdéL ertva3. paé ut Il est très facile de sélectionner avec la BDHL les romans ubliés entre 1830 et 1970. On ne se cachera as néanmoins le relatif arbitraire ue constitue l'affectation d'un enre et d'une date à une uvre. du siècle d'un en antLa Con essionest-elle un roman ? À uelle date doit-on indexer le roman inachevé de StendhalLucien Leuwen Le ?ublié en 1901 a été de retenir arti ris s stémati uement la date de laBiblio ra hie de la France,ce ui nous éloi ne souvent de la date d'écriture, elle-même assez h othéti ue. Mais nous affecterons ici de ne as nous interro er lus avant sur la validité de l'indexation, ce ui em êcherait toute étude statisti ue. Nous considérerons donc comme intan ible le cor us de 534 romans édités entre 1830 et 1970 ue fournit la BDHL4 et c'est sur eux ue nous ferons orter notre étude. En revanche, il est beaucou lus difficile de sélectionner, dans la liste des conce ts-clés du thésaurus thémati ue, ceux ui dési nent un sentiment. La seule méthode ue l'on uisse suivre ici, la seule ui soit conforme aux rinci es d'établissement de la BDHL, c'est l'observation des rati ues dans le domaine. On eut trouver uel ues listes de sentiments5 et nous allons considérer la com ilation de ces listes à la manière d'un sonda e d'o inion. Nous avons utilisé les neuf sources suivantes : 1. Articles du dictionnaire électroni ue ZYZOMYS6définissant la vedette à l'aide du mot sentiment. 2. Liste établie ar Fran ois Rastier à l'aide de contextes tirés de FRANTEXT du mot sentiment. 3. Le remier thésaurus utilisé ar la BDHL était résenté sous une forme anal ti ue et ro osait, sous forme hiérarchi ue, une liste de conce ts-clés ra ortés à l'h eron me sentiment. 4. Liste obtenue à l'aide du dictionnaire analo i ue informatisé DICOLOGI UE7. 5. Articles du dictionnnaire électroni ue LAROUSSE définissant la vedette à l'aide du mot sentiment. 6. Termes relevés dansLes Passions de l'âme olo ie articulier dans la tde Descartes, en de la deuxième partie (articles 52et sqq.). 
LA NÉBULEUSE DES SENTIMENTS 
55 
7. Termes pouvant figurer co mme complé ment d'objet du verbeéprouver(liste établie em iri uement ar les auteurs . 8. Senti ments cités co mme corrélats ou exe m les dans l'articlesentimentdu ROBERT électroni ue. 9. Sentiments cités comme tels ar Claude Duneton dans l'index de son ressions des exBou uet imagées(Seuil).
Nous n'avons bien sûr retenu ue les termes fi urant dans le thésaurus de la BDHL uis ue seuls ces conce ts-clés nous ermettront une interro ation de la ban ue. Nous donnons ci-a rès l'ensemble des ré onses obtenues, dans la mesure où leur consultation ermet de constater combien ce t e de re uête eut être complexe :
 
56 
L'ANALYSE THÉMATIQUE DES DONNÉES TEXTUELLES 
Devant une areille dis arité, nous avons décidé de ne considérer commesentiments réunissent au moinsue les conce ts-clés ui cin attestations la ma orité... , ce ui nous donne une liste de vin t termes : amitié, amour, amour- ro re,admiration, a ection, an oisse, colère, déses oir, ennui, haine, honte, horreur, in uiétude, alousie, oie, mé ris, or ueil, eur, itié, tristesse. Voilà donc dans uel cadre nous allons nous situer. D ne s'a it lus, on le voit, d'étudier directement les ouvra es visés mais la trace u'ils ont laissée dans la BDHL, ce ue l'informati ue rend considérablement lus sim le. Cette orientation laisse entier le roblème de la validité des indexations o érées, sur le uel nous reviendrons lus tard, mais elle ermet d'avoir une vision d'ensemble des faits littéraires. Dans un deuxième tem s, our valider cet a erçu et en ex loiter les su estions, nous nous reporterons à certains des textes mis en exergue par l'analyse statistique.  *** Sur les 534 romans ubliés entre 1830 et 1970 ue recense la BDHL, 352 ont été indexés avec, au moins, un des vin t conce ts-clés sur lesquels nous avons décidé de travailler. On peut donc dire, dans une remière a roche, ue 66 % des romans arlent des sentiments ue nous avons sélectionnés. On com arera cette ro ortion avec les 56%d'oeuvres de la même 1830-1970 ériode ui sont indexées avec les vin t conce ts-clés. Le roman est donc un genre plus « sentimental »8que les autres pour cette période. Pour les 352 romans « sentimentaux » ui nous intéressent, on com te 623 descri teurs, ris dans la liste des vin t « sentiments », ce ui si nifie u'en mo enne un roman est affecté de 1,77 descripteurs. En réalité, on constate la répartition suivante :
 
 
IANÉBULEUSE DES SENTIMENTS 
57 
Une remière constatation s'im ose, im ortante dès lors ue l'on veut faire des statisti ues : nous travaillons avec des valeurs faibles, ce qui exagère la moindre variation. Entre une uvre indexée avec un seul descri teur « sentimental » et une uvre ui n'en a aucun, la différence est très faible. Pour les besoins de l'en uête, nous ne rendrons en considération ue les textes venant en tête dans la classification hiérarchi ue décroissante. Voici la liste des 18 uvres indexées avec 4 descripteurs « sentimentaux » ou plus :  
Sous un autre angle, les descripteurs ne sont pas non plus utilisés de manière homo ène, chacun d'eux eut servir à indexer un nombre de romans très variable :  
58  
L'ANALYSE THÉMATIQUE DES DONNÉES TEXTUELLES 
Le thème de l'amour, ar exem le, est résent dans rès de six oeuvres « sentimentales » sur dix et, our l'ensemble des romans de la ériode, dans 37 % des indexations. À l'inverse, le thème dela. itié ue ourn'est utiliséLe Prométhée mal enchaînéde Gide. Il faut tenir com te de cette articularité si l'on veut a récier de manière lus fine l'indexation de nos romans. Le fait u'un roman soit indexé avecamourest beaucoup moins significatif que son indexation aveccolèreouitié, de toutes fa ons 57uis u'il a chances sur 100 u'il en soit ainsi, contre 2 ou 8 chances sur 1000. On eut donc affecter à cha ue descri teur une robabilité d'a arition et évaluer, de cette manière, la robabilité de co-occurrence de lusieurs descri teurs. Pour une uvre indexée avec amourethonte,ar exem le, la est de 0,571 x 0,0199, robabilité soit 0,01136, alors u'une uvre indexée avecamouretamitié, bien u'elle ait elle aussi deux descri teurs, corres ondrait à une robabilité de 0,1832, ce ui est 16 fois moins si nificatif. On ne eut donc se contenter, comme nous l'avons fait tout à l'heure, du nombre de descri teurs our classer les uvres. Voici les 20 co-occurrences les lus si nificatives, c'est-à-dire celles ui correspondent aux probabilités les plus faibles :  
 
LA NÉBULEUSE DES SENTIMENTS 
59 
On eut constater ue le classement obtenu lus haut est assez lar ement modifié ar l'a lication de ce nouveau mode de calcul. De manière s métri ue, il est ossible d'introduire un autre facteur de ondération en renant en com te le nombre de descri teurs utilisés our l'indexation de cha ue uvre. En effet, les uvres enre istrées ar la BDHL ne sont as toutes affectées du même nombre de conce ts-clés ar les indexeurs. Cette rofondeur d'indexation eut varier dans des ro ortions très im ortantes : de 2 à 35, ar exem le, our les 352 romans sur le uels nous travaillons. Dès lors, il est bien évident u'un roman indexé avec 35 descri teurs est bien lus susce tible u'un autre, indexé avec 2 ou 3 descri teurs, de contenir un rand nombre de conce ts-clés « sentimentaux ». Sans user de raffinements statisti ues articuliers, on eut dresser la liste des uvres our les uelles 25 % ou lus des thèmes sont des sentiments S : Nombre de « sentiments » ; T : Nombre total de descripteurs) :  
Les deux remières li nes du tableau montrent ue cette méthode a aussi les inconvénients de ses avanta es, uis u'elle rivilé ie abusivement les uvres peu indexées. Elle permet néanmoins de faire ressortir des uvres que nous n'avions
60 L'ANALYSE THÉMATIQUE DES DONNÉES TEXTUELLES as encore rencontrées, tout en confirmant le caractère « sentimental » de certains romans ui a araissent uelle ue soit la méthode de calcul ado tée. On eut é alement faire le bilan des co-occurrences de thèmes, en recensant les uvres indexées con ointement avec deux sentiments. En voici le tableau :
H ne faut as oublier en lisant ce tableau ue les co-occurrences de thèmes sont bien sûr liées à la fré uence de chacun des deux descripteurs. On peut lire toutefois, en valeurs absolues, les con onctions thémati ues les lus fré uentes our notre enre et notre é o ue :amitié/amour, amour/ alousieuis, nettement au-dessous,amitié/ alousie, oisse, amour/an oir amour/déseset amour/ennui10. Le calcul des spécificités peut maintenant nous permettre de com arer notre cor us avec l'ensemble de la ban ue du oint de vue thémati ue. Ra elons ra idement les rinci es de ce calcul. Soit un texte T divisé en lusieurs arties, Tl, T2, T3, etc. On dit u'une forme un mot F est s écifi ue dans la artie T2, ar exemple, si la probabilité pour qu'on l'y trouve avec la fréquence effectivement constatée est très faible, eu é ard à la fré uence de la forme dans l'ensemble de T et à la taille de T2 relativement à T. On distin ue ensuite des s écificités ositives, uand la forme est articulièrement fré uente, et des s écificités né atives uand elle est au contraire anormalement rare. L'avantage de ce mode de calcul est u'il tient com te automati uement de la différence de taille des corpus, dont nous avons
 
IA NÉBULEUSE DES SENTIMENTS 61 vu récédemment combien elle eut être ênante our l'anal se. Ce t e de traitement, habituellement réservé aux textes, eut être, sans inconvénient récautions particulières, appliqué à nos données11 . sIlfiuf dralee moc etxet nu emom ceréridnscos des ospén i seuls mots-clés, puis segmenté en parties. On eut ainsi, tout d'abord, com arer les romans de la ériode 1830-1970 indexés avec nos vin t « sentiments » avec l'ensemble des uvres de la ban ue indexées avec ces mêmes descri teurs. On obtient ainsi deux s écificités ositives :amitié4.6E-04 ethaine 4.7E-02 , et cin s écificités né atives :colère7E-04 ,in uiétude 9.5E-04 ,admiration2.5E-02 ,tristesse2.3E-02 ,oie2.3E-02 . Les données entre arenthèses sont les robabilités, ex rimées en notation scientifi ue : 4.6E-04 si nifie 4,6 10"4, soit 0,00046. En rati ue, il suffit de tenir com te de l'ex osant 04 our évaluer l'im ortance de la s écificité. Les valeurs obtenues si nifient donc ue les descri teursamitiéethainesont beaucou lus em lo és our les romans de notre ériode ue our toutes les autres uvres « sentimentales » de la littérature française. En revanche, les « sentiments » à s écificité né ative sont moins em lo és dans nos romans ue dans les autres uvres. Si l'on com are les mêmes 352 romans avec l'ensemble des romans de la ban ue indexés avec les vin t sentiments, on ne constate u'une seule s écificité né ative, d'ailleurs très faible :oie 1.3E-02 . Il faut dire ue les romans de la ériode 1830-1970 représentent 78 % des romans de la banque. Le résultat est néanmoins intéressant, uis u'il montre ue l'on eut étendre sans tro de ris ues toutes nos constatations à l'ensemble du enre romanes ue. Mais dans la mesure où notre cor us a été sélectionné selon deux critères l'é o ue et le enre , il convient de recou er les résultats dé à obtenus en calculant les s écificités des romans de la ériode 1830-1970 indexés avec les vin t « sentiments » ar ra ort à l'ensemble des uvres indexées de la même manière our la même ériode. On ourra ainsi savoir ce ui constitue la articularité « sentimentale » du enre romanes ue. On obtient deux s écificités ositives :amitié3.4E-03 etalousie3.1E-O3 , et trois s écificités né atives :in uiétude5.2E-04 ,colère3E-O3 ettristesse2.8E-02 . Réca itulons donc ce ue nous avons ac uis : armi toutes les uvres « sentimentales » de notre é o ue de référence, le roman est caractérisé ar les thèmes del'amitiéet de laalousie.Le thème de lahaine, haut, est doncue nous avions relevé lus davanta e lié à l'é o ue u'au enre romanes ue. En revanche, nous retrouvons les trois s écificités né atives les lus im ortantes rencontrées lus haut. A rès avoir effectué des calculs sur les seules uvres indexées avec nos vin t « sentiments », il convient de situer le roblème dans le cadre plus large de la
62 L'ANALYSE THÉMATIQUE DES DONNÉES TEXTUELLES 
thémati ue lobale de la BDHL. Nous ne travaillons lus cette fois sur vin t descri teurs mais sur rès de 800. La rocédure, au demeurant, reste la même, mais il n'est plus question de reproduire la totalité des listes de s écificités. Nous donnerons seulement les vin t s écificités les lus im ortantes our cha ue calcul. Voici d'abord les thèmes s écifi ues aux romans de la ériode 1830-1970 par rapport à l'ensemble de la banque :  
Le calcul des s écificités fait a araître d'une art l'orientation beaucou lus concrète de la narration romanes ue, d'autre art les roblèmes contem orains, sociaux en articulier. Mais, une fois de lus, ce tableau ne ermet as d'attribuer à cou sûr les s écificités à l'é o ue ou au enre. Il convient donc, comme nous l'avons fait tout à l'heure, de rechercher les s écificités de chacun de ces deux critères. Voici d'abord les s écificités thémati ues de la ériode 1830-1970 tous enres confondus ar ra ort à l'ensemble de la banque :  
 
LA NÉBULEUSE DES SENTIMENTS 
63 
Et les s écificités des romans toutes é o ues confondues ar ra ort à l'ensemble de la banque :  
On notera, râce à ces trois tableaux, un certain nombre de faits. Tout d'abord, les « sentiments » ue nous avons retenus ne constituent pas une des particularités thématiques de notre corpus, à l'exce tion  notable  d'amitié.Mais ce terme renvo er eut aussi bien à un ersonna e u'à une situation, à l'ex ression ou à la manifestation d'un sentiment. À l'inverse, on ne retrouve aucun de nos vin t sentiments dans les s écificités né atives. Par ailleurs, on constate dans les deux derniers tableaux une certaine analogie entre la thémati ue du roman et la thémati ue de la ériode 1830-1970. Ce hénomène est bien com réhensible uis ue le roman est eu à eu devenu le enre dominant au cours de cette ériode, en même tem s u'il as irait à traiter tous les su ets, à ado ter tous les tons, à rendre compte de tous
Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.