ALGORITHMES DE CLASSIFICATION

ALGORITHMES DE CLASSIFICATION

-

Documents
81 pages
Lire
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

ALGO RITHM ES DE CLAS SIFICA TION
Maurice ROUX
Professeur émérite
Université Paul C ézanne
Marseille, France.
Av ertissement
Cet ouvrage a été publ ié aux éd itions M asson, Par is, en 1985. Il est mainten ant épuisé et nous
mettons e n a ccè s libre la pr ésente version él ectronique, c orrigée e t am éliorée.
La premiè re version de cet ouvrage comportait, à la fin de chaque chapitre des programmes en
lan ga ge Basi c-Appl eso ft qui sont maintenan t obsol ètes. Ces progra mmes ont été convertis en
« Visu al Basi c fo r Appli cations » utilisabl es avec le tabl eur EXCEL (Mi crosoft) . Ils sont
réunis dans le class eur « AnaDon. xls » as soci é à un mode d’emploi inclus dan s le fi chi er
« AnaD on.do c » lisibl e avec le trait ement de textes WO RD (M icrosoft ). A la fin de chaque
chapitre d e l’ouvr age figurent le s noms de s p rocé du res de ce class eur tra itées dans l e c hapitre.
Ma rseille, Juin 2006. ALG ORIT HM ES D E CLASSIF ICATIO N
Table des matières
CHAP ITRE 1. - Introduction à la classifi cation
1. But de la classifi cation2. Probl èmes et m éthodes de la classifi cation a utoma tique
3. Objectif s e t pl an d e l'ouvrag e4. Domaines d 'appli cation e t points d e vo cabul ai re
CHAP ITRE 2. - Exemples de donné es
1. Psycholog ie e t so ci été (Ps ysoc)2. Phytosociolo gie (Ph ytos)
CHAP ITRE 3. - Préparation d es donn ées. Calc ul de s di stan ces
1. Généra lités
1.1. Donn ées qua ntitativ es ; exemple des caus es de décès ...

Sujets

Informations

Publié par
Nombre de visites sur la page 168
Langue Français
Signaler un problème
ALGO RITHM ES DE CLAS SIFICA TION Maurice ROUX Professeur émérite Université Paul C ézanne Marseille, France. Av ertissement Cet ouvrage a été publ ié aux éd itions M asson, Par is, en 1985. Il est mainten ant épuisé et nous mettons e n a ccè s libre la pr ésente version él ectronique, c orrigée e t am éliorée. La premiè re version de cet ouvrage comportait, à la fin de chaque chapitre des programmes en lan ga ge Basi c-Appl eso ft qui sont maintenan t obsol ètes. Ces progra mmes ont été convertis en « Visu al Basi c fo r Appli cations » utilisabl es avec le tabl eur EXCEL (Mi crosoft) . Ils sont réunis dans le class eur « AnaDon. xls » as soci é à un mode d’emploi inclus dan s le fi chi er « AnaD on.do c » lisibl e avec le trait ement de textes WO RD (M icrosoft ). A la fin de chaque chapitre d e l’ouvr age figurent le s noms de s p rocé du res de ce class eur tra itées dans l e c hapitre. Ma rseille, Juin 2006. ALG ORIT HM ES D E CLASSIF ICATIO N Table des matières CHAP ITRE 1. - Introduction à la classifi cation 1. But de la classifi cation2. Probl èmes et m éthodes de la classifi cation a utoma tique 3. Objectif s e t pl an d e l'ouvrag e4. Domaines d 'appli cation e t points d e vo cabul ai re CHAP ITRE 2. - Exemples de donné es 1. Psycholog ie e t so ci été (Ps ysoc)2. Phytosociolo gie (Ph ytos) CHAP ITRE 3. - Préparation d es donn ées. Calc ul de s di stan ces 1. Généra lités 1.1. Donn ées qua ntitativ es ; exemple des caus es de décès (Psysoc) 1.2. Pré -tr aitement par l' analyse factorielle 1.3. V ar iabl es qu alit ativ es et m ixtes 2. Appli cation aux exemples 2.1. Caus es de d éc ès (Ps ysoc)2.2. Ph ytosociolo gie (Ph ytos) 3. Les p rocé du res de cal cul d e dist anc es CHAP ITRE 4. - La classifi cation a sc end ant e hiérarchique 1. Généra lités 1.1. Prin cipe généra l des constructions as cend ant es 1.2. Propr iétés des fo rmules élémentaires de recal cul 1.3. Co mpar aison d es agrégations pa r le saut m inimum et par l e diamè tre 2. Appli cation aux exemples 2.1. Caus es de d éc ès (Ps ysoc) 2.2. Ph ytosociolo gie (Ph ytos) 3. Les p rocé du res de constructions a sc endant es de hiéra rchi es CHAP ITRE 5. - Agrég ation aut our de c entres m obi les 1. Prin cipes et pr obl èmes 1.1. L'al gorithme des centres mobiles 1.2. Moment d'ordr e d eux d'une partition 1.3. Av ant ages et in convé nients d e la méthode 2. Appli cation à l'exemple Psysoc 2.1. Pa rtition e n t rois cl asses 2.2. Pa rtition e n qua tre class es 3. Les p rogra mmes de calcul d e c entres mobil es CHAP ITRE 6. - Hiérar chie du mo ment d'ord re d eux 1. Prin cipe e t probl èmes2. L'al gorithme des voisins r éci proques 3. Appli cation à l'exemple Psysoc4. Proc édu re de cal cul CHAP ITRE 7. - Classifi cation d escendant e hiérar chiqu e 1. I ntroduction2. Mé thodes bas ées su r une var iabl e particuli ère 2.1. Utilis ation d e l'une d es va riables des donn ées 2.2. Utilis ation d es variabl es pr incipa les, ou axes f actoriels 3. Mé thodes bas ées su r des indiv idus p ar ticuli ers 3.1. Sélection d 'un poin t pé riph érique3.2. Sélection d e d eux point s périph érique s3.3. Sélection d e d eux point s-noyaux 4. Le probl ème des inv ersions5. Appli cation aux exemples 5.1. Donn ées PSYSOC5.2. Donn ées PHY TOS 6. Conclusion7. Proc édu re de cal cul CHAP ITRE 8. - Aides a l'interprétation 1. Var iabl es qu antit ativ es 1.1. Interprétation d 'une par tition 1.2. Interprétation d 'une hiérarchie 2. Var iabl e qu alit at ives 2.1. I nterprétation d 'une par tition 2.2. I nterprétation d 'une hiérarchie 3. Appli cation aux exemples 3.1. Donn ées Ps ysoc (quantit ativ es)3.2. Donn ées Phytos (qualitativ es) 4. Les p rocé du res d'aide à l'interprétation CHAP ITRE 9. - Pratiqu e d e la clas sifi cat ion 1. Choix d'un a lgorithm e 1.1. Dimensions des donn ées 1.2. N ature d es donné es 1.3. Qu alité des ré sulta ts 1.4. Temps de c alcul 2. Stratégies 2.1. Hiérar chi e puis ce ntres mobiles2.2. Centres mobil es suivi s d'une hiérar chie2.3. Donn ées hé térogènes, emploi d e l'an al yse factorielle préal abl e 3. I nterprétation d es résultats 4. Un pr ogr amme supplément ai re ut ile : tronc atu re d'une pa rtition CHAP ITRE 10. - Conclusion 1. Taxino mie de qu alit é 1.1. Pré para tion d es donn ées 1.2. Tra itement 1.3. Interprétation d es résultats 2. Classifi cation e n t ant que pré-tr aite ment 2.1. Prépara tion d es donn ées2.2. T ra itement2.3. I nterprétation ANNEXE 1. - Les ind ices de ditan ces 1. Généra lités2. Cas des donn ées bin ai res 2.1. I ndic es où l a p rése nce d es at tributs jou e un r ôle pr épondé ra nt2.2. I ndic es où l es p résences et absences d'att ribu ts jou ent des rôles éq uival ents 3. Cas des donn ees qua ntitativ es 3.1. Coeffici ents de corrélation3.2. Mesures de dist an ces 4. Conclusion ANNEXE 2. - Hiéra rchi es et ul tramétriqu es 1. Généra lités 1.1. Hi érar chi e e t o rdonna nc e 1.2. Hi érar chi e indicée e t ult ram étrique 2. Une ult ram étrique pa rticuli ère la sous -dominante 2.1. Relation d' ordr e su r les m étriques2.2. Ultra métrique “ sous -dominante ” d'une mé trique donn ée BIBLIOGR APH IE IN DEX Ch apitre 1 In troduction à la classification 1. But de la classification Comme les au tres méthodes de l'An al yse des donn ées, don t elle fait partie, la Classifi cation a pour but d'obt eni r une représenta tion schématiqu e simple d'un ta bleau rect angulai re de donn ées dont les col onnes , suiva nt l'usag e, sont de s descr ipteurs de l'ensemble de s obse rvati ons, pl acées e n l ignes. L'ob jectif le plus simple d'un e classif ication est de répa rtir l'éc hantillon en groupes d'obse rvations homogè nes, ch aque groupe étan t bien différencié des aut res. Le plus souvent, cepend ant, cet obj ectif est plus ra ffin é ; on veut, en général, obt enir des sect ions à l'intérieur des gr oupes princip aux, puis des subdi visions plus petites de ces sections, et ainsi de suite. En bref, on désire avoir une hi érar chie, c'est à dire une suite de pa rtitions "emboît ées", de plus en plus fi nes, sur l'ensemble d'obse rvations initi al. Une telle hi érar chi e peut ava ntageus ement être résumée par un arb re hi érarchiqu e (figure 1) dont les nœuds (m, n, p, q) symbo lisent les div erses subdivi sions de l'échantillon ; les éléments de ces subdi visions étant les obj ets (a, b, c, d, e) , placés à l'extrémité inf érieure des branches qui leur sont reliées. Figure 1 . E xemple d'arbr e h iérarchique por tant sur c inq obj ets a, b, c , d, e. Les points m , n, p, q sont les nœuds d e l’a rbre. Le trait ho rizontal mi xte indiqu e un ni veau d e tron cature d éfinissant une partition e n trois c lasses. Le niveau des nœud s, qui est le plus souvent chif fré, est sensé indiqu er un degr é de ressem blance ent re les obj ets correspond ants. A insi, sur not re fi gure 1, les obj ets a et d se ressemblent plus que les obj ets c et e. Rema rquons, en pass ant, que si on coupe cet ar bre à un niveau inte rmédia ire entre n et p, on obti ent une partition en trois cl asses de l'ensemble étudi é, savoi r les parties {a, d}, {b}, {c, e}. En fa isant va rier ce nive au de tronc atu re on obti ent les div erses pa rtitions con stitua nt la hiérarchi e. On voit qu'il ne faut pa s confond re cl assifi cation et class ement. Dans un cla sse ment on affecte les obj ets à des groupes préétablis ; c'est le but de l'an al yse discriminante que de fixer des règl es pour déterminer la classe de s obj ets. La cla ssifi cation e st don c, en qu elqu e sorte, l e tra va il p réliminaire au cl as seme nt, savoi r l a recherche des classes "naturelles" dans le domaine étudi é. 2.- Probl èmes et m éthodes de la cl assification automatique Dans cet ouvrag e il sera beauc oup question d'al gorithmes . Rapp elons qu'un algorithme est la descr iption minutieus e de toutes les opérati ons à effect uer pour ob tenir la solution concr ète d'un prob lème . Ainsi on peut parler de l'al gorithm e permett ant de trouver la racin e carrée d'un nombre, ou bien pour ob tenir le plus gr an d com mun diviseu r de deux nombre s entiers, etc ...Il ne faut pas conf ondr e algorithme et prog ramme info rmatique : il peut y avoi r plusieurs faç ons de programmer un mê me algorithme. L'un des plus gr an ds class ifi cat eurs a, sa ns aucun dout e, été le savant suédois Linné qui, au 18-ème siècle, a établi une classif ication du monde viva nt en général et du règne végétal en particulier, cl as sificat ion enco re en vigu eur au jourd'hui chez les spécia listes des sci ences naturelle s. La prem ière moitié du 20 -ème siècl e a vu un certa in nombre de tentatives pour rati onali ser le pr oc essus me ntal utilisé par Linné. M ais ce n'est qu'à partir des années 1960, av ec la diffusion de l'informatiqu e en milieu univ ersitai re, que sont appar us un grand nombre d'algo rithm es automa tisant complèt ement la construct ion des cl as sificat ions (Willia ms an d Lambe rt, 1959, Sokal and Snea th, 1963 ). Cependa nt, aujourd 'hui enco re le support math éma tique de ces méthodes reste embr yonna ire et ne permet p as d'élire un a lg orithme aux av antages i ndisc utabl es. Supposons que l'on veui lle, pa r exemple, construire une hiéra rchi e. L'une des ma nières de "bien pose r" le probl ème pourrait être de choisir un critère évaluant la fidélité de la représentation hi érar chi que au tabl eau initial des donn ées, et de trouver ensuite un algo rithme construisa nt la hi érar chie la me illeure, au sens de ce critère. M alh eureusement on ne sait pas fai re cela sauf pour des éc hantillons très peti ts, ou pour des cr itères sans intérêt. La solution qui consiste à examiner l'ensemble de toutes les hi éra rchi es possibl es, pour en retenir la me illeure, se heurte au "mur" de la complexit é combinatoir e. Le nombre de hi érarc hies croît en effet si vite avec le nombr e d'obj ets que, même avec de puissants ordin at eurs, il n'est pas réaliste de vouloir les envisag er toutes. C' est pourquoi l'on a reco urs à des heuristiques, c'est à dire des alg orithm es dont on consid ère qu'ils sont suf fisamment raisonnabl es vous donne r des r ésultats s atisf aisa nts. Gr ossièrement on peut disting uer trois grands types parmi ces heuristiques. Il y a d'abor d les al gorithmes construisant une hi érar chi e par ag régations suc cessives d'obj ets, puis de groupes, en fon ction des dist anc es entre obj ets ou groupe s. On les appell e "Const ructions ascendant es de hi érar chies" , en abrégé CA H. A l'inverse les "Constructions descendantes de hi érarchi es", en abrégé CDH, procèd ent par dicho tomies successives. Dans celles-ci l'ensemble tout entier est d'abo rd sc indé en deux, puis chacune de ses parties est, à son tour subdivis ée, et ainsi de suite. Dans le troisième groupe de méthod es on peut ra ssembler toutes celles qui se limitent à l'élabo ration d'une par tition. Par des algorithm es très div ers, ces méthodes ont pour obj ecti f de détecter les zones à fo rte de nsité dans l'espa ce d es obse rvations. Eta nt donné la faibl esse des bas es th éoriques de tous ces alg orithm es usuels , il serait impruden t de se fier total em ent aux résultat s ainsi ob tenus. C'est pourquoi nous recommandons vive ment à l'utilisa teur de toujours co nfr onte r ses résultats à ceux d'une ana lyse factor iell e (Benzéc ri et coll. 1973 b, Bertier et Bou roche 1975, De Lagarde 1983, Fénelon 1981, Foucar t 1982, Bouroch e et Sapo rta 1980 ). 3.- Obje ctifs et plan de l'ouvrage Dans les pages qui suivent on se propose de donn er les bas es mathém ati que s, les al gorithm es et les programmes de calcul pour les princip al es méthod es de classif ication. Co mme notre inten tion est de fou rnir aux pratic iens les moyens de compre ndr e et d'utiliser ces méthodes nous avon s basé l'exposé sur de ux e xemples typiques (décrits au c hapitre 2 ) qu i sont tr aités pa r tous l es al gorithm es possi bles. Chaque chapit re compor te l'exposé d'un algorithme et son appl ication à l'un ou l'autre des exemples. On explique ensuite la mise en œuvre du program me correspondan t et ses princip ales caractéristiques en vue d'une adaptation évent uell e. Par souci de clarté les développements th éorique s importants sont r envoyés e n an nexe. Comme la plupar t des méthodes com me ncent par le cal cul de distanc es, on étudi era d'abo rd les moda lités de ce calcul (chapitre 3). On pourra alors décr ire les algo rithmes usuels de construction as cend ant e de hi érarchi e (chapitre 4), puis un algo rithm e, devenu classique, de construc tion d'un e par tition (chapitre 5). On envis ag e ensuite des méthodes moins courantes : la construc tion as cend ant e selon la varian ce des dis tanc es (chapit re 6) et une co nstruct ion desc enda nte hiérar chiqu e (chapitre 7). On termine par des calculs complémentai res facil itant l'interprétation des rêsultats (chapitre 8) et par un chapit re (n uméro 9) indi quant que lque s règ les élémentai res à suivre pour le tra itement ce s donné es. En con clusion ( chapitre 10) nous résume rons les caractéristique s de chacune des techni que s déc rites en i ndiqu ant nos p références. 4.- Do maines d'application et points de voc abulaire La classi fication a un rôle à jouer dans toutes les sc iences et techni ques qui fon t appel à la stati stique multidime nsionnelle. Citons tout d'abo rd les sci ences biologi ques : bo tanique , zoolog ie, éc ologie, ... Ces sci ences utilisent éga lement le terme de "taxinomie " pour désigner l'ar t de la cl as sificat ion. De même les sc ienc es de la terre et des eaux : géologie, pédolo gie, géog raphie, étud e des po llutions, font g ra nd us ag e de class ifi cations. La cl assifi cation est fort utile égal ement dans les sc ien ces de l'homme : psychologie, socio log ie, linguistique , ar chéologie, histoi re, etc ... et dans les techn iques dérivées comme les enquêtes d'opinion, le mark eting, etc ... Ces dernières emploient parfoi s les mots de "typologie" et "segmen ta tion" pour dé signer la classifi cation, ou l'une de ses innombrabl es va riantes. Citons encore la m édecin e, l'économie, l'a gronomie, e t nous e n oubli ons certain ement ! Dans toutes ces discipli nes la classifi cation peut être emplo yée comme une fin en soi ; mais elle l'es t souvent, à juste titre, comme une méthode compléme ntaire à d'autres méthodes stati stiques . Ell e peut, en effet, aider effic aceme nt à l'interprétation des gra phique s d'analyse facto riell e, ou bien déterminer de s g roupe s d'obj ets homog ènes , préala bleme nt à un e régression lin éai re multiple. Ch apitre 2 Exemples de données Ava nt d'a bo rd er les méthodes cl as sif ic ato ires nous présentons deux exemples qui nous serviront tout a u lon g de ce livre. 1.- Psy chologie et société (PSYSOC) Not re premier exemple est tiré du livre de E. Todd : "Le fou et le prolétaire" (1979, annexe 2, p 283 ). Il s'agit de stat istique s concernant, pour différents pa ys occident aux, les causes de dé cès, qui selon M r Todd, sont caractéristiques de l'état de sa nté mentale de la société (v oir ta bleau 1, six prem ières colonnes). N otre obj ectif sera d'établir une cl assifi cation des pays en fonc tion de ces taux de mor tali té, ca lculés pour 100.000 h abit ants. Afin de juger du bien fondé des classifi cations nous donnons ici les résultats de l'Ana lyse facto rielle des co rrespond anc es de ce tabl eau (Tabl eau 1, colonnes F1, F2 et F3). Les var iab les étant quantitat ives on aurait pu appl ique r également l'An al yse en composa ntes principa les. Tout efois l'étude des "p rofils" des pays réa lisée pa r la premiè re nous par aît mieux adaptée au sujet trai té, c'est à dire les taux de mortali té comme indi cateu rs de mal adies soci ales (voir chapitre 3 pour un complé ment de justifi cation) . Au deme urant, les "p oids " des lign es étant rela tivem ent compa rabl es, les résultats des deux types d'a nal yse factoriell e sont assez vo isins. SUICI HOMIC AROUT AINDU AAUTR CIRFO | F1 F2 F3 AUSTRIA 241 16 330 43 363 325 | -220 -6 108 FRANCE 156 9 225 10 535 328 | -210 -3 -110 PORTUGAL 85 19 349 7 281 345 | -369 -257 -65 WGERMANY 210 12 230 21 298 269 | -245 17 149 BELGIUM 156 10 260 13 367 144 | -7 95 -37 FINLAND 251 26 180 29 387 55 | 258 270 178 SWEDEN 194 11 151 13 384 122 | 54 214 58 SWITZERL 225 9 195 26 276 128 | -15 212 211 ITALY 54 11 219 19 224 319 | -484 -287 -90 NIRELAND 40 136 215 18 320 43 | 727 -691 48 DENMARK 241 6 168 11 230 107 | -21 289 334 ICELAND 101 5 179 23 380 9 | 328 283 -241 SCOTLAND 82 15 155 18 342 59 | 215 109 -203 SPAIN 40 4 136 17 237 225 | -392 -178 -183 NORWAY 104 6 138 22 346 41 | 234 250 -176 SIRELAND 38 7 182 32 314 37 | 242 100 -379 NETHERLA 89 7 169 10 218 47 | 133 142 -68 ENGLANDW 79 10 130 14 203 36 | 200 141 -65 USA 121 102 220 26 273 158 | 253 -447 195 Tableau 1.- Donn ées PSYSO C avec les résultats de l’Anal yse factorielle des Corr espondances. Les six premières colonnes contiennent les taux de mortalité de différentes causes violentes de décés dans 19 pays occidentaux, en nombre de décès pour 100 000 habitants. Les trois dernières colonnes (F1, F2 et F3) sont les coordonnées factorielles (m ultipliées par 1000) des pays sur les trois pr emiers a xes d e l ’Analyse fac torielle d es C orrespondances. +---------+---------+---------+---------+---------+--------+ 1| | | 2| | SUICIDES | 3| | | 4| | AAUTR | 5| | AINDUS | 6|-------------------+--------------------------------------| 7| |AROUTE | 8| | | 9|CIRFOIE | | 10| | | 11| | | 12| | | 13| | | 14| | | 15| | | 16| | | 17| | | 18| | | 19| | | 20| | HOMIC +----------------------------------------------------------+ Figure 1.- Données PSYSO C, Anal yse des correspondances, représentation des variables sur les axes 1 et 2. Ces d eux ax es e xpliquent re spectivement 44,33 % e t 34,41 % d e la v ariance total e. +---------+---------+---------+---------+---------+--------+ 1| | HOMIC 2| | SUICIDES | 3| | | 4| | | 5|CIRFOIE | | 6|-------------------+AROUTE--------------------------------| 7| | AINDUS | 8| | AAUTR | +----------------------------------------------------------+ Figure 1 bis.- Donn ées PSYSO C, Analyse des correspondances, représentation des variables sur les ax es 1 e t 3. Ces d eux a xes e xpliquent respectivement 44,33 % et 14,96 % de la v ariance totale . Sur le graphiqu e des va ria bles (fi gure 1) l'axe 1 oppo se les homicides aux décès par cirrhose du foi e, les diffé rents types d'a ccidents étant en position intermédiaire. On peut don c interpréter cet axe com me celui de l'a gressivité de la soci été. Le second axe est d'interprétation plus diffi cile. Outre qu'il temoign e d'un léger effet Guttman (disposition en forme de croissant, cf Benzécri 1980, V olle , 1978 ), il isole princip al em ent les homicides , ceux- ci étant massivement le fait de deux pays seuleme nt l'Irlan de du No rd et les USA (figure 2) . Enf in le 3-ème axe (figure 1 bis) établ it une distin ction entre la mort donné e volontair ement (suicides et hom icides du coté posi tif de l'axe ) et les déc ès a ccidentels. +---------+---------+---------+---------+---------+---------+---------+---+ 1| | ICELAND | 2| DENMARK FINLAND | 3| | NORWAY | 4| SWITZE SWEDEN | 5| | NETHERL ENGLAND | 6| BELGIUM SCOTLAND | 7| WGERMANY | SIRELAND | 8|---------------AUSTRIA------+--------------------------------------------| 9| FRANCE | | 10| | | 11| SPAIN | | 12| | | 13|ITALY PORTUGAL | | 14| | | 15| | | 16| | | 17| | USA | 18| | | 19| | | 20| | | 21| | NIREL +-------------------------------------------------------------------------+ Figure 2.- Donn ées PSYSO C, Anal yse des correspondances, représentation des pays sur les axes 1 et 2. C es de ux ax es ex pliquent r espectivement 44,33 % et 34,41 % de la v ariance to tale. +---------+---------+---------+---------+---------+---------+---------+---+ 1| DENMARK | 2| | | 3| | | 4| SWITZER USA FINLAND | 5| WGERMANY | | 6| AUSTRIA | | 7| | SWEDEN NIREL 8|----------------------------+--------------------------------------------| 9| PORTUGAL BELGIUM NETHERLANDS | 10|ITALY FRANCE | | 11| | NORWAY | 12| SPAIN | SCOTLAND | 13| | ICELAND | 14| | | 15| | SIRELAND | +-------------------------------------------------------------------------+ Figure 2 b is.- Donn ées PSYSOC, Anal yse d es c orrespondances, r eprésentation d es pa ys sur l es axes 1 et 3. Ces d eux ax es e xpliquent re spectivement 44,33 % e t 14,96 % d e la v ariance total e. L'exame n du plan 1-2 pour les pays (figure 2) conf irme la th èse de Mr Todd sur la similitude entre l'All em agne et la France du point de vue des tens ions internes de la soci été, alors que l'A ngleterre se trouve être plus proche des pays nordiqu es. On remar que ég alem ent le regr oupement des pays méditer ra néens (ESP, PORT, ITA L) dans l a zone dominée p ar la cirrhos e du foie ... 2.- Phyto sociologie (PHY TOS) L'étude des affinit és de terrain entre espèc es végé tales porte le nom de ph ytosociol og ie. Elle a pour point de dépar t des enquêtes sur des régions plus ou moins étendu es au cours desquell es on effectue des "r elevés". Un relevé con siste en la liste des espèces végétal es poussant dans un lieu par ticuli er. Le résultat d'un e enquête de terrain se met sous la fo rme d'un tabl eau rect angulai re où l'usage est de me ttre les relevés e n colonn es et les espèces e n l ignes.