M2 Ecologie Evolution Biometrie UE Description Statistique des Structures Biologiques

M2 Ecologie Evolution Biometrie UE Description Statistique des Structures Biologiques

Documents
30 pages
Lire
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

Niveau: Supérieur, Master, Bac+5

  • cours - matière potentielle : cssb8


M2 Ecologie,Evolution,Biometrie UE Description Statistique des Structures Biologiques Co-inertie, co-structures et compromis D. Chessel & A.-B. Dufour Notes de cours cssb8 Table des matieres 1 Introduction 2 2 Elements de base 3 2.1 Inertie et Variance vectorielle . . . . . . . . . . . . . . . . . . . . 3 2.2 Variance et covariance vectorielles . . . . . . . . . . . . . . . . . 4 2.3 Correlation vectorielle . . . . . . . . . . . . . . . . . . . . . . . . 5 3 L'analyse de co-inertie 5 3.1 Peches et nectarines . . . . . . . . . . . . . . . . . . . . . . . . . 5 3.2 La classe coi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3.3 Aides a l'interpretation . . . . . . . . . . . . . . . . . . . . . . . . 10 4 Compromis : calcul et analyse par STATIS 12 4.1 Inter-structure . . . . . . . . . . . . . .

  • fruit

  • analyse de donnees sans triplet statistique

  • peches

  • variable

  • description statistique des structures biologiques

  • carre de distance

  • analyse de co-inertie


Sujets

Informations

Publié par
Nombre de visites sur la page 43
Langue Français
Signaler un problème
´ ´ M2Ecologie,Evolution,Biome´trie UE Description Statistique des Structures Biologiques
Co-inertie, co-structures et compromis D. Chessel & A.-B. Dufour Notes de cours cssb8
Tabledesmatie`res 1 Introduction 2 2Ele´mentsdebase3 2.1 Inertie et Variance vectorielle . . . . . . . . . . . . . . . . . . . . 3 2.2 Variance et covariance vectorielles . . . . . . . . . . . . . . . . . 4 2.3Corr´elationvectorielle........................5 3 L’analyse de co-inertie 5 3.1Peˆchesetnectarines.........................5 3.2 La classe coi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3.3Aidesa`linterpre´tation........................10 4 Compromis : calcul et analyse parSTATIS12 4.1 Inter-structure . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 4.2 Compromis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 5 Compromis d’analyse d’inertie 20 5.1 Microsatellites et races bovines . . . . . . . . . . . . . . . . . . . 20 5.2 Sch´ma de principe . . . . . . . . . . . . . . . . . . . . . . . . . . 24 e Re´fe´rences29
1
D. Chessel & A.-B. Dufour 1 Introduction Nousavonsabord´elaquestiondesKableauxp-tyles´sleraelasansdreesme´eaint cubes.Lademandelaplusabondanteprovientdestableauxmultiplesassoci´es par les lignes ou les colonnes. Un cube donne plusieurs objets de ce type. Nous abordonsicilesprobl`emesdeco-structures`adeuxouplusieurstableaux.On supposequechaquetableaudonne,a`luiseul,unetypologiedelignesetde colonnes : on veut discuter de relations entre tableaux au niveau des relations entrestructures.Demeˆmequenanalysemultivari´ee,onexamineavecsoinle comportement des variables, de meme en analyse multi-tableaux on examine ˆ avecsoinlecomportementdechacunedesanalysesse´par´ees.Lafonctionsepan lefaitsimplement.Lensemblededonne´esmicrosatttdes:snrce´adti http://pbil.univ-lyon1.fr/R/pps/pps055.pdf Untableauimportant,propos´eparD.Lalo¨e,regroupelesfr´equencesalle´liques pour18racesbovines(taurinesouze´bu),doriginefranc¸aiseouafricaine,type´es sur 9 microsatellites. library(ade4) data(microsatt) fac <- factor(rep(microsatt$loci.names, microsatt$loci.eff)) w <- dudi.coa(data.frame(t(microsatt$tab)), scann = FALSE) wit <- within(w, fac, scann = FALSE) microsatt.ktab <- ktab.within(wit) plot(sepan(microsatt.ktab))
La figure indique clairement le champ dans lequel on se trouve. Un marqueur microsatellitefaitunetypologiedes18races,avecplusoumoinsdintensite´ (inertie)etdesimplicite´.Commentmesure-t-onetcommentcompare-t-ondes analysesdetableaux?Cestlobjetdececours,quonessaieralemoinsmathe´-matise´possible.
LogicielRversion2.12.0(2010-10-15)SweaveInputPage2/30Compile´le2010-12-09 Maintenance : S. Penel, URL :fdp/R/rf.1htt:pniv-lyon//pbil.u/vaewSdf.putnpeI
D. Chessel & A.-B. Dufour
2El´ementsdebase Oncommencepardeuxtableaux,situationd´eja`rencontr´eedanslordination directeettr`esr´epandue.Ilconvientmaintenantdebiendistinguerdeuxchoses. 2.1 Inertie et Variance vectorielle Linertieestunconceptsimplequig´en´eraliselanotiondevariance.Soitun tableauXavecnlignes etpcolonnes. La ligne de rangideXnoee´tXiest un point deRpcurardeorudtidsrnce`aloerliagdiinseptaameomspdeas.L ´ lepoidsdupointestlinertie.Cecinadesensquesilespoidssontde´niset sionsaitcalculeruncarre´dedistance.Ilnyapasdanalysededonne´essans triplet statistique (X,Q,Ds,elleitnoseonneitessseliarl`eccads`.)ruoPpmis onsentiendraa`uneponde´rationuniformedesindividusetuneponde´ration unitaire des variables, soitQ=IpetD=n1In. C’est le cas de l’ACP. Mesurer lavariabilit´esefaitpar: iner(X) = 1Xn p r n d2(Xi) =XvXj=Xλk i=1j=1k=1 Linertiemesurelagrosseurdunuage,passaforme.Lintensite´dunestructure int`egrelinertiequienfaitpartiemaisyajouteautrechosequiexprimelesliens entrelese´le´ments.Noteraussi,danslaformulequipr´ece`delavuedansRp(les carre´sdesdistancesa`lorigine),dansRnvariances des variables) et dans les(les deux (les valeurs propres de l’analyse). Deux table nt oir l ˆ aux peuve av a meme inertiesansavoirlameˆmeforme: set.seed(20092006) library(MASS) fun1 <- function(x) { res <- paste("Iner = ", round(sum(diag(t(x) %*% x))/100, dig = 2)) s.label(x, clab = 0, xlim = c(-3, 3), ylim = c(-3, 3), sub = res, csub = 2) } x1 <- mvrnorm(100, c(0, 0), matrix(c(1, 0, 0, 1), 2)) x2 <- mvrnorm(100, c(0, 0), matrix(c(1, 0.9, 0.9, 1), 2)) par(mfrow = c(1, 2)) par(mar = rep(0, 4)) fun1(x1) fun1(x2)
Deuxnuagesmontrentdesvariabilit´oisines.Celuidedroiteposs`edeenplus es v de la covariance. On ne peut cependant pas ajouter directement une covariance `aunevariance,carlasommedunecovariancepositiveetdunecovariancene´-gativenefaitpasunestructurenulle.Onpeutajouterdescarre´sdecovariance
LogicielRversion2.12.0(2010-10-15)SweaveInputPage3/30Compil´ele2010-12-09 Maintenance : S. Penel, URL :htt:p//fdp/R/rf1.onlyv-ni.uilpb/IevaewS.pdfnput
D. Chessel & A.-B. Dufour
quiserontajout´esa`descarre´sdevariancepourmesurerlastructure: p vav(X) =XpXcov2(Xj,Xk) =trace( 1nXTXn1XTX) =trace(VV) j=1k=1 Delautrecˆot´e(dansRpidtsdsserre´seacs`aancenilitre,)veerrlniaiefntti lorigine(aulieudelavariance).Questcequig´en´eraliseuncarre´dedistance pourdeuxpoints?Leproduitscalairee´videmmentetonalamˆemequantite´ sour la forme : W1 vav(X) =n12XnXnXi|Xm2=trace(n1XXT1nXXT) =trace(n1nW) i=1m=1 Dans un cas, la matriceVest la matrice des covariances. Dans l’autre,West lamatricedesproduitsscalaires.Lapremi`ereestp×p, la seconde estn×n, les deuxsontcarre´esetsym´etriques,lesdeuxsontappel´eesope´rateursdEscouer. Quandonnepeutpluscomparerdeuxtableauxsurlesmˆemesvariables,on pourra comparer lesV; quand on ne pourra plus comparer deux tableaux sur lesmˆemesindividusonpourracomparerlesW. Dans tous les cas : r vav(X) =Xλ2k k=1 Lavariancevectorielleduntableauestdonclasommedescarre´sdecovariance e´tenduea`touslescouplesdedeuxvariables.Cettevariancevectoriellesede´com-poseensommedecarre´sdevaleurspropres.Onpourraittracerlegraphedes carre´sdevaleursproprespourde´ciderdunombredaxes.Ilpeutˆetrebeaucoup plusclairqueceluidesvaleurspropres.Noteraussiqueremplacerlesdonne´es parlescoordonn´ees,cestconserverlavariancevectorielleennelexprimantque commeunesommedecarre´sdevariance(touteslescovariancessontnulles), c’est concentrer l’organisation dans de la variance. 2.2 Variance et covariance vectorielles Onpourraitsedemandera`quoic¸asert.Toutsimplement`apasserdelanalyse duntableaua`celledeplusieurs.Commentcaracte´riserlaco-inertie,cest-a`-dire la covariance vectorielle ? Introduisons un second tableauYavecnlignes etq colonnes. Ses variables sont toujours dansRnmais ses lignes sont dans un autre espaceRqectoncevle`arielnerd´rteraailevanciaarovelbatxuedcal(xuaeP.uo duntableauaveclui-mˆemedoitˆetrelavariancevectorielle)ilsutde: cov(X,Y) =pX Xqcov2(Xj,Yk) =trace(n1XTYn1YTX) =trace(CXYCYX) j=1k=1 On se retrouve dans une situation bien connue : celle de l’analyse d’un nouveau tableau, la matrice des covariances entre les deux paquets de variables. L’analyse de co-inertie va concentrer la co-structure en quelques couples de coordonnees ´ comme l’analyse d’inertie concentre la structure dans la variance de quelques coordonne´es.Lacovariancevectoriellesecomprendaussidanslage´ome´triedes deux nuages denpoints par l’extension : vav(X) =n12nX XnXi|XmYi|Ym=trace( 1nXXTn1YYT) =trace(n1WX1nWY) i=1m=1
LogicielRversion2.12.0(2010-10-15)SweaveInputPage4/30Compil´ele2010-12-09 Maintenance : S. Penel, URL :fdp/R/rfni.uilpb1.onlyv-:p//htt/IteuvpanfedwSp.