Universite de Nice SV1 annee Departement de Mathematiques Mathematiques pour la Biologie semestre

Publié par

Niveau: Supérieur
Universite de Nice SV1, annee 2008-2009 Departement de Mathematiques Mathematiques pour la Biologie (semestre 1) Cours 8 : Series statistiques a une et deux dimentions Cette lec¸on introduit les outils statistiques de base qui seront utilises dans les deux prochaines lec¸ons consacrees a la regression lineaire. Ces outils servent a etudier des series statistiques, en les localisant (par leur moyenne), en quantifiant leur dispersion (par leur variance ou leur ecart-type) et, lorsqu'il y en a plusieurs, en comparant leurs variations (par leur covariance et leur correlation). 1 Series statistiques a une dimension Une serie statistique est simplement une suite de mesures comme par exemple la suite, mesuree en centimetres des tailles de 20 plants que l'on etudie (presentees par ordre croissant) : 9, 3 9, 7 10, 1 10, 2 10, 4 10, 6 10, 7 10, 7 10, 9 11 11, 1 11, 1 11, 3 11, 3 11, 6 11, 7 11, 9 12, 3 12, 4 13, 4. Par la suite on designera par xi une telle suite, l'indice i prenant les valeurs entieres de 1 a n (ici n = 20, x1 = 9, 3, x2 = 9, 7, ...). Pour comprendre une telle serie la premiere idee est de la representer a travers un histogramme.

  • covariance

  • nuage

  • nuage de point

  • departement de mathematiques mathematiques pour la biologie

  • moyenne des produits des ecarts

  • variance de donnees exprimees en cm

  • etendue de la serie


Publié le : mardi 29 mai 2012
Lecture(s) : 25
Tags :
Source : math.unice.fr
Nombre de pages : 4
Voir plus Voir moins
Universit´edeNice D´epartementdeMath´ematiques
SV1,ann´ee2009-2010 Math´ematiquespourlaBiologie(semestre1)
Cours8:Se´riesstatistiquesa`uneetdeuxdimensions
Cettele¸conintroduitlesoutilsstatistiquesdebasequiserontutilis´esdanslesdeuxprochainesle¸cons consacre´esa`lar´egressionline´aire.Cesoutilsservent`a´etudierdesse´riesstatistiques,enleslocalisant (parleurmoyenne),enquantiantleurdispersion(parleurvarianceouleure´cart-type)et,lorsquilyen aplusieurs,encomparantleursvariations(parleurcovarianceetleurcorr´elation).
1S´eriesstatistiquesa`unedimension Uneers´isatstieeuqittseemelpmislaleitsumee,r´suneeentunesuitedemesuercsmoemaperexpm centime`tresdestaillesde20plantsquelone´tudie(pre´sente´esparordrecroissant): 9,3 9,7 10,1 10,2 10,4 10,6 10,710,7 10,9 11 11,1 11,1 11,3 11,3 11,6 11,7 11,9 12,3 12,4 13,4. Parlasuiteonde´signeraparxiune telle suite, l’indiceinesre`itdsera`1erepntnasvleeualn(icin= 20, x1= 9,3,x2= 9,`atrnter´eserepredaleetsdie´e`ermireapelri´eeslletenuerdnerpmocr,7..).P.uorevanus histogramme.Anotercependantquilnyapasunefa¸conuniquedelefaire.Parexemple,pourlepremier histogrammeci-dessous,onaregroupe´lesmesurescomprisesentre9et10(ici2mesures),puiscelles comprises entre 10 et 11 (ici, 8 mesures), et ainsi de suite. Dans le second histogramme, qui correspond auxmˆemedonn´ees,lesintervallesdeclassesnesontplusduncentime`tremaisdundemicentim`etre.
0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 8 9 1011 12 13 14
0.50 0.45 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 8 9 1011 12 13 14
Maisquelquesoitlafa¸condontonproce`depourtracerlhistogramme,onfaitensortequelasurface quiloccupe(sommedessurfacedesbarres)soit´egalea`1.Ainsi,pourunese´riede20termes,silalargeur declassesest1(commedanslepremierhistogramme),lahauteurdesbarresserae´gale`aleectifdela 1 classemultiplie´par=0,05 ;mais si la largeur des classes est 0,rgotemmala,)isrol5(deuxi`emehis 20 1 1 faudramultiplierpardeuxlunit´eenhauteurenpassantdea`. 20 10
Moyenne : Lhistogrammefournitunbonre´sume´graphiquedesdonn´ees,toujoursutilepourcommencerlanalyse dunes´erie,maisleplussouventilfaudralacompagnerdautresre´sume´s,quantitatifscettefois,dontles plusutilis´essontlamoyenne,lavarianceetl´ecart-type. D´enition:Lamoyenneeistselpmdonnmentar´eep n X 1 1 µ= (x1+x2+x3+. . .+xn) =xi. n n i=1
Lamoyennedelase´riedes20mesuresdenotreexempleest´egalea`11,8. C’est une grandeur que l’on appelle unionositedep`etrramapparce qu’elle indique autour de quelle valeur (ici 11,8) se situent les mesuresdelas´erie.
1
Maissilonsentenait`alamoyenneonnesauraitriensurl´etenduemeeeu:d´exsesrimˆdeed´saleire moyennepeuventˆetretr`esdi´erentes,luneregroupe´eautourdecettemoyenneetlautreaucontraire tr`esdisperc´ee.Onadoncbesoindunautreparame`trequi,lui,quantiecettee´tendue.
Varianceete´carttypedunese´rie Conside´ronsunexemple.Soitlase´rie 12,1 16,3 13,2 13,5 14,9 dontlamoyenneest14.Lapremie`reid´eeestdecalculerpourchaquetermedelas´erieleur´ea`alactr moyenne:41a`trace´rueilicredia--`stec 1,9 2,30,80,5 0,9 Ontrouvetrois´ecartsne´gatifscorrespondanta`desmesuresinf´erieures`alamoyenneetdeuxe´carts positifscorrespondanta`desmesuressupe´rieures`alamoyenne.Commemesuredel´etendue,onpeut avoirlid´eedefairelamoyennedeces´ecarts 1,9 + 2,30,80,5 + 0,9 0 = =0. 5 5 Maisonvoitquecettemoyennenestpasunebonnemesuredele´tendueetenfait,unpetitcalculpermet dev´erierquecettemoyenneseratoujoursnulle.Pourcontournercettediculte´,onpeutavoirlid´eede 1,9+2,3+0,8+0,5+0,9 fairelamoyennedese´carts,maisenlescomptanttouspositivementcettefois=1,28. 5 Onobtientunequantit´equelonappellelaneionmoyenatvi´edaiemset´duenquiestserudeleibnenume quinestpaslaquantit´elaplussouventutilise´epourcela.Cellequelonutiliseenge´ne´ral(carellesave`re plus maniable dans les calculs) est la variance, ici 2 2 2 2 2 (1,9) +(2,(03) +,8) +(0,5) +(0,9) 10,6 = =2,12. 5 5 De´nition:Lavariancee(riund´eesxienc,etslamayone´ecarts`rr´esdesdennacsealtseyom)eredia--` n 2 22 X (x1µ) +(x2µ) +. . .+ (xnµ) 1 2 Var (x= () =xiµ). n n i=1
2 Anoterquelavariancededonn´eesexprim´eesencmesnee´emirpxearcm. Si l’on veut mesurer le´tenduedelas´erieenutilisantlesmeˆmesunit´esquelase´rieelle-mˆeme,ilfautprendrelaracinecarr´e de la variance. De´nition:L’´ecart type(ednusee´irxi) (an anglais,standard deviationrsaec)ernailctaasedee´r variance,cest-`a-dire n 2uX 2 2 (x1µ) +(x2µ) +. . .+ (xnµ) 1 t 2 σ(x= () =xiµ). n n i=1 Tr`essouvent,leshistogrammesdes´eriesstatistiquesontlaformeduneclochesemblablea`lacloche 2 xµ 12 de Gauss, graphe de la fonctionf(x) =e. C’est le cas notamment lorsque le nombrende 2σ σ2π termesdelas´erieestgrand.Pourcettecourbedere´f´erence,dontlesommetestsitue´enx=µ, on peut montrerque65%delasurfacetotale(quivaut1)estsitue´audessusdelintervalle[µσ, µ+σ]. De la mˆemefac¸on,onpeutmontrerque95%estsitue´audessusdelintervalle[µ2σ, µ+ 2σ]. On peut donc retenirque,tre`sgrossie`rement,unhistogrammeenformedeclocheestcentre´sursamoyenneµet son 2 e´tendueestpresqueconfondueaveclintervalle[µ2σ, µ+ 2σlnietvrlaeleauxaudessusdeste]´uti 3 [µσ, µ+σ].
Propri´ete´sdelamoyenneetdelavariance: Silonmodieunese´rie(xi) en (axi+b)p,er,shangeencemplarexuose´tinuseltnaesumeesedinigorlalorsilestfaciledeve´rierquelamoyenne,lavarianceetle´cart-typedelanouvelles´eriesexprimeen fonctiondecellesdelase´rieoriginaleparlesformulessuivantes:
2
Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.

Diffusez cette publication

Vous aimerez aussi