La lecture en ligne est gratuite
Télécharger
Universit´edeNice D´epartementdeMath´ematiques
SV1,ann´ee2009-2010 Math´ematiquespourlaBiologie(semestre1)
Cours8:Se´riesstatistiquesa`uneetdeuxdimensions
Cettele¸conintroduitlesoutilsstatistiquesdebasequiserontutilis´esdanslesdeuxprochainesle¸cons consacre´esa`lar´egressionline´aire.Cesoutilsservent`a´etudierdesse´riesstatistiques,enleslocalisant (parleurmoyenne),enquantiantleurdispersion(parleurvarianceouleure´cart-type)et,lorsquilyen aplusieurs,encomparantleursvariations(parleurcovarianceetleurcorr´elation).
1S´eriesstatistiquesa`unedimension Uneers´isatstieeuqittseemelpmislaleitsumee,r´suneeentunesuitedemesuercsmoemaperexpm centime`tresdestaillesde20plantsquelone´tudie(pre´sente´esparordrecroissant): 9,3 9,7 10,1 10,2 10,4 10,6 10,710,7 10,9 11 11,1 11,1 11,3 11,3 11,6 11,7 11,9 12,3 12,4 13,4. Parlasuiteonde´signeraparxiune telle suite, l’indiceinesre`itdsera`1erepntnasvleeualn(icin= 20, x1= 9,3,x2= 9,`atrnter´eserepredaleetsdie´e`ermireapelri´eeslletenuerdnerpmocr,7..).P.uorevanus histogramme.Anotercependantquilnyapasunefa¸conuniquedelefaire.Parexemple,pourlepremier histogrammeci-dessous,onaregroupe´lesmesurescomprisesentre9et10(ici2mesures),puiscelles comprises entre 10 et 11 (ici, 8 mesures), et ainsi de suite. Dans le second histogramme, qui correspond auxmˆemedonn´ees,lesintervallesdeclassesnesontplusduncentime`tremaisdundemicentim`etre.
0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 8 9 1011 12 13 14
0.50 0.45 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 8 9 1011 12 13 14
Maisquelquesoitlafa¸condontonproce`depourtracerlhistogramme,onfaitensortequelasurface quiloccupe(sommedessurfacedesbarres)soit´egalea`1.Ainsi,pourunese´riede20termes,silalargeur declassesest1(commedanslepremierhistogramme),lahauteurdesbarresserae´gale`aleectifdela 1 classemultiplie´par=0,05 ;mais si la largeur des classes est 0,rgotemmala,)isrol5(deuxi`emehis 20 1 1 faudramultiplierpardeuxlunit´eenhauteurenpassantdea`. 20 10
Moyenne : Lhistogrammefournitunbonre´sume´graphiquedesdonn´ees,toujoursutilepourcommencerlanalyse dunes´erie,maisleplussouventilfaudralacompagnerdautresre´sume´s,quantitatifscettefois,dontles plusutilis´essontlamoyenne,lavarianceetl´ecart-type. D´enition:Lamoyenneeistselpmdonnmentar´eep n X 1 1 µ= (x1+x2+x3+. . .+xn) =xi. n n i=1
Lamoyennedelase´riedes20mesuresdenotreexempleest´egalea`11,8. C’est une grandeur que l’on appelle unionositedep`etrramapparce qu’elle indique autour de quelle valeur (ici 11,8) se situent les mesuresdelas´erie.
1
Maissilonsentenait`alamoyenneonnesauraitriensurl´etenduemeeeu:d´exsesrimˆdeed´saleire moyennepeuventˆetretr`esdi´erentes,luneregroupe´eautourdecettemoyenneetlautreaucontraire tr`esdisperc´ee.Onadoncbesoindunautreparame`trequi,lui,quantiecettee´tendue.
Varianceete´carttypedunese´rie Conside´ronsunexemple.Soitlase´rie 12,1 16,3 13,2 13,5 14,9 dontlamoyenneest14.Lapremie`reid´eeestdecalculerpourchaquetermedelas´erieleur´ea`alactr moyenne:41a`trace´rueilicredia--`stec 1,9 2,30,80,5 0,9 Ontrouvetrois´ecartsne´gatifscorrespondanta`desmesuresinf´erieures`alamoyenneetdeuxe´carts positifscorrespondanta`desmesuressupe´rieures`alamoyenne.Commemesuredel´etendue,onpeut avoirlid´eedefairelamoyennedeces´ecarts 1,9 + 2,30,80,5 + 0,9 0 = =0. 5 5 Maisonvoitquecettemoyennenestpasunebonnemesuredele´tendueetenfait,unpetitcalculpermet dev´erierquecettemoyenneseratoujoursnulle.Pourcontournercettediculte´,onpeutavoirlid´eede 1,9+2,3+0,8+0,5+0,9 fairelamoyennedese´carts,maisenlescomptanttouspositivementcettefois=1,28. 5 Onobtientunequantit´equelonappellelaneionmoyenatvi´edaiemset´duenquiestserudeleibnenume quinestpaslaquantit´elaplussouventutilise´epourcela.Cellequelonutiliseenge´ne´ral(carellesave`re plus maniable dans les calculs) est la variance, ici 2 2 2 2 2 (1,9) +(2,(03) +,8) +(0,5) +(0,9) 10,6 = =2,12. 5 5 De´nition:Lavariancee(riund´eesxienc,etslamayone´ecarts`rr´esdesdennacsealtseyom)eredia--` n 2 22 X (x1µ) +(x2µ) +. . .+ (xnµ) 1 2 Var (x= () =xiµ). n n i=1
2 Anoterquelavariancededonn´eesexprim´eesencmesnee´emirpxearcm. Si l’on veut mesurer le´tenduedelas´erieenutilisantlesmeˆmesunit´esquelase´rieelle-mˆeme,ilfautprendrelaracinecarr´e de la variance. De´nition:L’´ecart type(ednusee´irxi) (an anglais,standard deviationrsaec)ernailctaasedee´r variance,cest-`a-dire n 2uX 2 2 (x1µ) +(x2µ) +. . .+ (xnµ) 1 t 2 σ(x= () =xiµ). n n i=1 Tr`essouvent,leshistogrammesdes´eriesstatistiquesontlaformeduneclochesemblablea`lacloche 2 xµ 12 de Gauss, graphe de la fonctionf(x) =e. C’est le cas notamment lorsque le nombrende 2σ σ2π termesdelas´erieestgrand.Pourcettecourbedere´f´erence,dontlesommetestsitue´enx=µ, on peut montrerque65%delasurfacetotale(quivaut1)estsitue´audessusdelintervalle[µσ, µ+σ]. De la mˆemefac¸on,onpeutmontrerque95%estsitue´audessusdelintervalle[µ2σ, µ+ 2σ]. On peut donc retenirque,tre`sgrossie`rement,unhistogrammeenformedeclocheestcentre´sursamoyenneµet son 2 e´tendueestpresqueconfondueaveclintervalle[µ2σ, µ+ 2σlnietvrlaeleauxaudessusdeste]´uti 3 [µσ, µ+σ].
Propri´ete´sdelamoyenneetdelavariance: Silonmodieunese´rie(xi) en (axi+b)p,er,shangeencemplarexuose´tinuseltnaesumeesedinigorlalorsilestfaciledeve´rierquelamoyenne,lavarianceetle´cart-typedelanouvelles´eriesexprimeen fonctiondecellesdelase´rieoriginaleparlesformulessuivantes:
2