Statistique : Résumé de cours et méthodes 1 Vocabulaire : • Population : c’est l’ensemble étudié. • Individu : c’est un élément de la population. • Effectif total : c’est le nombre total d’individus. • Caractère : c’est la propriété étudiée. Ondistinguelescaractèresdiscretsquinepeuventprendrequ’unnombrefinidevaleurs(notesàundevoir...)etlescaractères continus dont on regroupe les valeurs par intervalles (taille, durée d’écoute...). 2 Séries statistiques associées à un caractère discret 2 1 Classement des données DÉFINITION Onappellesériestatistiqueladonnéesimultanée(dansuntableau)desvaleursducaractèreétudié(noté x ),rangéesdansl’ordrei croissant, et des effectifs (notés n ) de ces valeurs.i ni I Remarque : A la place des effectifs (n ), on peut aussi utiliser les fréquences f = (où N représente l’effectif total) ou lesi i N ni fréquences en pourcentages f = ×100.i N I Exemple : Les notes sur 20 obtenues lors d’un devoir de mathématiques dans une classe de seconde sont les suivantes : 10, 8, 11, 9, 12, 10, 8, 10, 7, 9, 10, 11, 12, 10, 8, 9, 10, 9, 10, 11. •Lapopulationétudiéeestlaclasseetlesindividussontlesélèves.L’effectiftotalestégalà20etlanoteobtenueaudevoirestle caractère discret que l’on étudie. • La série statistique définie par les effectifs est la suivante : Valeurs du caractère (notes) x 7 8 9 10 11 12i Effectifs (nb d’élèves ayant la note) n 1 3 4 7 3 2i • La série statistique définie par les fréquences en pourcentage est la suivante : Valeurs du caractère (notes) x ...
Statistique : RÉsumÉ de cours et mÉthodes 1Vocabulaire : •Population: c’est l’ensemble tudi. •Individu: c’est un lment de la population. •Effectif total: c’est le nombre total d’individus. •CaractÈre: c’est la proprit tudie. On distingue lescaractÈres discretsqui ne peuvent prendre qu’un nombre fini de valeurs (notes À un devoir...) et lescaractÈres continusdont on regroupe les valeurs par intervalles (taille, dure d’coute...).
2SÉries statistiques associÉes À un caractÈre discret 21Classement des donnÉes DÈFINITION On appellesÉrie statistiquela donne simultane (dans un tableau) des valeurs du caractre tudi (notxi), ranges dans l’ordre croissant, et des effectifs (notsni) de ces valeurs. ni IRemarque :A la place des effectifs (ni), on peut aussi utiliser les frquencesfi=(oÙNreprsente l’effectif total) ou les N ni frquences en pourcentagesfi=×100. N IExemple :Les notes sur 20 obtenues lors d’un devoir de mathmatiques dans une classe de seconde sont les suivantes : 10, 8, 11, 9, 12, 10, 8, 10, 7, 9, 10, 11, 12, 10, 8, 9, 10, 9, 10, 11. •La population tudie est la classe et les individus sont les lves. L’effectif total est gal À 20 et la note obtenue au devoir est le caractre discret que l’on tudie. •La srie statistique dfinie par les effectifs est la suivante : Valeurs du caractre (notes)xi7 8 9 10 11 12 Effectifs (nb d’lves ayant la note)ni1 3 47 3 2 •La srie statistique dfinie par les frquences en pourcentage est la suivante : Valeurs du caractre (notes)xi11 129 107 8 n i Frquences en %fi=×100 5% 20% 15% 15% 35%% 10 20
22Effectifs cumulÉs DÈFINITION L’effectif cumulÉ croissantd’une valeurxest la somme des effectifs des valeursytels quey6x. L’effectif cumulÉ dÉcroissantd’une valeurxest la somme des effectifs des valeursytels quey>x. IAvec l’exemple des notes, on a : Valeursxi10 11 127 8 9 ∗ Effectif cumul croissant1 48 1518 20 ∗∗ Effectif cumul dcroissant19 1612 52 0 * : nombre d’lves ayant eu une note68 ; ** : nombre d’lves ayant eu une note>8 23ReprÉsentation graphique Pour les caractres quantitatifs discrets, on utilise lediagramme en bAton: Dans un repre orthogonal, pour chaque valeur de la srie statistique on trace un trait vertical dont la hauteur est proportionnelle
1S Statistique
c P.Brachet www.xm1math.net
1
À l’effectif (dans l’unit choisie).
IAvec l’exemple des notes :
24ParamÈtres de position a)Moyenne DÈFINITION n1x1+n2x2+∙ ∙ ∙+nkxk On appellemoyenned’une srie statistique d’effectif totalN, le relx=. N (kreprsente le nombre de valeurs prises par le caractre) IAvec l’exemple des notes, on a : Valeurs du caractrexi7 8 9 10 11 12 Effectifsni7 3 21 3 4 1×7+3×8+4×9+7×10+3×11+2×12 x= =9,7 20 IRemarques : •En utilisant les frquences, on a :x=f1x1+f2x2+∙ ∙ ∙+fkxk. f1x1+f2x2+∙ ∙ ∙+fkxk •Avec les frquences en pourcentages, on a :x=. 100 PROPRIÈTÈ •Si on ajoute À toutes les valeurs d’une srie statistique le mme nombreb, on augmente la moyenne de cette srie parb. •Si les valeurs d’une srie statistique sont multiplies ou divises par un mme nombrea, la moyenne de cette srie est aussi multiplie ou divise para. PROPRIÈTÈ Si une population d’effectifNest compose d’une partie d’effectifN1et de moyennex1et d’une autre partie d’effectifN2et de moyennex2, alors la moyennexde la population totale est telle que : N1x1+N2x2 x= N IExemple :Si dans une classe, les 15 garÇons d’une classe mesurent en moyenne 182 cm et si les 20 filles mesurent en moyenne 15×182+20×168 168 cm, alors la taille moyenne d’un lve de cette classe est gale À=174 cm. 15+20
2
cP.Brachet www.xm1math.net
1S Statistique
b)MÉdiane DÈFINITION L’ide gnrale est que la mdiane est une valeur du caractre qui partage la population en deux parties de mme effectif. De faÇon plus prcise, on appellemÉdianed’une srie statistique discrte toute valeurMdu caractre telle qu’au moins 50% des individus aient une valeur du caractre infrieure ou gale ÀMet au moins 50% des individus aient une valeur du caractre suprieure ou gale ÀM.
Recherche pratique de la mÉdiane : On range les valeurs du caractre une par une dans l’ordre croissant (chaque valeur du caractre doit apparatre un nombre de fois gal À l’effectif correspondant). Si l’effectif total est impair, la mdianeMest la valeur du caractre situe au milieu. Si l’effectif total est pair, la mdianeMest la demisomme des 2 valeurs situes au milieu. IExemple 1 : On considre la srie statistique suivante : Valeurs du caractrexi7 8 9 10 11 14 16 Effectifsni1 2 1 22 1 1 •Liste des valeurs du caractre : 7 ;7 ;8 ;9 ;10 ;11 ;11 ;14 ;16 ;16 | {z } 10+11 •L’effectif total est pair : la mdianeMest la demisomme des 2 valeurs situes au milieu. D’oÙ,M= =10,5. 2 IExemple 2 : On considre la srie statistique suivante : Valeurs du caractrexi6 8 9 12 13 17 Effectifsni3 1 21 3 3 •Liste des valeurs du caractre : 6 ;6 ;6 ;8 ;9 ;9 ;12 ;13 ;13 ;13 ;17 ;17 ;17 |{z} •L’effectif total est impair : la mdianeMest la valeur situe au milieu. D’oÙ,M=12.
25ParamÈtres de dispersion Ces paramtres permettent de mesurer la faÇon dont les valeurs du caractre sont rparties autour de la moyenne et de la mdiane.
a)ParamÈtre de dispersion associÉ À la moyenne DÈFINITION •On appellevarianced’une srie statistique d’effectif totalNet de moyennex, le rel 2 22 n1(x1−x) +n2(x2−x) +∙ ∙ ∙+nk(xk−x) V=(moyenne des carrs des carts À la moyenne) N √ •l’Écarttypede la srie est dfini alors par :σ=V IAvec l’exemple des notes, on a x=9,7et : Valeurs du caractrexi7 8 9 10 11 12 Effectifsni1 3 47 3 2 2 2 22 2 2 1×(7−9,7) +3×(8−9,7) +4×(9−9,7) +7×(10−9,7) +3×(11−9,7) +2×(12−9,7) V= =1,71 20 √ σ=1,71≈1,31
1S Statistique
c P.Brachet www.xm1math.net
3
PROPRIÈTÈ •Si on ajoute À toutes les valeurs d’une srie statistique le mme nombreb, l’carttype reste inchang. •Si les valeurs d’une srie statistique sont multiplies ou divises par un mme nombrea, l’carttype est multipli ou divis par |a|.
b)ParamÈtre de dispersion associÉ À la mÉdiane DÈFINITION L’ide gnrale est de partager la population en quatre parties de mme effectif. Etant donn une srie statistique de mdianeMdont la liste des valeurs est range dans l’ordre croissant(il s’agit de la mme liste que celle qu’on utilise pour dÉterminer la mÉdiane). En coupant la liste en deux soussries de mme effectif(Attention : quand l’effectif total est impair, la mÉdiane ne doit pas tre incluse dans les soussÉries): •On appellepremier quartilele rel notQ1gal À la mdiane de la soussrie infrieure. •On appelletroisiÈme quartilele rel notQ3gal À la mdiane de la soussrie suprieure. •L’Écart interquartileest gal ÀQ3−Q1. •]Q1;Q3[est appelintervalle interquartile. DÈFINITION Lediagramme en botesd’une srie statistique se construit alors de la faÇon suivante : (les valeurs du caractÈre sont en abscisse min et max reprÉsentent les valeurs minimales et maximales du caractÈre)
IInterprÉtation : •25% de la population admet une valeur du caractre entreminetQ1 •25% de la population admet une valeur du caractre entreQ1etM •25% de la population admet une valeur du caractre entreMetQ3 •25% de la population admet une valeur du caractre entreQ3etmax IExemple 1 : On reprend la srie statistique suivante : Valeurs du caractrexi7 8 9 10 11 14 16 Effectifsni2 1 11 2 1 2 •Liste des valeurs du caractre : z}|{ z}|{ 7 ;7 ;8 ;9 ;10 ;11 ;11 ;14 ;16 ;16 | {z }| {z } sous−es´uiorsiefnueer´eris−useire´sp´erieure •L’effectif de chaque soussrie est impair :Q1=8 (valeur situe au milieu de la soussrie infrieure) etQ3=14 (valeur situe au milieu de la soussrie suprieure). •Le diagramme en botes de la srie est le suivant :
4
cP.Brachet www.xm1math.net
1S Statistique
IExemple 2 : On reprend la srie statistique suivante : Valeurs du caractrexi6 8 9 12 13 17 Effectifsni1 3 33 1 2 •Liste des valeurs du caractre : z}|{ z}| { 6 ;6 ;6 ;8 ; 9 ; 9 ; 12 ; 13 ; 13 ; 13 ; 17 ; 17 ; 17 | {z } |{z } sous−sousse´rie infe´rieure−se´rie supe´rieure •L’effectif de chaque soussrie est pair :Q1=7 (demisomme des deux valeurs situes au milieu de la soussrie infrieure) et Q3=15 (demisomme des deux valeurs situes au milieu de la soussrie suprieure). •Le diagramme en botes de la srie est le suivant :
3SÉries statistiques associÉes À un caractÈre continu
31Classement des donnÉes La seule diffrence par rapport aux caractres discrets, c’est que les valeurs du caractre sont regroupes dans des intervalles (appels classes du caractre). IExemple :Temps pass devant la tlvision par 34 lves pendant une certaine journe. temps en minutes[0,15[ [15,30[ [30,60[ [60,120[ [120,180[ nombre d’lves7 58 104
32ReprÉsentation graphique
Pour la reprsentation graphique d’un caractre continu, on utilise gnralement unhistogramme: dans un repre orthogonal on porte en abscisse les valeurs des bornes des intervalles (selon l’unit choisie), puis pour chaque intervalle on trace un rectangle dontl’aire est proportionnelle À l’effectif(selon l’unit choisie).
IRemarque :En pratique, il est conseill de commencer par construire un tableau donnant la largeur et l’aire de chaque rectangle (selon les units choisies). On peut alors facilement en dduire la hauteur de chaque rectangle ce qui facilite la construction graphique de l’histogramme. 2 IPour l’exemple proposÉ cidessus :(units : en abscisse 1cmreprsente 15 min et 1cmreprsente 1 lve) temps en minutes[0,15[ [15,30[ [30,60[ [60,120[ [120,180[ 2 aire du rectangle encm7 58 104 largeur du rectangle encm1 12 44 aire hauteur du rectangle encm=7 54 2,51 largeur
1S Statistique
cP.Brachet www.xm1math.net
5
33Calcul des paramÈtres de position et de dispersion Pour calculer les diffrents paramtres d’une srie statistique associ À un caractre continu, on prend comme valeur du caractre le milieu de chaque classe. IPour l’exemple, la sÉrie devient : valeur (milieu de chaque intervalle)xi7,5 22,5 45 90 150 effectifni48 107 5 On en dduit que : 7×7,5+5×22,5+8×45+10×90+4×150 x=≈60 34 2 22 2 2 √ 7×(7,5−60) +5×(22,5−60) +8×(45−60) +10×(90−60) +4×(150−60) V≈ ≈2045 etσ(x)≈2045≈45 34