Statistique
18 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Statistique

-

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
18 pages
Français

Description

Statistique2
Prérequis : « Pour démarrer » (page 32)1
Exercice Prérequis testés Réponse En complément
Autre exercice du même type : quelle est laRetrouver les effectifs d’une série à partir
classe médiane ?de son histogramme.
1 c
Localiser la classe médiane à partir des 10
effectifs cumulés.
5
0
012345678910
Réponse : l’effectif est 46 ; la classe
médiane est [4 ; 5[.
Calculer la valeur approchée de la moyenne Même question sur l’exercice ci-dessus.
d’une série dont les valeurs sont regroupées Réponse : la valeur approchée (au centième)2 c
en classe. de la moyenne est 4,37.
Calculer la moyenne d’une série à partir Complément : quelle devrait être la moyenne
3 des moyennes de sous-séries. b des filles pour que la moyenne de la classe
soit égale à 15 ? Réponse : 17.
Utiliser les propriétés de linéarité de la • Exercice du même type : que se passerait-
moyenne. il si le professeur augmentait toutes les notes
4 c de 30 % ?
• Complément : que se passerait-il s’il ajou-
tait 2 à chaque note ?
Connaître la sensibilité des paramètres déjà Vérification à la calculatrice.
rencontrés (moyenne, médiane, étendue) Calculer la moyenne, la médiane et l’éten-5 a
aux valeurs extrêmes. due de chacune des deux séries.
• reconnaître l’intérêt et la pertinence de ces diffé-Objectifs2
rentes mesures ;
À la fin de ce chapitre, les élèves doivent savoir : • représenter une série statistique par un diagramme
• reconnaître les différents types de variables et la en boîte ;
nature des données d’une ...

Sujets

Informations

Publié par
Nombre de lectures 215
Langue Français

Exrait

Statistique
Prérequis : « Pour démarrer » (page 32)
Exercice Prérequis testés Réponse Retrouver les effectifs d’une série à partir 1 dLeocsaolnisheirstlogralamssmee.médianeàpartirdes c a c effectifs cumulés.
2 3 4
5
Calculer la valeur approchée de la moyenne d’une série dont les valeurs sont regroupées en classe. Calculer la moyenne d’une série à partir des moyennes de sous-séries. Utiliser les propriétés de linéarité de la moyenne.
Connaître la sensibilité des paramètres déjà rencontrés (moyenne, médiane, étendue) aux valeurs extrêmes.
2 Objectifs À la fin de ce chapitre, les élèves doivent savoir : • reconnaître les différents types de variables et la nature des données d’une série statistique ; • savoir ce qu’est une série chronologique ; • savoir trouver une tendance dans l’évolution d’une série chronologique par lissage (à la main ou avec un tableur) ; • caractériser une série statistique par des mesures de tendance centrale (moyenne, médiane), de dispersion (étendue, variance, écart-type, écart interquartile) et de position (quartiles, déciles) ;
24
c b c
a
En complément Autre exercice du même type : quelle est la classe médiane ? 10
5
0 0 1 2 3 4 5 6 7 8 9 10 Réponse : l’effectif est 46 ; la classe médiane est [4 ; 5[. Même question sur l’exercice ci-dessus. Réponse : la valeur approchée (au centième) de la moyenne est 4,37. Complément : quelle devrait être la moy enne des filles pour que la moyenne de la classe soit égale à 15 ? Réponse : 17. • Exercice du même type : que se passerait-il si le professeur augmentait toutes les notes de 30 % ? • Complément : que se passerait-il s’il ajou-tait 2 à chaque note ? Vérification à la calculatrice. Calculer la moyenne, la médiane et l’éten-due de chacune des deux séries.
• reconnaître l’intérêt et la pertinence de ces diffé-rentes mesures ; • représenter une série statistique par un diagramme en boîte ; • comparer deux séries à partir de leurs diagrammes en boîtes ; résumer une série statistique par un couple de valeurs (moyenne ; écart-type) ou (médiane ; écart interquartile) ; • exploiter un tableau à double entrée ; • trouver les fréquences marginales ou les fréquences conditionnelles à partir d’un tableau à double entrée ; • faire le lien entre arbre et tableau à double entrée.
3 Difficultés et erreurs 3.1 Confusion dans la nature des données et dans leur représentation • Des données en pourcentages peuvent provenir d’une variable qualitative. Cette variable détermine une partition de la population à partir de ses diffé-rentes modalités. Chaque pourcentage représente alors la part de la population pour chacune des moda-lités. La représentation des données peut être un graphique circulaire.  Exercice 17 (page 48) • Une série de pourcentages peut être également une série de valeurs prises par une variable quantitative. (On ne saurait faire, dans ce cas, de graphique circu-laire, car le total des pourcentages n’est pas égal à 100. Il n’a d’ailleurs aucun sens, quelle que soit sa valeur !) Exercice 39 (page 51) Ou encore une série chronologique. Exercice 18 (page 48) 3.2 Histogramme à pas non constant L’erreur la plus fréquente est de construire des rectangles avec des hauteurs proportionnelles aux effectifs (comme pour les histogrammes à pas constant) au lieu du rapport effectif / amplitude de l’intervalle c’est-à-dire à l’effectif par unité de la variable. Exercice 25 (page 49) 3.3 Calcul des quartiles Si la moyenne, l’écart-type et la variance sont donnés par des formules, la détermination des quartiles est moins immédiate. Elle nécessite un algorithme dont le point de départ est le classement des valeurs de la série. Exercice 33 (page 50) Les valeurs données par les calculatrices ou les tableurs ne sont pas toujours égales à celles obtenues avec la définition du cours (imposée par le pro-gramme officiel). Par exemple, les calculatrices Casio ou Texas déter-minent les quartiles en deux étapes : 1) Calcul de la médiane et partage de la série en deux sous-séries. 2) Q1 est la médiane de la première sous-série. Q3 est la médiane de la deuxième sous-série. Activité 1 (page 44)
3.4 Confusion entre la variance et l’écart-type La variance et l’écart-type sont obtenus à partir du p calcul : Σ n même N1 i = 1 i ( x i x ) 2 La seule différence est la présence de la racine carrée pour l’écart-type. Les élèves ont tendance à l’oublier quand ils font le calcul à la main et que la question posée est de déterminer l’écart-type. Par contre, les calculatrices donnent, en général, l’écart-type. Les élèves ont tendance à oublier d’éle-ver au carré quand la question posée est de détermi-ner la variance. Exercice 40 (page 51) 3.5 Différence entre σ n et σ n – 1 Les calculatrices fournissent deux valeurs pour l’écart-type : σ n ou σ qui correspond à la formule
u σ n – 1 o S qui correspond à la formule p 2 N1 1 i = Σ 1 n i ( x i x ) L’écart-type, noté s dans le cours (comme le demande le programme officiel) correspond donc au résultat noté σ ou σ sur les calculatrices. n 3.6 Problèmes de valeurs approchées Supposons que l’écart-type d’une série statistique soit s = 3,281 et sa variance s 2 = 10,764 961. Une valeur approchée de s (au dixième) est 3,3 et une valeur approchée de s 2 (au dixième) est 10,8. Les élèves ont tendance à prendre valeur approchée de s 2 le carré de la valeur approchée de s c’est-à-dire 3,3 2 (qui est égal à 10,89), ils obtiennent alors 10,9. Conclusion : il ne faut pas faire de calculs avec les valeurs déjà arrondies. Il faut garder le maximum de décimales tant que les calculs ne sont pas finis. Exercice 40 (page 51) 3.7 Confusion entre rang et valeur Une série a 24 valeurs que l’on peut classer dans l’ordre croissant : x 1 , x 2 , ……, x 24 . Le premier quartile Q 1 est la valeu de rang 24 donc r4 Q 1 = x 6 . Certains élèves pensent que Q 1 = 6, c’est-à-dire confondent le rang de la valeur et la valeur elle-même.
C H A P I T R E 2 | S TAT I S T I Q U E 25
3.8 Difficultés dans les tableaux à double entrée Tout tableau à double entr é e ne fournit pas des effec-tifs marginaux ou des fr é quences marginales. M ê me chose pour les fr é quences conditionnelle. Exemple : é volution de la r é partition des é tudiants dans l enseignement sup é rieur (Source : Tableaux de l ’é conomie fran ç aise 2000-2001 . INSEE.) année 1990-1991 1998-1999 type d’enseignement université 1 171 852 1 404 453 classes préparatoires 71 430 77 084 STS 199 084 234 300 autres 256 350 373 687 total 1 698 716 2 089 524 Le total par ligne n a pas de sens. 4 Description des approches 4.1 Nature des données. Description graphique (page 34) A. Raisons du choix et objectifs Cette approche a pour but de faire r é fl é chir sur la nature des donn é es d une s é rie statistique et sur le sens de la moyenne des valeurs d une s é rie statistique. B. Corrigé La moyenne des densit é s des 15 pays n est pas la densit é moyenne de l Union Europ é enne à moins de calculer une moyenne pond é r é e (par la superficie de chacun des pays). C. Scénario possible de mise en œuvre Pendant un premier temps (5 minutes), certains é l è ves vont s û rement calculer la moyenne des 15 valeurs : 147 h/km 2 . D autres se poseront peut-ê tre (en tout cas, on l esp è re) des questions sur la possibilit é d ajouter des valeurs exprim é es dans une unit é quotient. La mise en commun qui constituera le deuxi è me temps (15 minutes) devrait faire appara î tre, des contre-exemples : avec la densit é trouv é e, connaissant la superficie de l Union Europ é enne (2 890 000 km 2 ), la population de l ensemble des 15 pays serait de 425 000 000 d ha-bitants. On esp è re que ceci para î tra trop important à des é l è ves de 1 re ES. La population r é elle est de 370 000 000 d habitants (et la densit é de 128 h/km 2 ) ;
26
si deux d é partements, un immense et d é sertique ayant une densit é de 10 h/km 2 , et un petit et surpeupl é ayant une densit é de 390 h/km 2 , sont r é unis, la densit é de l en-semble des deux est-elle 200 h/km 2 ? On esp è re que des arguments sur la superficie seront é voqu é s. Dans le cas contraire, on prendra un exemple : 1 000 km 2 pour le premier, 100 km 2 pour le deuxi è me, la densit é  de l ensemble est alors d environ 44,5 h/km 2 . En effet : (1 000 × 10 + 100 × 390) / 1 100 44,5. Un dernier temps (5 minutes) permettra de conclure que la moyenne des valeurs d une s é rie statistique n a pas toujours un sens concret m ê me si elle a toujours un sens math é matique : la valeur a qui minimise 15 N1 i = Σ 1 n i ( x a ) 2 (voir page 41). i Dans le cas pr é sent é , la m é diane (109) aurait plus de sens : elle partage les pays en deux groupes, ceux à plus faible densit é , ceux à  plus forte densit é . La France est à peu pr è s à la m é diane (107). En compl é ment, on peut demander comment on pourrait repr é senter cette distribution. 400 300 200 100 0 FIN SUE IRLESP GR AUT F POR DK LUX IT ALL UK BEL PB 4.2 Lissage par les moyennes mobiles (page 36) A. Raisons du choix et objectifs Le but de cet approche est de diff é rencier les variations entre deux valeurs cons é cutives d une s é rie chrono-logique et la tendance g é n é rale. On peut observer, par exemple, une baisse ponctuelle dans une tendance g é n é rale haussi è re. B. Corrigé Il se peut que les r é sultats du mois pr é c é dent aient é t é tr è s faibles, soit exceptionnellement, soit parce que les mois correspondants sont traditionnellement faibles. La comparaison doit donc ê tre plut ô t effectu é e sur les m ê mes mois des ann é es pr é c é dentes et le responsable des ventes a pu, dans ce cas, constater une hausse beaucoup plus mod é r é e ou m ê me une baisse. C. Scénario possible de mise en œuvre Apr è s un temps de r é flexion individuelle (5 minutes), les é l è ves sont mis par groupes de deux pour comparer
leurs hypoth è ses (5 minutes). Une mise en commun Arguments quantitatifs en classe compl è te (15 minutes) permettra de faire Pour la s é rie A, 21 des 30 valeurs sont comprises appara î tre les notions de variations ponctuelles et de entre 4 et 6, c est-à -dire tr è s proches de la m é diane. tendance à plus long terme. Pour la s é rie B, seulement 3 valeurs sont dans cet On pourra proposer des exemples (si les é l è ves ne intervalle. l ont pas fait) : le ch ô mage qui augmente chaque Environ la moiti é des valeurs de la s é rie B (16 sur 30) mois de septembre (arriv é e des jeunes sur le march é sont situ é es entre 2 et 8 alors que plus de la moiti é du travail) m ê me quand on est dans une p é riode de des valeurs de la s é rie A sont situ é es entre 4 et 6. diminution, les ventes des magasins de jouets qui croissent au mois de d é cembre m ê me si on est en C. Scénario possible de mise en œuvre p é riode de r é cession, etc. La conclusion (5 minutes) portera sur l int é r ê t de Apr è suntempsderechercheindividuelle(1u0emsinutes)4,d é gager la tendance globale d une s é riechronolo-(le1s5é mli è nvuetses)peauvveecntcotrmavmaeillceornspiagrnegrdoepsemdeettregique en é liminant les variations p é riodiques ou d accord sur un argument. exceptionnelles, ce qui est le but du lissage. On rm pourra m ê me é voquer une deuxi è me é tape(horspro-vLaalidmerisetouesnlecsomarmguunme(n2t0scmitin é sutepsr) é cp é edemetmtreantdeetgramme) avec les s é ries corrig é es des variations sai- l interva sonni è res (comme celle du ch ô mage,parexemple).idn tienrtqroudarutiirlee)lqidu é eeldoen« pmeuotitid éé tceernmtrianleer» p(arlecalclluel Bibliographie : M é thodes Statistiques , B. Grais, des uar Dunod,1992.Avecqlestidle é sfientitiilolnusstrdeornsnu é resundadniasglreacmomures,enbo î te. 4.3 Diagramme en boîte (page 38) pourllass éé rriieeAB::QQ 11 ==42eettQQ 33 ==68, pour a A. Raisons du choix et objectifs La m é diane et l ’é tendue d une s é rie statistique ne 98 donnent pas d id é e sur la r é partition des valeurs entre 7 le minimum et le maximum. 6 Le choix de deux s é ries de m ê me effectif ( n = 30) 54 ayant la m ê me m é diane (mesure de tendance cen-3 trale) et la m ê me é tendue (mesure de dispersion) 2 mais dont les valeurs ne sont « visiblement »  pas 01 r é parties de la m ê me fa ç on doit amener les é l è ves à A B r é fl é chir à  des moyens de mesurer et visualiser ces diff é rences. 4.4 Mesures de dispersion (page 40) B. Corrigé A. Raisons du choix et objectifs Argument intuitif Les deux s é ries propos é es ont m ê me moyenne (4) et Pour la s é rie A, beaucoup de valeurs sont situ é esm ê me é tendue (6). Les valeurs de chacune des deux autour de la valeur centrale (m é diane 5). s é ries sont r é parties sym é triquement par rapport à la Pour la s é rie B, au contraire, beaucoup de valeurs sont situ é es pr è s du minimum ou du maximum. moyenne : Argument graphique A6B Les diagrammes en barres de ces deux s é ries permet-45 tent de visualiser l argument pr é c é dent : 3 2 A B 1 10 10 0 9 9 1 2 3 4 5 6 7 1 2 3 4 5 6 7 8778 La majorit é des valeurs de la s é rie A sont proches de 5665 la moyenne, ce n est pas le cas pour la s é rie B qui est 4 4 3 3 donc plus dispers é e. 2 2 L objectif de cette approche est de mesurer cette 1 1 0 0 dispersion en prenant en compte les é carts de toutes 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 les valeurs par rapport à la moyenne . C H A P I T R E 2 | S TAT I S T I Q U E 27
B. Corrigé Pour la s é rie A, effectif : 18 ; moyenne : 4 ; é tendue : 6. Pour la s é rie B, effectif : 14 ; moyenne : 4 ; é tendue : 6. Calcul des é carts. S é rie A valeur x i 1 2 3 4 5 6 7 effectif n i 1 2 3 6 3 2 1 écart x i x 3 2 1 0 1 2 3 ( x i x ) 2 9 4 1 0 1 4 9
valeur x i 1 2 3 4 5 6 7 effectif n i 2 2 2 2 2 2 2 écart x i x 3 2 1 0 1 2 3 ( x i x ) 2 9 4 1 0 1 4 9 | x i x | 3 2 1 0 1 2 3 14 1 14 i = Σ 1 n i ( x i x ) = 24 ; N i = Σ 1 | x i x | 1,7 ; i 1= Σ 41 ( x i x ) 2 = 56 1 i 1= Σ 41 ( x i x ) 2 4. ;N Conclusion : pour les deux calculs, é cart absolu moyen ou é cart quadratique moyen (variance) on obtient des valeurs sup é rieures pour la s é rie B. 1 8 Remarque : l ’é cart absolu moyen N i = Σ 1 ( x i x ) est 1 8 plus « naturel » mais la variance N i = Σ 1 ( x i x ) 2 a des propri é t é s math é matiques qui la rendent d un usage plus courant. C. Scénario possible de mise en œuvre On peut reprendre le m ê me d é roulement que dans l approche pr é c é dente. Remarque : si on ne demande pas explicitement un moyen de mesurer la dispersion qui prenne en compte les é carts de chacune des valeurs de la s é rie par rapport à la moyenne, on risque d obtenir des pro-c é dures faisant intervenir les quartiles. Pour la s é rie A : Q 1 = 3, Q 3 = 5, Q 3 Q 1 = 2. Pour la s é rie B : Q 1 = 2, Q 3 = 6, Q 3 Q 1 = 4. Le calcul des é carts interquartiles am è ne donc à  la m ê me conclusion : B est plus dispers é e que A ; ce qu on peut encore illustrer sur le diagramme en bo î te.
28
7 6 5 4 3 2 1 A B 4.5 Tableaux à double entrée (page 42) A. Raison du choix et objectifs Cette approche a pour but de faire appara î tre, sur un exemple, la diff é rence entre la fr é quence de A i sachant B j et de B j sachant A i . B. Corrigé 1. Le pourcentage de gar ç ons parmi les laur é ats est 30 soit environ 54,5 %. 55 Le pource d filles parmi les laur é ats est 25 ntage e 55 soit environ 45 %. 2. Le pourcentage de r é ussite parmi les gar ç ons est 305 55 soit environ 4,5 %. 25 Le pourcentage de r é ussite parmi les filles est 35 soit environ 71,4 %. 3. Le pourcentage de gar ç ons ayant r é ussi sur l en-semble du lyc é eest9300soitenviron33%. Le pourcentage de filles ayant r é ussi sur l ensemble du lyc é eest9205soitenviron28%. C est le deuxi è me calcul qui permet de r é pondre que les filles r é ussissent mieux que les gar ç ons dans ce lyc é e. C. Scénario possible de mise en œuvre Premier temps (10 minutes) : les é l è ves cherchent la r é ponse individuellement. Deuxi è me temps (5 minutes) : le professeur demande oralement ceux qui pensent que les gar ç ons r é ussis-sent mieux, ceux qui pensent le contraire. Troisi è me temps (10 minutes) : si il y a des r é ponses divergentes, on commence par faire exposer sa m é thode par un é l è ve qui pense que les gar ç ons r é ussissent mieux. On demande ensuite si d autres m é thodes ont é t é employ é es.
Dernier temps (5 minutes) : on conclut sur les notions B. Corrigé de fr é quences conditionnelles en insistant sur l en- Les valeurs rang é es dans l ordre croissant sont : semble de r é f é rence sur lequel on calcule les pour- 1 2 2 2 4 4 5 5 5 5 5 7 7 7 8 9 9 10 11 12 centages (cf. chapitre 1 sur les pourcentages). 12 12 12 12 12 12 13 13 13 14 14 16 16 17 18 18 18 19 20 21 22 22 22 22 23 29 31 36. L effectif est n = 49 donc n = 4,9 ; 9 n = 44,1 ; 5 Activités 3 n 10 10 5 1 Calculs statistiques et diagramme 4 n = 12,25 ; 4 = 34,75. . en boîte (page 44) D 1 est la 5 e valeur, D 9 la 45 e , Q 1 la 13 e et Q 3 la 37 e . La m é diane est la 25 e valeur. A. Notions utilisées Par cons é quent D 1 = 4, D 9 = 23, Q 1 7 et Q 3 = 18. = Utilisation de la calculatrice pour d é terminer les La m é diane est é gale à 12. param è tres de position (m é diane, quartiles) et de dis-40 persion (variance, é cart-type) et pour construire le 36 35 diagramme en bo î te d une s é rie statistique. 31 3029 B. Corrigé 25 24 23 20 18 1512 10 7 5 4 2 0 1 5.3 Lisser une série chronologique par les moyennes mobiles d’ordre 4 (page 45) A. Notions utilisées Moyennes mobiles. Lissage par les moyennes mobiles. B. Corrigé 1. On observe que, chaque ann é e, le quatri è me tri-mestre est beaucoup plus important que les trois autres. Ceci peut se visualiser sur un graphique en é toile. Il ne serait donc pas pertinent de calculer des moyennes mobiles d ordre 3 car certaines comporte-raient un de ces trimestre, et d autres pas. On aurait peu de chances d obtenir un bon lissage. 16 1 2 5.2 Déciles d’une série statistique (page 44) 15 3 A. Notions utilisées 14 4 D é termination de la m é diane et des quartiles d une 13 5 s é rie statistique. Calcul du premier et du dernier d é cile d une s é rie 126 statisti Consqturue.ctiond un diagramme en bo î te li it 11 7 premier et au dernier d é ciles.m é  au 10 9 8 C H A P I T R E 2 | S TAT I S T I Q U E 29
2. et 3. On calcule la s é rie des moyennes mobiles d ordre 4 (MM4) puis la s é rie des moyennes mobiles centr é es d ordre 2 (MMC2). année 1997 1998 trimestre 1 2 3 4 1 2 3 4 ventes 36 44 45 106 38 46 47 112 MM4 57,75 58,25 58,75 59,25 60,75 61,75 62,5
année 1999 2000 trimestre 1 2 3 4 1 2 3 4 ventes 42 49 48 118 42 50 51 118 MM4 62,75 64,25 64,25 64,5 65,25 65,25 MMC4 62,625 63,5 64,25 64,375 64,875 65,25 4. 140 120 100 80 60 40 20 0 1 5 10 15 16 5.4 Diagrammes en boîtes de deux séries (page 45) A. Notions utilisées Calcul des quartiles et de la m é diane d une s é rie. Construire le diagramme en bo î te d une s é rie. Comparer deux s é ries par leur diagramme en bo î te. B. Corrigé Salaires des hommes salaire 91 93 96 100 102 105 106 107
salaire 90 91 93 96 98 102 effectif 50 33 18 14 3 3 M é diane et quartiles Pour les hommes : Q 1 = 100 et Q 3 = 102. La m é diane est é gale à 100. Pour les femmes : Q 1 = 90 et Q 3 = 93. La m é diane est é gale à 91.
30
Hommes
90 92 94 96 98 100 102 104 106 108 Femmes Conclusion : Au moins 50 % des femmes ont un salaire inf é rieur ou é gal au plus petit salaire masculin (en fait 73 % à  cause des ex æ quo). Au moins 25 % des hommes ont un salaire sup é rieur ou é gal au plus gros salaire f é minin (en fait 44 % à cause des ex æ quo). Il faut revenir à la distribution des salaires pour avoir les pourcentages pr é cis mais l int é r ê t des graphiques est de donner l id é e de le faire ! 5.5 Sensibilité des paramètres d’une série aux valeurs extrêmes (page 46) A. Notions utilisées Param è tres de tendance centrale : moyenne, m é diane. Param è tres de dispersion : é tendue, é cart-type, é cart interquartile. Pertinence et robustesse aux valeurs extr ê mes de ces diff é rents param è tre. B. Corrigé 1. sériemoyennemédianeétendueinteércqauratrtileécart-type S 1 14,1 14 48 4 5,97 S 2 13,6 14 17 4 4,15 2. On constate que la moyenne, l ’é cart-type et surtout l ’é tendue sont plus sensibles à la pr é sence de valeurs exceptionnellement grandes (ou petites). La m é diane et l ’é cart interquartile, au contraire, sont plus robustes c est-à -dire moins affect é s par les valeurs extr ê mes (ici, ils sont m ê me inchang é s). 3. Un candidat à l embauche sera plus int é ress é par la m é diane des salaires à moins qu il ne soit candidat au poste de PDG ! (auquel cas il sera plus int é ress é par le salaire maximum). 5.6 Visualiser l’effet de structure A. Notions utilisées Effet de structure. Effet des pond é rations dans le calcul de la moyenne d une variable dans une population à partir des moyen-nes de cette variable dans des sous-populations.
B. Corrigé Par exemple :
b
V
Avec l origine à 40.
6 Corrigés des exercices et problèmes Faire le point • Pour se tester 60 55 1 50 45 40 79 80 81 82 83 84 85 86 87 88 89 90 91 a) La variable é tudi é e est la temp é rature 13 moyenne mensuelle à Paris. Ex b) Cette s é rie de 12 valeurs n est pas une s é rie chro-1 é e est le type d ori tation nologique. La valeur du mois de mars n a pas é t é enobserv é e un mois apr è s celle du mois de f é vrier. On des é tudiants. ne peut pas obtenir une 13 e valeur. 5 b ) moCd aelsitté su).neLevsadrioanbnl é eesqoubatleitnautievseso(notndeasepffristiifcsi.c) Les m é t é orologues calculent la moyenne annuelle ec (sur la p é riode de 30 ans) en faisant la moyenne (non La variable é tudi é e est le type d enseignement pond é r é e) des 12 moyennes mensuelles.  ar suivi p les é elt è tevesvadriuabsleecoensddegarl é itenFranceen a) Variables quantitatives discr è tes : a. (voir 519m98o-d1al9i9t é 9s..Ctquative.Elleainfoà la suite de l exercice 16) b. i. Variables quantitatives continues : c. d. e. g. j. k. l. m. 56,3 % b) Taux ou pourcentage : c. l. m. Moyenne : e. 2,8 % Indice : j. 12,6 % 2,1 % Effectifs : b. g. i. k. (on peut aussi dire a. et d. mais ce 26,2 % sont plut ô t des mesures). Info : L indice Dow-Jones é tait initialement une moyenne (non pond é r é e) des cours des 30 plus grandes valeurs industrielles am é ricaines. Compte tenu des changements (entr é es-sorties) dans la liste des 30, et des divisions d actions, il a é t é transform é en indice. Remarque : les variables c. g. l. peuvent conduire à la construction d un cartogramme, c est-à -dire à  la repr é sentation cod é e sur une carte des pays ou des r é gions dont les valeurs sont semblables, à  partir de la r é partition des valeurs en diff é rents intervalles ( cf . exercice 73).
Avec l origine à 0.
3 000 2 000 1 000 0 60 50 40 30 20 10 0 79 80 81 82 83 84 85 86 87 88 89 90 91
C H A P I T R E 2 | S TAT I S T I Q U E 31