Notions de base de statistique descriptive Créé par Hélène CHARRIER et Sarah De Gryse

Notions de base de statistique descriptive Créé par Hélène CHARRIER et Sarah De Gryse

-

Documents
30 pages
Lire
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

Créé par Hélène CHARRIER et Sarah De Gryse 1 STATISTIQUE DESCRIPTIVE èreprogramme 1 semestre INTRODUCTION : GENERALITES Indice des prix à la consommation Besoin de En bref Pouvoir d'achat du franc statistiques ? quels Territoire Indice du coût de la construction sont les domaines Population Smic Travail - Emploi Indicateurs conjoncturels qui vous Revenus - Salaires Analyse conjoncturelle intéressent ? Conditions de vie - Comptes nationaux trimestriels l’économie ? les Société Comptes nationaux annuels Santé enquêtes, sondages Enseignement - d’opinion ? Education vous disposez de Economie Commerce extérieur tellement de sources Entreprises d’informations, qu’il Agriculture - Industrie est difficile de trier ! agro-alimentaire Industrie - un exemple vous est Construction fourni : Commerce le site internet Services « insee.fr ». Equipement et exploitation des salles de cinéma nombre et %% Centre Centre/France 1996 1997 1997Salles actives 152 147 3,2Fauteuils 33 093 31 789 3,34 180 Entrées 4 473 000 3,0000Source : Ministère de la culture et de la communication Les statistiques que l’on nous donne ou que l’on va recueillir concernent une multitude de domaines et il faut en convenir ne sont pas toujours intéressantes et se révèlent parfois fausses lorsqu’il s’agit de statistiques prévisionnelles ( par exemple, en politique ou en sociologie).. Mais, force est de constater qu’elles ...

Sujets

Informations

Publié par
Nombre de visites sur la page 333
Langue Français

Informations légales : prix de location à la page  €. Cette information est donnée uniquement à titre indicatif conformément à la législation en vigueur.

Signaler un problème
 
Créé par Hélène CHARRIER et Sarah De Gryse
   programme 1èresemestre      
  
 
1  TEne rrbirteoifr  e   ,  Population     Travail - Emploi    RCeovndeintiuosn -s  Sdeal aviiree -s    , Société   ,  Santé  2  EEndsueciagtinoenm  ent - , Economie   #  Commerce extérieur     AEgnrtirceuplrtiusrees -   Industrie  ro-alimentaire       % Iangdustrie -     Construction   + SCeormvicmeesr c e     3  4  Equipement et exploitation des salles de cinéma
  Salles actives Fauteuils Entrées Source : Ministère de la culture et de la communica tion
 
Indice des prix à la consommation  Pouvoir d'achat du franc  Indice du coût de la construction  Smic  Indicateurs conjoncturels  Analyse conjoncturelle  Comptes nationaux trimestriels  Comptes nationaux annuels  
   Centre 199 199 152 147 33 093 31 789 4 180 4 473 000  
1  
nombre et %  1997 3,2 3,3 3,0
                                                                ! " #$          % &  '   ( !          "            (        )      · *  ! +        ,     (!       , - . · /    · 0     (  (  +   -·*-                                        
          
 
Créé par Hélène CHARRIER et Sarah De Gryse
 2
   · Population: c’est l’ensemble de référence concerné par l’étude. Lorsque la population n’est pas complète, on parle d’échantillon ou de sous-ensemble de la population. · Individus ou unités statistiques: la taille de la population ou de l’échantillon est le nombre d’individus qui le composent · Variable ou caractère qualitatif: il s’agit de caractéristiques propres à chaque individu qui ne sont pas mesurables · Variable ou caractère quantitatif: caractéristiques mesurables.  Exemple : les étudiants IUT GEA   ETUDIANTS GROUPE  DE MATHSSEXE NOTES  Adrien G1 M 1 Bénédicte G1 F 19 Caroline G6 F 10 Daphnée G2 F 3 Emmanuel G4 M 13 Florence G3 F 9 etc   VARIABLES VARIABLES  QUALITATIVES QUANTITATIVES INDIVIDUS DE LAPOPULATION  « ETUDIANTS GEA » ici, on parlera d’échantilloncar les 170 étudiants ne sont pas recensés    Il est important de définir avec précision l’ensemble de référence, population ou échantillon, sur lequel vont porter les analyses statistiques. C’est davantage dans la façon dont sont recueillies les informations que les statistiques sont critiquées que dans les techniques de dépouillement ou d’analyse (par exemple, lors de sondages ou de questionnaires : comment être sûr de l’exactitude des réponses fournies par les personnes interrogées ?)  Notre chapitre va porter sur deux points essentiels qui concerne uniquement la statistique descriptive :  · représentation des statistiques, essentiellement au travers des graphiques, La · Et l’analyse des statistiques qui serviront ensuite d’outil d’aide à la décision, notamment en contrôle budgétaire ( voir 4èmepartie)                 
          
 
Créé par Hélène CHARRIER et Sarah De Gryse
3
 1- LA PRESENTATION GRAPHIQUE DES RESULTATS  Il est possible de délivrer des données statistiques sous une multitudes de présentations : tableaux, textes,…, graphiques. Une représentation graphique comporte plusieurs avantages : clarté, lisibilité, rapidité par utilisation de grapheurs, synthèse des données.  5#   !  *6/*            #   ! 7  #         ! % ֠)     !  '    #      (!  8   !      + ·    !      -·     +       -  1-1- schéma de base  Dans le cas d’une variablequantitative, il faut distinguer :  les variables « discrètes » ou « discontinues »: ne peuvent prendre qu’un nombre fini de valeur exemple : 7 étudiants du groupe 6 ont eu une note d’anglais égale à 3  les variables « continues » ou intervalles:peuvent prendre toute valeur d’un intervalle exemple : 15 étudiants de la promotion IUT GEA ont eu une note d’anglais comprise entre 0 et 3.   1-2- variable statistique quantitative « discrète » ou « discontinue »   la société « MAYALEN »EXERCICE D’APPLICATION : On vous fournit la série statistique relative à une population de foyers basques dans la région d’HENDAYE : 86 ménages de moins de 30 ans, sans enfants ont été interrogés sur le nombre d’enfants qu’ils souhaitaient avoir dans un avenir assez proche. En voici les résultats :  NOMBRE ENFANTS=Xi NOMBRE DE MENAGES= Yi 0 5 1 19 2 31 3 20 4 11 TOTAL 86   1-2-1-le diagramme en « bâtons » &'"(%")  !"#""$%· les valeurs sont déjà classées par ordre Ici, · range les valeurs par ordre croissant et Oncroissant de 0 à 4 on leur associe deseffectifs.  Un effectif correspond au nombre d’individus A T O N S BD IA G R A M M E correspondant à la variable étudiée. Lorsqu’ils sont exprimés en %, on parle de3 5   3 13 0 fréquence. 2 5  our 0 22 0 9 1 Certains parle de fréquencesabsoluesp1 5 les effectifs et de fréquencesrelativespour les1 0 1 1 effectifs exprimés en %. 5 5 0 · Si on joint les sommets des bâtons, on0 1 2 3 4 5 obtient uneligne briséedonnant l’allureX I générale de la variable étudiée           
          
 
Créé par Hélène CHARRIER et Sarah De Gryse
1-2-2- le diagramme en « escaliers » ou diagramme cumulatif d’une variable discrète  EXERCICE D’APPLICATION : suite de la société « MAYALEN » reprenez les mêmes données que précédemment pour en faire une représentation cumulée   !"#""$%RESOLUTION · effectue le cumul croissant des valeurs OnD IA G R A M M E E S C A L IE R de la variable étudiée · suffit ensuite de joindre les points Il 8 6 5 71 0 0 cumulés soit par des segments de droite 55 0 5 soit par des « escaliers»0 5 2 4  0 1 2 3 4 5 X I    
 4
6
1-3-variable statistique quantitative « continue » On est ici en présence de variables quantitatives données sous forme d’intervalles. 1-3-1- l’histogramme ֠9:0;:0<8            :  #      Oui, les intervalles sont égaux  EXERCICE D’APPLICATION : la société « GOTCHEA » La faculté de BAYONNE vous indique les notes de mathématiques de ses étudiants en IUT GEA, promotion 1999 sur un échantillon de 170 individus.  NOTES DE MATHS = Xi NOMBRE d’ETUDIANTS =Yi [0.5[ 20 [5.10[ 80 [10.15[ 40 [15.20[ 30  
1 0 0 8 0 6 0 4 0 2 0 0
H I S T O G R A M M E
[ 0 , 5 [
[ 5 , 1 0 [ [ 1 0 , 1 5 [ X I
[ 1 5 , 2 0 [
Si on joint le milieu de chaque segment supérieur, on obtient le polygone des effectifs.
   même amplitude : les intervalles sont identiques Toujours faire attention aux intervalles ouverts ou fermés. Ici, intervalle ouvert signifie que la dernière valeur n’est pas incluse   les intervalles ne sont pas égaux Non,  EXERCICE D’APPLICATION : suite de la société « GOTCHEA » La faculté de BAYONNE vous indique les notes de mathématiques de ses étudiants en IUT GEA, promotion 1999 sur un échantillon de 170 individus mais répartis ainsi :  NOTES DE MATHS = Xi NOMBRE d’ETUDIANTS =Yi  [0.4[ 18 [4.6[ 50 [6.10[ 32 [10.14[ 30  [14.20[ 40  
          
 
Créé par Hélène CHARRIER et Sarah De Gryse
5
 La surface des rectangles d’un histogramme doit être proportionnelle aux effectifs représentés. C’est la surface des rectangles et non leur hauteur qui est proportionnelle à la quantité Nous préconisons la démarche suivante :   · une Choisissezamplitude de référence Effectifs Nombre =, Classes = Effectifs celle que vous voulez ! il est d’usage de intervalles Nombre d’amplitudes rectifiées prendre celle qui revient le plus souvent de notes d’étudiants = · le nombre d’amplitudes par Comptez (2) (1) maths en (1)/(2) intervalle [0.4[ 18 1 18 · Déterminez uneffectif rectifiéen faisant ½ 100 [4.6[ 50 le rapport: effectif/nombre d’amplitudes 32 [6.10[ 32 1  [10.14[ 30 1 30  [14.20[ 40 1.5 26.67  TOTAL 170 206.67 On a choisit l’amplitude qui revient le plus souvent soit une unité de 4 ; nous allons donc regarder pour chaque intervalle combien de fois il contient cette unité emarques : · Le total des effectifs rectifiés ne sera jamais identique à celui de départ. Si  vous le faites en %, vous ne  s siamaj » zerebomet r«00% ur 1  · L’aire des rectangles est proportionnelles aux effectifs   VOUS POUVEZ ALORS PROCEDER A LA CONSTRCUTION DE L’HISTOGRAMME DE LA MEME FACON QUE PRECEDEMMENT EN PRENANT EN COMPTE BIEN SUR LES EFFETIFS RECTIFIES COMME POINTS D’ORDONNEES. 1-3-2- le polygone cumulatif d’une variable « continue »  ֠attention à toujours construire le diagramme cumulatif eneffectifs non rectifiés !  : suite de la société « GOTCHEA »EXERCICE D’APPLICATION   Reprenons les mêmes données que précédemment données en classes      Il est possible de construire un cumul croissant et un cumul décroissant :CLASSES EFFECTIFS CUMUL CUMUL CROISSANT DECROISSANT · bLoercnuesmsulucpréoriisesuarents le devrlanietuq ec ahpartir des se tocsnrtiu t à 418 18  · cumul décroissant est construit à partir des Le65068 1032100 bornes inférieures 30 14 130 lRinetmerasreqcutieo :n  odne sv edrreau xd acnosu rubne sp ocionrtr eulstpéroienudr  aquu ep oint 2040170 médian de la distributi n statistique 170 oBornes supérieures  ornes inférieures                VOIR GRAPHIQUE FAIT A  LA MAIN : A INSERER ICI       
          
 
Créé par Hélène CHARRIER et Sarah De Gryse
  REMARQUE :il est tout à fait possible de présenter n’importe quelledistribution statistique en %, c’est-à-dire enfréquences relativesen faisant le rapport de l’effectif ni sur l’effectif total N : Fréquences relatives = ni/N  Exemple :  Ni % [0.5[ 20 20/170=12% [5.10[ 80 80/170=47% [10.15[ 40 23% [15.20[ 30 18%  N=170100%   1-4-variable statistique qualitative  Il y a une pluralité de graphiques possibles pour représenter une distribution statistique à variable qualitative+    )  - Regardons quelques exemples :  ·BUDGET DE LA FAMILLE  Graphique circulaire (« camembert ») AN B U D G ET F AM ILLE 5,00%S TE IMPOTS 10% SA NTELOISIRS 10% 15 % 5% 10 % IMPOTSHABITAT 30% 10 % 10 % L OISIRSALIMENTATION 20% HA BITA TSPORT 10% 20%30%ASLPIOMRETNTATIONCHARGES 15% CHA RGES  
·  
C H A R G E S S P O R T A L I M E N T A T I O N
Anneau 
0% 15%5,0 10 % 10% 10% 20% 30 %
 · Graphique boursier        
S A N T EI M P O T S L O I S I R S H A B I T A T
 
SANTE IMPOTS LOISIRS HABITAT ALIMENTATION SPORT  
          
6
 
 
Créé par Hélène CHARRIER et Sarah De Gryse
         *              EXERCICE 1 Un échantillon d’ étudiants GEA 1èreannée ont obtenu les notes suivantes aux examens du 1ersemestre :  ETUDIANTS GROUPE SEXE EXPRESSSION ANGLAIS MAD  François 1 G 10 10 1 Julia 6 F 5 6 18 Pauline 5 F 8 10 10 Jean Michel 2 G 14 14 14 Grégoire 1 G 2 2 13 Pierre 3 G 7 7.75 8.5 Florence 4 F 3.5 2.75 9 Karine 5 F 16 16 0 Ali 4 G 15 9 20 Xavier 1 G 4.5 5 13   1. Déterminer les fréquences relatives de la variable « EXPRESSION » et faire une représentation graphique simple puis en données cumulées croissantes 2. regrouper en classes d’amplitude 4 les effectifs de la variable « ANGLAIS » et faire une représentation graphique simple puis en données cumulatives croissantes et décroissantes 3. regrouper en classes [0.2[, [2.5[,[5,10[,[10,15[,[15.20] les effectifs de la variable « MAD et faire une » représentation graphique
 une représentation graphique de la variable « SEXE proposer »   EXERCICE 2 NOMBRE DE PERSONNES NOMBRE DE MENAGES A CHARGE  1 2 570 2 3 660 3 2 650 4 1 980 5 1 240 6 1 320 TOTAL 13 420  · dans un tableau, les fréquences absolues et relatives Indiquer · Faire une représentation graphique des fréquences absolues ,et tracer le polygone des fréquences · un  Fairediagramme cumulatif ascendant des fréquences relatives · Déterminer le nombre de ménages qui comprennent moins de 4 personnes à charge.   EXERCICE 3 On vous fournit la durée de vie de matériels électriques :  Durée de vie (en heures) NOMBRE D’APPAREILS [300,499] 50 [500,699] 150 [700,1099] 275 [1100 et plus 25  TOTAL 500
· Faire une représentation graphique des fréquences relatives et tracer le polygone des fréquences · Tracer une courbe des fréquences relatives cumulées croissantes · le nombre d’appareils ayant une durée de vie < 900 heures Déterminer           
 7
 
Créé par Hélène CHARRIER et Sarah De Gryse
8
EXERCICE 4 :      => =?@      !    A +  CA NOMBRE ENTREPRISES < 0.25 13 712 [0.25,0.50[ 10 674 [0.50,1[ 11 221 [1,2.5[ 15 496 [2.5,5[ 10 043 [5,10[ 3 347 10 3 147 >  · les caractéristiques de cette distribution statistique Déterminer ·Faire une représentation graphique  · Sur un même graphique, faire la représentation des fréquences relatives cumulées croissantes et décroissantes.  EXERCICE 5  AGE DE L’EPOUSE NOMBRE DE MARIAGES < 20 55 000 [20,24] 161 000 [25,29] 66 000 [30,34] 17 000 [35,40[ 16 000 [40,49] 17 000 [50, 60[ 7 000 >60 2 000 · Indiquer dans un tableau, les fréquences absolues et les fréquences absolues cumulées ascendantes et descendantes. · une représentation graphique des fréquences absolues Faire EXERCICE 6 Une compagnie d’assurance pour laquelle vous travaillez en stage vous charge de dresser des graphiques pour représenter ses charges annuelles exprimées en millions POSTES  VAM 2950.20 Risques autres que VAM 989 Assistance 44.20 Frais généraux 1104.10 Divers 175.10  1. faire une représentation graphique « circulaire » 2. représenter cette série sous forme de graphique « en bandes » dans laquelle vous ferez apparaître les %. 3. faire une représentation par un graphique en « barres »  EXERCICE 7 7 #    1         !#     +  TITRES QUANTITES PRIX ACHAT COURS CARREFOUR 10 50€ ALCATEL 50 150€ CLUB MED 4 100€ WANADOO 6 19€  1. Vous devez dater votre exercice et rechercher le cours de chaque titre à cette date soit dans un quotidien soit sur un site internet (www.investir.frouwww.latribune.frouwww.lesechos.fr .........) 2. Faire une représentation graphique circulaire faisant apparaître la répartition de votre portefeuille en volume exprimée sous forme de % 3. faire une représentation graphique circulaire faisant apparaître la répartition de votre portefeuille en prix d’achat exprimée sous forme de % 4. faire une représentation graphique « en barres » faisant apparaître les plus ou moins values latentes en fonction du cours de la question 1.  
          
 
Créé par Hélène CHARRIER et Sarah De Gryse
9
 2- ANALYSE STATISTIQUE   Nous venons d’étudier les différentes possibilités de représentations graphiques. Voyons, à présent, l’interprétation des données. On cherche à déterminer des caractéristiques essentielles telles que : · de grandeur des effectifs : LA MOYENNE Ordre · de la répartition des effectifs autour de cette moyenne : LES ECARTS Analyse  2-1- Caractéristiques de valeur centrale : les moyennes  2-1-1- les moyennes de grandeur : moyennes arithmétiques  · La moyenne arithmétique simple  -- NOTES DES ETUDIANTS POUR 6 MATIERES SANS COEFS 12 4 3 8 7 2  !"#""$% &'"(%")   M=Sxi/N(12+4+3+8+7+2) / 6 = 36/6 = 6  La moyenne des notes de ces 36 étudiants est Il suffit d’additionner les effectifs et de les diviser parde 6 sur 20. le nombre de valeurs  · la moyenne arithmétique pondérée Vous pouvez rencontrer deux cas : soit il s’agit d’une variable discrète, soit il s’agit d’une variable continue auquel cas il faut raisonner en « centres de classes ».   NOTES DES ETUDIANTS DANS 6 MATIERES Xi 12 4 3 8 7 2 COEFFICICENT ni 1 2 2 1 3 3  NOTES  ,5[ [0 [10,15[ [5,10[ [15,20[ NOMBRE ETUDIANTS 3 12 4 1  !"#""$% &'"(%")  xi 12 4 3 8 7 2S · + ni 1 2 2 1 3 3 12 M=Sxini/Snixini 12 6 8 21 8 61 6  M= 61/12 =5.08      classes [0.5[ [5.10[ [10.15[ [15.20[S · +  Le calcul reste le même en prenant lescentres de 12.5 17.5 7.5Centresxi 2.5 classes comme xi. 1 20ni 3 12 4  Xini 7.5 90 50 17.5 165  M= 165/20=8.25      
          
6055 40 45 20 26 01411 0 1 2M5 NOMBRE DE CH i F(M) = 55/2 = 27.5 Sur l’axe des ordonnées, vous pointez 27.5 pour retomber sur l’axe des abscisses où on peut lire une médiane comprise entre 3 et 4. Par le calcul, on encadre F(M) soit 27.5 : Pour 3 cumul de 26 Pour 4 cumul de 45  de (26-45)-1 différentiel Pour x (27.5-26)  Donc X=[(27.5-26)*-1]/(26-45) = 0.078 La médiane est donc de 3+0.078 =3.078 Il y a autant de jours où moins de 3 chèques ont été traités que de jours où plus de 3 chèques l’ont été
MEDIANE
EXEMPLE 2 : le cas d’une variable continue  CLASSES ni CUMUL CUMUL CROISSANT DECROISSANT [10,20[ 5 0 [20,30[ 20 5 [30,40[ 7 25 [40,50|[ 1 32  33  
   ֠Que pensez-vous de la moyenne ? »  «REFLECHISSONS ensemble ! · les calculs sont parfois longs · cela permet d’avoir un ordre de grandeur et de situer par rapport à cette moyenne · influence des valeurs extrêmes atténuée par la pondération · la moyenne n’est pas toujours significative du plus grand nombre  2-1-2– les moyennes de position : la médiane  C’est le nombre qui occupe le milieu de la distribution : il y a alors autant d’effectifs en amont qu’en aval de cette valeur Vous pouvez rencontrer deux cas : variable discrète ou variable continue.   Xi 0 1 2 3 4 5 Ni 1 3 7 15 19 10 CUMUL 1 4 11 26 45 55      La médiane Me, est la valeur qui partage en 2 la série des observations. Il faut donc faire lecumul croissantde la distribution ce qui nous donne N, le total des effectifs. La fréquence de la médiane se trouve à la moitié soit :    N/2F(M) =  Il est possible de déterminer la médiane · soit par le graphique,     · soit par le calcul il faut raisonner par «interpolation linéaire» Ne vous laisser pas impressionner par le terme mathématique car il s’agit d’un simple « produit en croix »          
33 28 8 1 0
          
 
10
Créé par Hélène CHARRIER et Sarah De Gryse
 
Créé par Hélène CHARRIER et Sarah De Gryse
11  
METHODOLOGIE   La méthode est le même que précédemment. On parled’intervalle médian.  · Par le graphique, il est possible de rajouter une courbe représentant lescumuls décroissants:l’intersection entre les deux &'"(%") courbes vous donne alors la médiane par lecture sur l’axe des abscisses.MEDIAN   40   30   20  10   0 · Par le calcul, l’interpolation linéaire doit20140300 se faire avec les bornes supérieures CLASSE    On lit sur le graphique unintervalle médian  de [20.30[  On encadre la F(M), soit 33/2 = 16.5 Pour 20  de 5 cumul  Pour 30  cumul de 25  -10-20   X(16.5-5)    On a lors X = (11.5*-10)/-20 = 5.75 Soit une médiane de 20+5.75 =25.75   ֠ « Que pensez-vous de la médiane ? »REFLECHISSONS ensemble ! · Calcul simple non influencé par les valeurs extrêmes · Donne une idée convenable de la tendance générale   2-1-3- les moyennes de fréquence : le mode  Il correspond à la valeur dominante : la valeur du caractère qui comprend le plus grand effectif. On parle de classe modale pour une variable continue.  Quelques remarques s’imposent : · pouvez rencontrer des distributions vous« bimodales » ou « plurimodales » · lorsque vous déterminer une classe modale, prenez garde à bien prendreles effectifs rectifiés en cas de classes à amplitudes différentes   EXERCICE D’APPLICATION: reprendre tous les énoncés vus précédemment   · 1èreapplication : notes sans coefs mode 1 · 2ème modesapplication : notes avec coefs bimodale 7 et 2 · 3ème modale [5.10[ classeapplication : classes de notes · 4ème mode 4application : · 5èmeapplication : modale [20.30[ classe    ֠REFLECHISSONS ensemble ! « Que pensez-vous du mode ? » 
          
50