STATISTIQUE DESCRIPTIVE: INTRODUCTION 1. CONTEXTE La statistique est l’activité ou méthode scientifique qui consiste à recueillir des données d’observation, suivie d’un traitement de ces données afin de les analy- ser et en obtenir une interprétation. Ces observations portent sur desindividus ou unités statistiques, qui sont définis comme les éléments d’une population. L’étude statistique porte sur la population, en tant qu’ensemble d’entités, et non sur un individus particulier. Par exemple, une population peut être l’ensemble des pays d’un continent, et les individus les pays eux-même. Historiquement, le vocabu- laire employé vient des recensements démographiques. Une Population peut être plus ou moins bien définis. Dans l’exemple de l’en- semble des pays, la population est connue de manière exhaustive. Souvent, la no- tion de population doit être définie de manière plus abstraite. Par exemple, si l’on veut étudier statistiquement la mise au point d’un vaccin, la population sera l’en- semble des malades actuels et à venir. On parle alors dehypothétique. Pour étudier une population, on va donc se concentrer sur un sous-ensemble restreint à quelques individus : le choix de ces individus s’appellel’échantillonage. La méthode d’échantillonage doit assurer une certaine représentativité de la po- pulation globale. On se limitera dans ce cours à deux types d’échantillonage : (1) L’échantillonage exhaustif ou recensement : chaque individu de la popula- tion est connu. (2) L ...
1. CONTEXTE La statistique est l’activit ou mthode scientifique qui consiste À recueillir des donnes d’observation, suivie d’un traitement de ces donnes afin de les analy-ser et en obtenir une interprtation. Ces observations portent sur desindividusou unitÉs statistiques, qui sont dfinis comme les lments d’unepopulation. L’tude statistique porte sur la population, en tant qu’ensemble d’entits, et non sur un individus particulier. Par exemple, une population peut tre l’ensemble des pays d’un continent, et les individus les pays eux-mme. Historiquement, le vocabu-laire employ vient des recensements dmographiques. Une Population peut tre plus ou moins bien dfinis. Dans l’exemple de l’en-semble des pays, la population est connue de manire exhaustive. Souvent, la no-tion de population doit tre dfinie de manire plus abstraite. Par exemple, si l’on veut tudier statistiquement la mise au point d’un vaccin, la population sera l’en-semble des malades actuels et À venir. On parle alors depopulation hypothÉtique. Pour tudier une population, on va donc se concentrer sur un sous-ensemble restreint À quelques individus : le choix de ces individus s’appellel’Échantillonage. La mthode d’chantillonage doit assurer une certaine reprsentativit de la po-pulation globale. On se limitera dans ce cours À deux types d’chantillonage : (1) L’chantillonageexhaustif ourecensement: chaque individu de la popula-tion est connu. (2) L’chantillonagealatoire : les individus sont tirs alatoirement parmis la population. 2. VARIABLES STATISTIQUES Un individus est dcrit par un ensemble de critres (qu’on appellera variables ou caractres). Ces dernires peuvent tre de deux sortes : qualitatives ou quanti-tatives. 2.1.Variables qualitatives.Ces caractres ne sont pas de nature numrique et aucune opration arithmtique n’est possible (mme si, parfois, elles peuvent tre codes par un nombre). Les valeurs prises par ces variables sont appelesmodalitÉs. On peut distinguer deux types de variables qualitatives : les variables nominales:ce sont les variables sur lesquels on ne peut faire ni opration arithmtique, ni comparaison. L’chelle nominale est utilise pour reprsenter les variables dont les catgories ne sont pas naturelle-ment ordonnes. On peut coder ces catgories par des nombres. Exemple de variables nominales : l’tat civil, le sexe. . . les variables ordinales:L’chelle ordinale est utilise pour reprsenter des variables dont les catgories sont naturellement ordonnes ou en relation les unes par rapport aux autres. Les modalits sont non-quantitatives et 1
L2 Maths-Info
Statistiques
descriptives
indiquent uniquement une position dans une srie ordonne (on ne peut pas mesurer la diffrence qui existe entre deux positions). Par exemple, un classement de prfrence ou par jugement comme «j’aime un peu», «beau-coup», «pas du tout». 2.2.Variables quantitatives.Les modalits sont de nature numriques et l’on peut effectuer des opration arithmtiques et des classements. Elles peuvent tre de deux sortes : discrÈte:les modalits prennent leurs valeurs dans un ensemble fini ou d-nombrable. La mesure est donc toujour exacte. Par exemple, le nombre d’enfant par famille est une variable discrte. continue:ici les variables prennent des valeurs qui peuvent tre arbitrai-rement proche les unes des autres, et une valeur peut tre aussi prcise que l’on veut. En ralit, comme les mesures sont faites en prcision fi-nie, l’chelle continue est une abstraction commode pour modliser les chelles possdant un grand nombre de valeurs (qui sont thoriquement aussi proche qu’on veut les unes des autres). Par exemple, la taille est une variable continue. 3. MÈTHODOLOGIE Une tude statistique dbute par la collecte des donnes : les observations «brutes» sont obtenues aprs enqute, mesures etc. C’est À ce niveau qu’intervient les m-thodes d’Échantillonages(non abordes dans ce cours). Une fois les donnes collectes, et avant d’apporter des rponses prcises aux questions poses au pralable de l’tude, il convient d’analyser ces donnes. Cette analyse À pour but de synthtiser, rsumer et structurer l’information contenue dans les donnes À l’aide de tableaux, graphiques et rsums numriques. C’est l’objet de lastatistique descriptive, ou exploratoire, qui est l’objet de ce cours. Cette analyse se fait surl’Échantillonqu’on a À disposition. Cette description des donnes n’est en gnral pas suffisante. Une bonne tude statistique consiste en formuler et valider des hypothses relative Àla population totale. Le but est d’tendre les rsultats observs prcdement À toute la popula-tion, en tudiant le risque d’erreur possible. C’est le but del’infÉrence statistique (qui ne sera pas aborde dans ce cours). 4. LIEN STATISTIQUE/PROBABILITÈ Probabilit Statistique Espace fondamentalPopulation Epreuve Tirage(d’un individu), exprimentation Evnement lmentaireIndividu, observation Variable alatoireCaractre Epreuves rptesEchantillonnage Nbre de rptitions d’une preuveTaille de l’chantillon, effectif total Probabilit Frquenceobserve Loi de probabilitDistribution observe ou loi empirique Esprance mathmatiqueMoyenne observe Variance Varianceobserve 2