Cours, Chapitre de Mathématiques de niveau BTS
5 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Cours, Chapitre de Mathématiques de niveau BTS

-

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
5 pages
Français

Description

Stat à une et deux variables
Cours, Chapitre en Mathématiques (2010) pour BTS CIG

Sujets

Informations

Publié par
Nombre de lectures 1 900
Langue Français

Exrait

Statistiques :une et deux variablesMATHEMATIQUES BTSCIG1 1 /Vo c a b u la ir ed e ss ta t i s t i q u e s Un ensemble d’objets ou de personnes sur lequel porte une étude statistique est appelépopulation. Un élément de cette population est appelédiviundi.L'étude statistique rend compte d'un aspect des individus de la population appelévariableoutcreèacar.Un caractère permet de déterminer une partition de la population selon ses diversesmodalités( par exemple le sexe est un caractère à deux modalités : masculin ou féminin). Le caractère est ditqualitatifs’il n’estpas mesurable(ex : forme , couleur) Le caractère est ditquantitatiftailles ;….).On note alorssi c’est une grandeur mesurable ( ex : âges ;x i p p Les valeurs prises par le caractère,i, étantle nombre de valeurs prises parvariant de 1 jusqu’à le caractère . On notenil’effectif de chaque valeur, c'est-à-dire le nombre d’individus correspondant à la valeurxdu caractère. i Le caractère quantitatif est ditdiscret. S’il ne prend que des valeurs isolées ( par exemple entière ) Le caractère quantitatif est ditcontinues’il peut prendre, théoriquement n’importe quelle valeur d’un intervalle . Les valeurs voisines du caractère sont regroupées enclasses .( en générale , intervalles fermés à gauche et ouvert à droite ). (x;n)variant de 1 jusp. La série statistique est donc la donnée de tous les couplesi ii qu’à [x;x[n Dans le cas d’un caractère continue , c’est la donnée de tous les éléments de la forme (i i#1;i). i1p N N1n L’effectifpopulation est le nombre total d’individus de cette population .åi i11 La fréquenced’une valeur ou d’une classe est la proportion d’individu correspondant à cette valeur ou cette n i f1 classe. On la noteiest égale :fi( la fréquence peut être exprimée en pourcentage ) . N i1p Propriété:0£f£1f11 å ieti i11 Effectifs et fréquences cumulés Définition 1: Quandles valeurs d’un caractère quantitatif sont rangées dans l’ordre croissant,  l’effectifcumulé croissant ( respectivement décroissant ) d’une valeur est la somme  deseffectifs des valeurs inférieures [ respectivement supérieures ] ou égales à cette valeur,  àla fréquence cumulée croissante [ respectivement décroissante ] d’une valeur est la somme  desfréquences des valeurs inférieures [ respectivement supérieures ] ou égales à cette valeur. 2- Représentation graphique d’une série statistique (caractère quantitatif ) 2.apour un caractère quantitatif discret ,diagramme en bâtons: dans un repère orthogonal, les axes  graduésrégulièrement .En abscisses on porte les valeurs du caractère et en ordonnées , les effectifs  (ou les fréquences ) de chaque valeur . la hauteur de chaque valeur est donc proportionnelle à l’effectif  (ouà la fréquence ). 2.bpour un caractère quantitatif continue ,histogramme: chaqueclasse est représentée par un rectangle  dontl’aire estproportionnelle à l’effectif (ou à la fréquence ).on porte en abscisses les valeurs du  caractère.Lorsqueles classes ont la mêmeamplitude, c’est la hauteur qui est proportionnelle à l’effectif. 3- Caractéristiques de position ( caractèresquantitatif ) a) Mode: On appelle mode d'une série statistique quantitative, la valeur qui a le plus grand effectif. Une classe modale d'une série statistique quantitative dont les valeurs sont regroupées en classes est une  classequi a le plus grand effectif. b) Étendue:On appelle étendue d'une série statistique la différence entre la plus grande valeur du  caractère(valeur maximale) et la plus petite valeur (valeur minimale). c)Médiane:La médiane c’est la valeur du caractère notéeMequi Partage la série statistique en  deuxséries demême effectif,( les valeurs étant classées dans l’ordre croissant ). Calculune série statistique d’effectif total: SoitN-SiN12k#1, alorsMe1xk1 # x#x k k#1 1M  -SiN2k, alorse1.Meest une mesure de tendance centrale de la série. 2
Pour une série continue : on
y 110 100 90 80 70 63,4 60 50 43,1 40 30 20 10
0 1020 30 40 50 60 70 80 90100 110 120 130 140 150 160 170 Med=66,8 utilise le polygone des fréquences cumulées croissantes ou le polygone des effectifs cumulés croissants par lecture graphique ou par interpolation linéaire : 0, 634%0, 4310,5%0, 431 1 80%60M%60 e 0, 2030, 069 1 20M%60 e 0, 203M%0, 203´60120´0, 0690, 203M11,38#12,18113,56 e e 13,56 0, 203M1 »66, 798 D’oùe 0, 203 i1p 1 1 å x1(n x#n x#.....#n x!1x1n x d) la moyenne arithmétique: c’estle nombre2 21 1i ip p. N N i11 4- Propriétés de la moyenne a) Moyenne et somme Lorsqu’on ajoute (ou retranche) un même nombre a à chacune des valeurs du caractère, sans changer  leseffectifs, la moyenne augmente (ou diminue) de a. b) Moyenne et produit  Lorsqu’onmultiplie chacune des valeurs du caractère par un même nombre k, sans changer les  effectifs,la moyenne est multipliée par k. Linéarité de la moyenne  Sion multiplie chaque valeur de la série par un réel a (a¹0), alors la moyenne est multipliée par a. a x#b  Siune série de valeurs xia pour moyenne, lasérie de valeursia pour moyenne x  a+ b.. On parle de linéarité de la moyenne x  Sion ajoute à chaque valeur de la série le réel b, alors la moyenne augmente de b. c) Moyenne de sous-groupesMoyennes partielles  Pourcalculer la moyenne d’une série de valeurs connaissant la moyennex d’unsous groupe d’effectif  Net lamoyenneyP , et f et (1du reste des valeurs d’effectif%f ) les pourcentages respectifs et on effectue le calcul suivant : Si une série est partagée en deux séries d’effectifs N et P, et de moyennes N´x#P´y z1  nede la série totale est. ouz1f x#(1%f)y. xetyalors la moyen N#P 5.dispersion ( caractère quantitatif )caractéristiques dea-Intervalle interquartile
.Définitions:la définition d’un quantile est analogue à celle de la médiane, les valeurs étant rangées  dansl’ordre croissant ( voir dessin ci-dessus ) Q .Le premier quartile1d'une série est la valeur du caractère qui correspond à la fréquence cumulée  de25 %. Q .Le troisième quartile3est la valeur du caractère qui correspond à la fréquence cumulée de 75 %. Q Q rvalle interquartile est l'intervalle[1;3].L’écart interqunombre :Q3 .L'inte artilec’est le%Q1. On détermine les quartiles de la même façon que la médiane . L'intervalle interquartile mesure la dispersion de la série .Il correspond à 50% de la population . On définie de même les déciles ( la série est partagée en 10 sous ensembles de même effectif) DDD On obtient :1;2;…….. ;9;D10( même technique) b. Variance et écart type  LAVARIANCE.d’une série est la moyenne des carrés des écarts de chaque valeur à la moyenne x  C’estun nombre positif. On la noteV(x) p p 2 1 N1nV(x)1n(x%x! OnnoteNl’effectif total soitåi. La variance est :åi i N i111 i1 p æ ö 1 2 2 V(x)1 çn´x¸%x  Poursimplifier les calculs on préfère utiliser la formule :åi i. ç ¸ N è ø i11 L’ÉCARTTYPd’une série est égal à la racine carrée de la variance notées1V(x). p1x#b Propriét :a et b étant deux réels fixés , si pour touti.variant de 1 jusqu’àxiai', alors V(x)1aV'(x) ets(x)1as'(x) Remarques : 1. La variance et l'écart%type servent à mesurer la dispersion de la série autour de sa moyenne. 2. Les calculatrices donnent généralement l'écart%type, mais pas lavariance. 3. Lorsque la série est répartie de façon uniforme autour de la moyenne x, alors environ 95% de  l'effectiftotal correspond à des valeurs situées dans l'intervalle[x2 ;x2 ] . 4. Si la série est regroupée en classes, on prend pour les xiles centres des classes. 5. L’écart type est un paramètre plus fin que l’étendue, car il tient compte de la répartition des valeurs.  L’écarttype à la même unité que les valeurs de la série étudiée.  L’écarttype mesure la dispersion des valeurs de la série autour de la moyenne .  Plusl’écart type est petit, plus les valeurs de la série sont concentrées autour de la moyenne. e-eenrammteboîiDga( boîtes à moustaches ou à pattes ) Un diagramme en boiteest un rectangle délimité par le premier quartile et le troisième quartile . QQ M  Pour l’obtenir, on trace un axe horizontal ( ou vertical ) sur lequel on place les valeurs de1,3ete.  L’un des côtés du rectangle a pour longueur l’écart interquartile, l’autre est quelconque. On complète ce Q  diagramme en traçant deux traits horizontaux : l’un joignant1au minimum de la série et l’autre joignant
Q 3au maximum de la série. .Ce diagramme est aussi appelé boîte à moustaches, les « moustaches » ayant pour extrémités Q QQbQ QQ a=1%1,5 (3%1=) et3+ 1,5 (31).
B-SERIE STATISTIQUES A DEUX VARIABLES
1. Généralités
xy On étudie simultanément deux caractèreset d’unemême population et on cherche une éventuelle liaison xy Entre ces deux caractères . On une série statistique à deux variableset .
(exemples: taille et poids ; vitesse et consommation). La régression fournit une expression de cette liaison sous la forme d’une fonction mathématique. La corrélationrenseigne sur l’intensité de cette liaison . Une série chronologiqueest une série statistique à deux variables où les observations échelonnés dans x Les temps .le caractèrecorrespond à des dates. Les données statistiques sont regroupées dans untableau d’effectifs x Tableau à deux lignes ( ou deux colonnes ): la première donne les valeurs deiet la seconde donne les y valeurs deicorrespondants. i Tableau à doubles entrées : il donne le nombre d’individus possédant simultanément la modalitéde xjy variable etla modalitévariable (voir exercice ). (x;y),iva 1jusqu’àN. N La série statistique est donc donné par tous les couplesi iriant deétant le nombre totale de valeurs ( dans certain cas , les valeurs peuvent être pondérées). M(x;y) Le nuage de pointsest , dans un repère orthogonal, l’ensemble des pointsi iivariant de 1 jusqu’àN.  Gx;yx Le point moyen d’un nuageest point( !,xétant la moyenne des valeurs du caractèreetyétant la y moyenne des valeurs du caractère. s(x)y x V(x) Notation : pour la variable, on noterasa variance etson écart-type ( idem pour). 2. Ajustement affine ff(x) Un ajustement consiste à trouver une fonctiontelle que la courbe d’équationpasse le plus près xy possible des points du nuage. On peut alors exprimer une liaison entreet àl’aide de cette fonction. Lorsque le nuage des points est à peu près rectiligne , on détermine une droite qui passe le plus prés f possible des points du nuage. On a alors un ajustement affine ( la fonctionest une fonction affine ). y1a x#b et .pourcela il ya plusieurs méthodes . 2.a. La méthode graphiqueconsiste à tracer , avec une règle , une droite « au jugé ». On détermine alors y1a x#b  Larelation graphiquement. y 2.b. La méthode de moindres carrés 7 M 3 6 Q 3 5 P P3 2 4 Q 2 M 2 3 2 1
Sur une droite d’ajustement , on M projette chaque pointidu nuage (Oy)P parallèlement à l’axeeni. yx La droite de régression deenest la n 2 å (D)M P droite telleque la sommei i, i11 soit minimale . M Ou bien on projette chaque pointidu (Ox)Q nuage parallèlement à l’axeeni. xy La droite de régression deenest la (D') droite telleque la somme
0 12 3 4 5 6 7 8 910 11 12x
n 2 M Q åi i, soit minimale. i11 xy On crée ainsi une dissymétrie entre les deux variableset quiconduit , suivant le problème à résoudre, à privilégier l’une des deux droites. n n æ ö 1 1 cov(x;y!= (xx )(yy ) =x yx y xyl :åi%i% çåi i¸ %La covariancele réeet estde la série à deux variables ç ¸ n n i11 i11 è ø cov(x;y) y (D)xy1a x#ba1 La droitede ena pour équation avecetbvérifieb1y%a x. V(x) xy On dit queest la variable explicative etest la variable à expliquer . cov(x;y) y (D')x x1a'y#b'a'1 La droitepour équationde en a avecetb'vérifieb'1y%a'x. V(y) yx On dit queest la variable explicative etest la variable à expliquer . y y (D)x(D')x Remarque: La droitede enet La droitede enpassent toutes les deux par pointGdu nuage. 2.c. Corrélationlinéaire Les points sont presque alignés si les deux droites de régression obtenues par la méthode de moindres carrés sont presque confondues. Celle-ci passe par le même pointG, alors leurs coefficient directeur sont presque 1 (D)a(D')' égaux . le coefficient directeur deest etcelui deesta1. D’oùaa'»1 . a cov(x;y) 2 r1 Le coefficient de corrélation linéaireest .On remarque quer1aa' . s(x)s(y) Propriété :%1£r£1. Plus les droites sont proches , plus la relation linéaire est importante .Donc sirest proche de 1, on dit xy Que la corrélation linéaire entreet estfortexyxy Remarque: Une forte causalité entreet impliqueune forte relation entreet quin’est pas forcément  linéaire; on n’adonc pas obligatoirement une corrélation linéaire .  Uneforte corrélation linéaire n’implique pas forcément une forte causalité.