Séances 2 3 4  étude bivariée 07-08
13 pages
Français

Séances 2 3 4 étude bivariée 07-08

-

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
13 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

Etude bivariée Analyse de la dépendance (séances 2 à 4) 1 Tableaux : tri-croisé 1.1 Marginales (tri-à-plat) 1.2 Conditionnelles 1.3 Indépendance 1.4 Remarque sur les moments 2 La dépendance statistique entre deux variables 2.1 Mesure de l’écart à l’indépendance 22.2 Le coefficient du χ 3 Cas particulier : var. quantitative (Y) et var. qualitative (X) 3.1 Moyennes marginales et conditionnelles (Y|X) 3.2 Variances marginales et conditionnelles (Y|X) 3.3 Décomposition de la variance de Y 3.4 Concept de corrélation 23.5 Mesure de la dépendance η 4 Cas particulier : deux variables quantitatives 4.1 Courbe de régression 4.2 Droite de régression 4.3 Mesure de la corrélation linéaire PLAN du polycopié Exercices : …………………………………………………………………………………….……….…………. p. 2 Cas « vendeur n°1 » : inertie maximale …………………………………………………….……….…………. p. 4 Cas « vendeur n°2 » : inertie maxima……………………………………………….………….. p. 5 Cas « auto école » : dépendance, corrélation …………………………………………………………………... p. 6 Cas « assurance » : dépendance, corrélation, corrélation linéaire, DR, CR ..……………….……………….… p. 8 Cas « étudiant » : tableaux………………….…..…….………………………………….………………….….. p. 14 Exercice 1 : On voudrait savoir si le type d’auto-école (A, B, C, D ou E) a une influence sur le nombre d’accidents la première année de conduite. Pour cela, on observe les résultats pour 100 personnes : Tableau en effectif ...

Informations

Publié par
Nombre de lectures 46
Langue Français

Extrait

Etude bivariée
Analyse de la dépendance (séances 2 à 4)
1
Tableaux : tri-croisé
1.1 Marginales (tri-à-plat)
1.2 Conditionnelles
1.3 Indépendance
1.4 Remarque sur les moments
2
La dépendance statistique entre deux variables
2.1 Mesure de l’écart à l’indépendance
2.2 Le coefficient du
χ
2
3
Cas particulier : var. quantitative (Y) et var. qualitative (X)
3.1 Moyennes marginales et conditionnelles (Y|X)
3.2 Variances marginales et conditionnelles (Y|X)
3.3 Décomposition de la variance de Y
3.4 Concept de corrélation
3.5 Mesure de la dépendance
η
2
4
Cas particulier : deux variables quantitatives
4.1 Courbe de régression
4.2 Droite de régression
4.3 Mesure de la corrélation linéaire
PLAN du polycopié
Exercices
: …………………………………………………………………………………….……….………….
p. 2
Cas « vendeur n°1 »
: inertie maximale …………………………………………………….……….………….
p. 4
Cas « vendeur n°2 »
: inertie maximale …………………………………………………………….…………..
p. 5
Cas « auto école »
: dépendance, corrélation …………………………………………………………………...
p. 6
Cas « assurance »
: dépendance, corrélation, corrélation linéaire, DR, CR ..……………….……………….…
p. 8
Cas « étudiant »
: tableaux………………….…..…….………………………………….………………….…..
p. 14
2
Exercice 1 :
On voudrait savoir si le type d’auto-école (A, B, C, D ou E) a une influence sur le nombre
d’accidents la première année de conduite. Pour cela, on observe les résultats pour 100 personnes :
Tableau en effectif
Nombre d'accidents
Auto-école
0
1
2
3
4
A
2
6
4
2
1
15
B
5
10
8
1
1
25
C
10
15
4
1
0
30
D
5
3
5
7
0
20
E
1
2
4
2
1
10
23
36
25
13
3
100
Dépendance :
1. Calculer le tri-à-plat en effectif et en fréquence du
nombre d’accidents
. Quelle est la
‘probabilité’ (proportion) qu’une personne prise au hasard parmi les 100 ait eu 1 seul
accident ?
2. Donner le tri-à-plat en effectif et en fréquence du
nombre d’accidents
sachant que la
personne sort de l’
auto-école
A. De même pour B, C, D et E.
3. Comment s’appelle le tableau de l’ensemble des tris-à-plat en fréquence calculés à la
question précédente ?
4. Calculer le tri-à-plat de la variable
auto-école
. Quelle est la ‘probabilité’ (proportion) qu’une
personne prise au hasard parmi les 100 provienne de l’auto-école A ?
5. Calculer le tri-à-plat en effectif et en fréquence de l’
auto-école
sachant que le
nombre
d’accidents
est 0. De même si le
nombre d’accidents
est 1, 2, 3 ou 4.
6. Comment s’appelle le tableau de l’ensemble des tris-à-plat en fréquence calculés à la
question précédente ?
7. Les variables sont-elles dépendantes ? Justifier et donner une mesure de cette dépendance.
8. Quelle est la case du tableau croisé
auto-école / nombre d’accidents
qui contribue le plus au
khi2 ?
Corrélation
:
Moyennes
9. Calculer la moyenne du
nombre d’accidents
(sur les 100 personnes).
10. Calculer la moyenne du
nombre d’accidents
sachant que la personne sort de l’
auto-école
A (sur 15 personnes).
11. Calculer la moyenne du
nombre d’accidents
sachant que la personne sort de l’
auto-école
B (sur 25 personnes).
12. De même pour C, D et E (30, 20 et 10 personnes respectivement).
13. Représenter sous forme de tableau à 4 colonnes les valeurs des questions 10, 11 et 12 :
- colonne 1 : le type d’auto-école
- colonne 2 : le nombre de personnes de l’auto-école
- colonne 3 : le poids relatif de l’auto-école
- colonne 4 : la moyenne du
nombre d’accidents
de l’auto-école
14. Calculer la moyenne des moyennes du
nombre d’accidents
calculées pour chaque
auto-école
(se servir de la question précédente ; utiliser le poids relatif de l’auto-école).
3
Variance des moyennes
15. Représenter sous forme de tableau à 4 colonnes :
- colonne 1 : le type d’auto-école
- colonne 2 : le nombre de personnes de l’auto-école
- colonne 3 : le poids relatif de l’auto-école
- colonne 4 : les écarts à la moyenne
du nombre d’accidents
de l’auto-école
par rapport à la moyenne
du nombre d’accidents
global
16. Calculer la variance des moyennes du
nombre d’accidents
calculées pour chaque
auto-école
(se servir de la question précédente ; utiliser le poids relatif de l’auto-école).
Variances
17. Calculer la variance du
nombre d’accidents
(calcul sur les 100 personnes).
18. Calculer la variance du
nombre d’accidents
sachant que la personne sort de l’
auto-école
A
(calcul sur 15 personnes).
19. Calculer la variance du
nombre d’accidents
sachant que la personne sort de l’
auto-école
B
(calcul sur 25 personnes).
20. De même pour C, D et E (calcul avec 30, 20 et 10 personnes respectivement).
21. Représenter sous forme de tableau à 4 colonnes les valeurs des questions 10, 11 et 12 :
- colonne 1 : le type d’auto-école
- colonne 2 : le poids relatif de l’auto-école
- colonne 3 : la variance du
nombre d’accidents
pour chaque auto-école
Moyenne des Variances
22.
Calculer la moyenne des variances du
nombre d’accidents
calculées pour chaque
auto-école
(se servir de la question précédente utiliser le poids relatif de l’auto-école). Est-elle égale à
la variance du
nombre d’accidents ?
Rapport de corrélation
23. Calculer le rapport de corrélation du
nombre d’accidents
sachant l’
auto-école.
Interpréter.
Peut-on dire que les variables sont dépendantes ? Corrélées linéairement ?
Exercice 2 : cas « étudiants » (voir données en fin de polyccopié)
1) Représenter le nuage de points. Commenter.
2) Les variables sont-elles dépendantes ?
3) Peut-on mesurer la dépendance entre ces variables ?
4) Calculer les moyennes conditionnelles de
math
sachant
physique
. Représenter la CR
correspondante. Commenter la dispersion du nuage autour de la CR.
5) Calculer les moyennes conditionnelles du
physique
sachant
math
. Représenter la CR
correspondante. Commenter la dispersion du nuage autour de la CR.
6) Calculer la corrélation de
physique
sachant
math
. La corrélation de
math
sachant
physique
vaut-elle la même valeur ? Justifier puis calculer la. Commenter en termes de CR et de
nuage de points.
7) Calculer la covariance. Calculer le coefficient de corrélation linéaire de
physique
sachant
math
. La corrélation linéaire de
math
sachant
physique
vaut-elle la même valeur ? Justifier
puis donner la.
8) Calculer et représenter les droites de régression. Commenter.
9) Construire le tableau centré réduit.
10) Reprendre l’exercice avec les variables :
math
/
français
et
gym
/
histg
.
4
Cas « vendeur n°1»
(tableau avec inertie maximale)
Tableau en
X \ Y
A
B
C
D
E
Vendeur 1
30
0
0
0
10
40
Vendeur 2
0
20
0
0
0
20
Vendeur 3
0
0
0
30
0
30
Vendeur 4
0
0
10
0
0
10
30
20
10
30
10
100
Tableau en fréquence
X \ Y
A
B
C
D
E
Vendeur 1
0,3
0
0
0
0,1
0,4
Vendeur 2
0
0,2
0
0
0
0,2
Vendeur 3
0
0
0
0,3
0
0,3
Vendeur 4
0
0
0,1
0
0
0,1
0,3
0,2
0,1
0,3
0,1
1
Tableau dans le cas
d'indépendance
X \ Y
A
B
C
D
E
Vendeur 1
0,12
0,08
0,04
0,12
0,04
0,4
Vendeur 2
0,06
0,04
0,02
0,06
0,02
0,2
Vendeur 3
0,09
0,06
0,03
0,09
0,03
0,3
Vendeur 4
0,03
0,02
0,01
0,03
0,01
0,1
0,3
0,2
0,1
0,3
0,1
1
Ecart entre les
X \ Y
A
B
C
D
E
Vendeur 1
0,27
0,08
0,04
0,12
0,09
Vendeur 2
0,06
0,64
0,02
0,06
0,02
Vendeur 3
0,09
0,06
0,03
0,49
0,03
Vendeur 4
0,03
0,02
0,81
0,03
0,01
L’inertie vaut : 3
Le
χ
2
vaut : 300
Le
χ
2
max
: 300
L’indicateur de dépendance
χ
χ
/
2
max
2
: 1
5
Cas « vendeur n°2»
(tableau avec inertie maximale)
Tableau en
X \ Y
A
B
C
Vendeur 1
20
0
0
20
Vendeur 2
0
10
0
10
Vendeur 3
0
0
40
40
Vendeur 4
0
30
0
30
20
40
40
100
Tableau en fréquence
X \ Y
A
B
C
Vendeur 1
0,2
0
0
0,2
Vendeur 2
0
0,1
0
0,1
Vendeur 3
0
0
0,4
0,4
Vendeur 4
0
0,3
0
0,3
0,2
0,4
0,4
1
Tableau dans le cas d'indépendance
X \ Y
A
B
C
Vendeur 1
0,04
0,08
0,08
0,2
Vendeur 2
0,02
0,04
0,04
0,1
Vendeur 3
0,08
0,16
0,16
0,4
Vendeur 4
0,06
0,12
0,12
0,3
0,2
0,4
0,4
1
Ecart entre les fréquences
X \ Y
A
B
C
Vendeur 1
0,64
0,08
0,08
Vendeur 2
0,02
0,09
0,04
Vendeur 3
0,08
0,16
0,36
Vendeur 4
0,06
0,27
0,12
Contribution au
X \ Y
A
B
C
Vendeur 1
32%
4%
4%
Vendeur 2
1%
5%
2%
Vendeur 3
4%
8%
18%
Vendeur 4
3%
14%
6%
L’inertie vaut : 2
Le
χ
2
vaut : 200
Le
χ
2
max
: 200
L’indicateur de dépendance
χ
χ
/
2
max
2
: 1
6
Cas « auto-école»
Tableau en effectif
nombre d'accidents
Auto-école
0
1
2
3
4
A
2
6
4
2
1
15
B
5
10
8
1
1
25
C
10
15
4
1
0
30
D
5
3
5
7
0
20
E
1
2
4
2
1
10
23
36
25
13
3
100
Tableau en fréquence
Auto-école
0
1
2
3
4
A
0,02
0,06
0,04
0,02
0,01
0,15
B
0,05
0,10
0,08
0,01
0,01
0,25
C
0,10
0,15
0,04
0,01
0,00
0,30
D
0,05
0,03
0,05
0,07
0,00
0,20
E
0,01
0,02
0,04
0,02
0,01
0,10
0,23
0,36
0,25
0,13
0,03
1
Profil ligne
Auto-école
0
1
2
3
4
A
0,1333
0,4000
0,2667
0,1333
0,0667
B
0,2000
0,4000
0,3200
0,0400
0,0400
C
0,3333
0,5000
0,1333
0,0333
0,0000
D
0,2500
0,1500
0,2500
0,3500
0,0000
E
0,1000
0,2000
0,4000
0,2000
0,1000
Profil colonne
Auto-école
0
1
2
3
4
A
0,08696
0,16667
0,16
0,1538
0,33333
B
0,21739
0,27778
0,32
0,0769
0,33333
C
0,43478
0,41667
0,16
0,0769
0
D
0,21739
0,08333
0,2
0,5385
0
E
0,04348
0,05556
0,16
0,1538
0,33333
Tableau dans le cas d'indépendance en fréquence
Auto-école
0
1
2
3
4
A
0,0345
0,054
0,0375
0,0195
0,0045
B
0,0575
0,09
0,0625
0,0325
0,0075
C
0,069
0,108
0,075
0,039
0,009
D
0,046
0,072
0,05
0,026
0,006
E
0,023
0,036
0,025
0,013
0,003
Tableau dans le cas d'indépendance en effectif
Auto-école
0
1
2
3
4
A
3
5
4
2
0
B
6
9
6
3
1
C
7
11
8
4
1
D
5
7
5
3
1
E
2
4
2
1
0
7
Calcul de l’inertie
Auto-école
0
1
2
3
4
A
0,00609
0,00067
0,00017
1E-05
0,00672
B
0,00098
0,00111
0,0049
0,0156
0,00083
C
0,01393
0,01633
0,01633
0,0216
0,009
D
0,00035
0,0245
3,5E-32
0,0745
0,006
E
0,00735
0,00711
0,009
0,0038
0,01633
Contribution au khi deux
Auto-école
0
1
2
3
4
A
2,32%
0,25%
0,06%
0,00%
2,56%
B
0,37%
0,42%
1,86%
5,92%
0,32%
C
5,29%
6,21%
6,21%
8,20%
3,42%
D
0,13%
9,31%
0,00%
28,30%
2,28%
E
2,79%
2,70%
3,42%
1,43%
6,21%
L’inertie vaut : 0.2631
Le
χ
2
vaut : 26,31
Le
χ
2
max
: 400
L’indicateur de dépendance
χ
χ
/
2
max
2
: 0.2564
Moments de Y
Moyenne
1,37
Variance
1,1331
Moments
modalités
m(y|x)
var(y|x)
conditionnels
de X
de Y
A
1,60
1,173
B
1,32
0,938
C
0,87
0,582
D
1,70
1,410
E
2,00
1,200
Décomposition de la variance de Y en fonction de X (12,88%)
v(m(y|x)) + m(v(y|x))
= v(y)
0,1460
0,9871
1,1331
8
Cas « assurance »
Tableau en effectif
âge du
Nombre d'accidents
conducteur
0
1
2
3
4
22
0
0
2
6
7
30
6
15
8
1
0
38
13
8
4
0
0
46
1
2
11
1
0
54
0
0
5
7
3
20
25
30
15
10
Tableau en fréquence
âge du
Nombre d'accidents
conducteur
0
1
2
3
4
22
0
0
0,02
0,06
0,07
30
0,06
0,15
0,08
0,01
0
38
0,13
0,08
0,04
0
0
46
0,01
0,02
0,11
0,01
0
54
0
0
0,05
0,07
0,03
0,2
0,3
0,3
0,2
0,1
Profil ligne : lois conditionnelles accidents | âge
âge du
Nombre d'accidents
conducteur
0
1
2
3
4
22
0
0
0,13
0,40
0,47
30
0,20
0,50
0,27
0,03
0
38
0,52
0,32
0,16
0
0
46
0,07
0,13
0,73
0,07
0
54
0
0
0,33
0,47
0,20
Profil colonne : lois conditionnelles âge | accidents
âge du
Nombre d'accidents
conducteur
0
1
2
3
4
22
0
0
0,07
0,40
0,70
30
0,30
0,60
0,27
0,07
0
38
0,65
0,32
0,13
0
0
46
0,05
0,08
0,37
0,07
0
54
0
0
0,17
0,47
0,30
Tableau dans le cas d'indépendance en fréquence
âge du
Nombre d'accidents
conducteur
0
1
2
3
4
22
0,03
0,0375 0,045
0,0225
0,015
30
0,06
0,075
0,09
0,045
0,03
38
0,05
0,0625 0,075
0,0375
0,025
46
0,03
0,0375 0,045
0,0225
0,015
54
0,03
0,0375 0,045
0,0225
0,015
Tableau dans le cas d'indépendance en effectif
âge du
Nombre d'accidents
conducteur
0
1
2
3
4
22
3
3,75
4,5
2,25
1,5
30
6
7,5
9
4,5
3
38
5
6,25
7,5
3,75
2,5
46
3
3,75
4,5
2,25
1,5
54
3
3,75
4,5
2,25
1,5
Le
χ
2
vaut 101.13, le
χ
2
max
= 400, l’indicateur de dépendance
χ
χ
/
2
max
2
= 0.5028
9
La p-valeur vaut 2 E-14.
ETUDE DE LA DEPENDANCE
ETUDE DE LA CORRELATION
10
ACCIDENTS
EN FONCTION DE
AGE
AGE
EN FONCTION DE
ACCIDENTS
11
ETUDE DE LA CORRELATION LINEAIRE (
ACCIDENTS
EN FONCTION DE
AGE)
  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents