Etude de cas 4 salaires SOL

De
Publié par

SOLUTIONS - ETUDE DE CAS N°4 : salaires Une employée de l’entreprise PRISE se demande si son salaire n’est pas inférieur à celui des autres employés. Elle ne gagne que 33000$ brut par an. Elle se plaint à son patron. Celui-ci lui promet de mener l’enquête et d’ajuster le salaire de son employé si celui-ci est vraiment inférieur à la moyenne. Le patron, qui n’y connaît rien en statistique, aimerait un peu d’aide pour analyser les salaires de ces 474 autres employés. salaires.prn : étude des salaires dans une entreprise (474*8) SALARY (QT) : salaire brut actuel (en $/an) SALBEGIN (QT) : salaire brut de départ (en $/an) JOBTIME (QT) : nombre de mois depuis l’entrée dans l’entreprise PRISE PREVEXP (QT) : nombre de mois de travail avant l’entrée dans l’entreprise PRISE EDUC (QT) : nombre d’année d’études MINORITY (QL) : appartenance à un minorité (0=Non, 1=Oui) SEX (QL) : sexe (0=Homme, 1=Femme) 1. Importez les données de EXCEL en SPSS/SAS 2. Mettez des labels aux variables et aux catégories des variables catégorielles. 3. Histogramme / Statistiques Descriptives : Représentez graphiquement la distribution des salaires actuels et résumez-là en quelques indices. Que pouvez-vous déjà en dire au patron ? 12010080604020Mean = $34.419,57Std. Dev. = $17.075,6610$20.000 $40.000 $60.000 $80.000 $100.000 $120.000 N = 474salary DescriptivesStatistic Std. Errorsalary Mean $34,419.57 $784.31195% Confidence Lower Bound $32,878 ...
Publié le : vendredi 23 septembre 2011
Lecture(s) : 60
Nombre de pages : 10
Voir plus Voir moins
SOLUTIONS  ETUDE DE CAS N°4 : salaires Une employée de l’entreprise PRISE se demande si son salaire n’est pas inférieur à celui des autres employés. Elle ne gagne que 33000$ brut par an. Elle se plaint à son patron. Celuici lui promet de mener l’enquête et d’ajuster le salaire de son employé si celuici est vraiment inférieur à la moyenne. Le patron, qui n’y connaît rien en statistique, aimerait un peu d’aide pour analyser les salaires de ces 474 autres employés. salaires.prn : étude des salaires dans une entreprise (474*8) SALARY(QT) : salaire brut actuel (en $/an) SALBEGIN(QT) : salaire brut de départ (en $/an) JOBTIME(QT) : nombre de mois depuis l’entrée dans l’entreprise PRISE PREVEXP(QT) : nombre de mois de travail avant l’entrée dans l’entreprise PRISE EDUC(QT) : nombre d’année d’études MINORITY(QL) : appartenance à un minorité (0=Non, 1=Oui) SEX(QL) : sexe (0=Homme, 1=Femme) 1.Importezles données de EXCEL en SPSS/SAS 2.Mettez des labelsaux variables et aux catégories des variables catégorielles. 3.Histogramme / Statistiques Descriptives: Représentez graphiquement la distribution des salaires actuels et résumezlà en quelques indices. Que pouvezvous déjà en dire au patron ?
120
100
80
60
40
20 Mean = $34.419,57 Std. Dev. = 0 $17.075,661 $20.000 $40.000 $60.000 $80.000 $100.000 $120.000 N = 474 salary
salary
Mean 95% Confidence Interval for Mean
Descriptives
Lower Bound Upper Bound
Statistic $34,419.57 $32,878.40
$35,960.73
Std. Error $784.311
5% Trimmed Mean $32,455.19 Median $28,875.00 Variance 291578214,453 Std. Deviation $17,075.661 Minimum $15,750 Maximum $135,000 Range $119,250 Interquartile Range $13,163 Skewness 2,125 ,112 Kurtosis 5,378 ,224 4.Test sur une moyenne:Testez si le salaire de cette employée est effectivement inférieur à la moyenne générale. Quelles sont les hypothèses sousjacentes à ce test ? Sontelles valides ? Si ça n’est pas le cas, effectuez une transformation adéquate avant d’appliquer le test.
salary
salary
N 474
t 3,085
One-Sample Statistics
Mean $34,419.57
df 473
Std. Deviation $17,075.661
One-Sample Test
Std. Error Mean $784.311
Test Value = 32000
Sig. (2-tailed) ,002
Mean Difference $2,419.568
95% Confidence Interval of the Difference Lower Upper $878.40 $3,960.73
One-Sample Test
Mean Difference -,01671
Sig. (2-tailed) ,360
Normal Q-Q Plot of salary
Test Value = 10.3735
logsalary
9,5
10,0
12,0
11,5
11,0
10,5
50.000 Observed Value
9,5
9,0 9,0
100.000
N a,b Normal Parameters Mean Std. Deviation Most Extreme Absolute Differences Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Test distribution is Normal. b. Calculated from data.
12,0
11,0
Normal Q-Q Plot of lnsalary
95% Confidence Interval of the Difference Lower Upper -,0526 ,0192
One-Sample Statistics
11,5
10,0 10,5 Observed Value
t -,915
logsalary
N 474
60.000
40.000
20.000
-20.000
0
Std. Deviation ,39733
N a,b Normal Parameters Mean Std. Deviation Most Extreme Absolute Differences Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Test distribution is Normal. b. Calculated from data.
100.000
80.000
One-Sample Kolmogorov-Smirnov Test
logsalary 474 10,3568 ,39733 ,136 ,136 -,067 2,953 ,000
One-Sample Kolmogorov-Smirnov Test
Mean 10,3568
df 473
0
Std. Error Mean ,01825
salary 474 $34,419.57 $17,075.661 ,208 ,208 -,143 4,525 ,000
60
50
40
30
20
10 Mean = 10,3568 Std. Dev. = 0 0,39733 10,00 10,50 11,00 11,50 N = 474 logsalary 5.Graphe XY / Coefficient de corrélations: Analysez graphiquement le lien entre le salaire actuel et les autres variables quantitatives. Quelle variable semble la plus liée linéairement au salaire actuel ? Si vous hésitez entre plusieurs variables, tranchez à l’aide d’un indice numérique adéquat.
$140.000
$120.000
$100.000
$80.000
$60.000
$40.000
$20.000
$0
$0
$20.000
$40.000 salbegin
R Sq Linear = 0,775
$60.000
$80.000
$140.000
$120.000
$100.000
$80.000
$60.000
$40.000
$20.000
$0
60
70
80 jobtime
R Sq Linear = 0,007
90
100
$140.000
$120.000
$100.000
$80.000
$60.000
$40.000
$20.000
$0
$140.000
$120.000
$100.000
$80.000
$60.000
$40.000
$20.000
$0
0
0,00
100
100,00
200,00
200 300 prevexp
300,00 Total
400,00
R Sq Linear = 0,009
400
500
R Sq Linear = 0,008
500,00
Correlations
600,00
$140.000
$120.000
$100.000
$80.000
$60.000
$40.000
$20.000
$0
8
10
12
14 16 educ
18
20
22
salary salbegin jobtime prevexp educ salary Pearson Correlation 1 ,880* ,084 -,097* ,661** Sig. (2-tailed) ,000 ,067 ,034 ,000 N 474 474 474 474 474 salbegin Pearson Correlation ,880** 1 -,020 ,045 ,633** Sig. (2-tailed) ,000 ,668 ,327 ,000 N 474 474 474 474 474 jobtime Pearson Correlation ,084 -,020 1 ,003 ,047 Sig. (2-tailed) ,067 ,668 ,948 ,303 N 474 474 474 474 474 prevexp Pearson Correlation -,097* ,045 ,003 1 -,252** Sig. (2-tailed) ,034 ,327 ,948 ,000 N 474 474 474 474 474 educ Pearson Correlation ,661** ,633* ,047 -,252* 1 Sig. (2-tailed) ,000 ,000 ,303 ,000 N 474 474 474 474 474 **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). 6.Ecrire l’équation du modèle, ajuster, graphe des résidus, qqplot, transformation de variables, IP: Ajuster un modèle qui expliquerait le salaire actuel en fonction de la variable la plus liée. Ecrivez l’équation du modèle estimé et validez les hypothèses sur les résidus. Que suggérezvous comme transformation suite à l’analyse des résidus ? Ajustez le nouveau modèle et validez les hypothèses
1,0
Normal P-P Plot of Regression Standardized Residual
Std. Error of the Estimate ,18415
Sig. ,031 ,000
b Model Summary
0,8
Sig. ,003 ,000
Dependent Variable: salary
a Coefficients
0,2 0,4 0,6 Observed Cum Prob
5,0
7,5
sur les résidus. Quelle valeur de salaire actuel serait prédite pour l’employée plaignante sachant que son salaire de départ était de 20000$ par an ? Quantifiez l’incertitude sur cette prédiction et concluez si son salaire actuel de 32000$ est effectivement inférieur à celui qu’elle devrait avoir ?
0,4
0,6
0,0 0,0
0,2
0,8
1,0
t 3,038 41,593
Standardized Coefficients Beta
2,5
0,0
-2,5
-5,0
8
0 2 4 6 Regression Standardized Predicted Value
-2
,886
Scatterplot
Dependent Variable: salary
Adjusted Model R R Square R Square a 1 ,886 ,786 ,785 a. Predictors: (Constant), lnsalbegin b. Dependent Variable: lnsalary
Unstandardized Coefficients Model B Std. Error 1 (Constant) ,705 ,232 lnsalbegin ,998 ,024 a. Dependent Variable: lnsalary
t 2,170 40,276
,880
Std. Error of the Estimate $8,115.356
a Coefficients
b Model Summary
Standardized Coefficients Beta
Adjusted Model R R Square R Square a 1 ,880 ,775 ,774 a. Predictors: (Constant), salbegin b. Dependent Variable: salary
Unstandardized Coefficients Model B Std. Error 1 (Constant) 1928,206 888,680 salbegin 1,909 ,047 a. Dependent Variable: salary
Normal P-P Plot of Regression Standardized Residual
1,0
0,8
0,6
0,4
0,2
Dependent Variable: lnsalary
6
4
2
0
-2
Scatterplot
Dependent Variable: lnsalary
0,0 0,0 0,2 0,4 0,6 0,8 1,0-2 -1 0 1 2 3 4 5 Observed Cum ProbPredicte d Stand ard ized R egression V alue prédiction de lnsalary: 10,59044 => prédiction de salary: exp(10,59044)=39752.98 IP pour lnsalary: [10,22803 ; 10,95285 ] => IP pour salary : [27667.95 ; 57116.6] 7.Graphe en barres / Test sur 1 proportion / Test sur 2 moyennes / Sélection d’une partie des données: Le patron s’attend à ce que l’employée se plaigne également en disant que les femmes gagnent moins que les hommes dans cette entreprise. De plus, il craint qu’elle n’ose dire que les employés qui font partie d’une minorité comme elle (elle est grècque) gagnent moins que les autres. Analysez graphiquement s’il semble y avoir autant d’hommes que de femmes dans cette entreprise et s’il semble y avoir moins d’employés issus de minorité que le contraire. Le patron peutil affirmer que, à la vue de ses données, on ne peut pas dire que la proportion de femmes dans l’entreprise est plus petite que 50%. Représentez graphiquement les salaires actuels en fonction du sexe et en fonction de l’appartenance à une minorité. Qu’observezvous? Le patron peutil affirmer que, à la vue de ses données, on ne peut pas dire que les femmes gagnent moins que les hommes. Quelles sont les hypothèses pour pouvoir faire ce genre de test. Sontelles rencontrées ici?
300
250
200
150
100
50
0
54,43% 258
0
sex
45,57% 216
1
400
300
200
100
0
370 78,06%
No
minority
104 21,94%
Yes
sex
Mean $41,441.78 $26,031.92
N 258 216
sex 0 1
0
Group Statistics
$0
df
t
salary 258 $41,441.78 $19,499.214 ,208 ,208 -,147 3,337 ,000
472
10,945
N a,b Normal Parameters Mean Std. Deviation Most Extreme Absolute Differences Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Test distribution is Normal. b. Calculated from data.
383
Std. Error Difference
$12,643.322
t-test for Equality of Means
$1,407.906
,000
$15409.86
Sig. (2-tailed)
Mean Difference
minority
$140.000
Sex=0
$100.000
$120.000
29
32 343 103 454 431 71 66 88 129 387
$80.000
Equal variances assumed Equal variances not assumed
salary
29
salary
$120.000
$100.000
$140.000
32 343 103 454 431
371 240 80 168 242
One-Sample Kolmogorov-Smirnov Test
Std. Error Mean $1,213.968 $514.258
H0: proportion de femmes³0.50 contre H1: proportion de femmes < 0.50 Zobservé = 1.929124 < Z0.95= 1.64 (test unilatéral pas faisable directement dans SPSS ou SAS Enterprise Guide)
,000
119,669
Sig.
F
Levene's Test for Equality of Variances
Std. Deviation $19,499.214 $7,558.021
Sex=1
$80.000
$40.000
$60.000
$20.000
$0
447 146
Yes
446
430 341
$40.000
$20.000
11,688
No
$60.000
Independent Samples Test
,000
344,262
1
95% Confidence Interval of the Difference Lower Upper
$18,176.401
$12,816.728
$18,002.996
$15409.86
$1,318.400
Group Statistics
One-Sample Kolmogorov-Smirnov Test
One-Sample Kolmogorov-Smirnov Test
Equal variances assumed Equal variances not assumed
Sig.
Levene's Test for Equality of Variances
F
N 258 216
58,750
N a,b Normal Parameters Mean Std. Deviation Most Extreme Absolute Differences Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Test distribution is Normal. b. Calculated from data.
Independent Samples Test
t
13,127
,000
logsalary 258 10,5446 ,39858 ,156 ,156 -,075 2,505 ,000
N a,b Normal Parameters Mean Std. Deviation Most Extreme Absolute Differences Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Test distribution is Normal. b. Calculated from data.
salary 216 $26,031.92 $7,558.021 ,146 ,146 -,088 2,141 ,000
logsalary 216 10,1325 ,25404 ,098 ,098 -,055 1,447 ,030
N a,b Normal Parameters Mean Std. Deviation Most Extreme Absolute Differences Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Test distribution is Normal. b. Calculated from data.
Mean 10,5446 10,1325
sex 0 1
df
,41215
Std. Error Difference
442,401
,000
t-test for Equality of Means
,47159
,35272
,03024
95% Confidence Interval of the Difference Lower Upper
,47385
,35046
Mean Difference
,03140
Sig. (2-tailed)
,000
472
,41215
13,629
One-Sample Kolmogorov-Smirnov Test
Std. Error Mean ,02481 ,01728
Sex=1
Sex=0
Std. Deviation ,39858 ,25404
logsalary
logsalary
Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.