1 Département de mathématiques et de génie industriel MTH 2302D – Probabilités et statistique TD-xx: tests 2 moyennes /ajustement/ régression linéaire simple DATE avril 2010 HMGB x.y Hines, W.W., Montgomery, D.C., Goldsman, D.M., Borror, C.M. Probabilités et statistique pour ingénieurs x = chapitre y = numéro W x.y site WEB http://www.cours.polymtl.ca/mth6301/MTH2302.htm Exercices supplémentaires x = chapitre y = numéro No 1 – Test d’égalité de 2 moyennes avec STATISTICA - HMGB 11.20 Fichier de données : TD-tests.sta ou TD-tests.xls Disponible sur le site Web du cours dans la section Séances de Travaux dirigés (TD) Mise en œuvre avec STATISTICA voir Annexe 1 page 4 2 No 2 – Test d’ajustement du khi-deux avec STATISTICA - HMGB 11.48 Fichier de données TD-tests.sta ou TD-tests.xls disponible sur le site Web du cours dans la section Séances de Travaux dirigés (TD) Mise en œuvre avec STATISTICA voir Annexe 2 page 5 3 No 3 : régression linéaire simple Fichier de données TD-tests.sta ou TD-tests.xls disponible sur le site Web du cours dans la section Séances de Travaux dirigés (TD) Le fichier contient 4 couples de variables, (X1, Y1), (X2, Y2), (X3, Y3) et (X4, Y4). On considère un modèle de régression linéaire simple (droite de ...
1 Département de mathématiques et de génie industriel MTH 2302D–Probabilités et statistique TDxx:tests 2 moyennes /ajustement/ régression linéaire simple DATEavril 2010 HMGB x.yHines, W.W.,Montgomery, D.C.,Goldsman, D.M.,Borror, C.M. Probabilités et statistique pour ingénieursx= chapitrey= numéro W x.ysite WEBhttp://www.cours.polymtl.ca/mth6301/MTH2302.htmExercices supplémentairesx= chapitrey= numéro No 1–Test d’égalité de 2 moyennes avecSTATISTICAHMGB 11.20 Fichierde données : TDtests.staou TDtests.xls Disponiblesur le site Web du cours dansla section Séances de Travaux dirigés (TD) Mise en œuvre avecSTATISTICA voirAnnexe 1 page 4
No 2–Test d’ajustement du khideux avecSTATISTICA HMGB 11.48 Fichier de données TDtests.staou TDtests.xls disponiblesur le site Web du cours dansla section Séances de Travaux dirigés (TD) Mise en œuvre avecSTATISTICA voirAnnexe 2 page 5
2
No 3: régression linéaire simple Fichierde données TDtests.staou TDtests.xls disponiblesur le site Web du coursdans la sectionSéances de Travaux dirigés (TD) Le fichier contient 4 couples de variables, (X1, Y1), (X2, Y2), (X3, Y3) et (X4, Y4). On considère un modèle de régression linéaire simple (droite de régression) pour expliquer Y en fonction de X pour chacun des 4 couples (X, Y): modèle 1 :Y1= β0+ β1X1+ εmodèle 2 :Y2= β0+ β1X2+ εmodèle 3 :Y3= β0+ β1X3+ εmodèle 4 :Y4= β0+ β1X4+ ε3a) Compléter les valeurs manquantes du tableau ci bas. Ces informations peuvent se lire sur les tableaux obtenus avec le module de STATISTICA:« Multiple Regression »modèle 2 β0β1SSR SSE RSST couple 1(X1, Y1) 2(X2, Y2) 3(X3, Y3) 4(X4, Y4) 2 R :(aussi appelé coefficient de détermination)fraction de variation de Y expliqué par X SSR :somme de carrés de régression (expliquée) par le modèle SSE :somme de carrés résiduelle (erreur) SST: somme(page 407 du manuel)des carrés totale de Y Commentez le tableau. 3b)Tracez, pour chacun des 4 couples de variables, un nuage de points(« 2Dscatterplots »)illustrant la variation de Y en fonction de X. 3a).graphiques. Faites un lien avec le commentaire enCommentez les 3c)Pour chacun des 4 couples de variables, tracer un graphique des résidus en fonction de la variable explicativeX.3b).Commentez. Faites un lien avec votre commentaire en 3d)Pour chacun des 4 couples de variables, tracer un graphique des résidus sur échelle de probabilité gaussienne.Commentez. 3e)Considérons le couple (X3, Y3). La droite de régression estelleaffectée s’il s’avère que l’observation (X3 =13, Y3 = 12,74) est le résultat d’une erreur et peut être éliminée.Refaire les calculs sans cette Observation. Le modèle estiladéquat avec cette observation? 2 Quedevient alors la valeur decette observation?R sans
3
4 ANNEXE 1avecTEST tde StudentSTATISTICALe test tcompte parmi les procédures statistiques les plus fréquemment employées. Il sert à comparer les différences de moyennes entre deux groupes. Le test suppose que les variables sont normalement distribuées et que les variances de chaque groupe sont égales. Le moduleStatistiques Élémentairesoffre 4 sortes de tests t. Test t :deux échantillons indépendants, par groupes Une variables codesour les 2rou eset une autre variable contientles mesures.
ANNEXE 2Tests d’ajustement de distributions avecSTATISTICAGraphique QuantileQuantile: QQplot Graphique ProbabilityProbability: PP plot Le graphiqueQuantileQuantile(QQ)est utile pour déterminer si une distributionprovenant d’unefamille de lois est compatible avec les données.Voici un exemple d’un graphique quantilequantile QQ.
5 Afin de déterminer si une distribution théorique, représentée par sa fonction de répartition F,s’ajuste à des données observées, les valeurs observées y1, y2,.. yn sontordonnées y(1)... < y <(n). Les valeursdes quantiles théoriques x(i)1 1 définies par x(i)(i /(n += F(3/8)la fonction de répartition inverse.), oùF est Une droite de moindres carrés est ajustée sur les couples (x(i), y(i)). Si les couples observes se situent près de la droite ajustée, alors on peut considérer que les observationsy1, y2,.. yn sont compatibles avec la distribution postulée. Cet examen visuel est subjectif, non discriminant et il sert surtout à rejeter une distribution postulée. Si une distribution est compatible, il ne faut pas penser avoir démontré que c’estlaseule distribution quipuisse représenter les données. L’équation de la droite Y = a + bxest donnée sur le graphique à la troisième ligne du titre :aest unseuiletb est un paramètred’échelle. Dans le cas des distributionsexponentielle,extreme, normale etRayleigh, aucun paramètre additionnel est nécessaire. Dans le cas des distributionsBeta,Gamma,Lognormale,Weibullon doit préciser unparamètre de forme. Celuici peut être spécifié par l’utilisateur ou, le plus souvent, on laissera le programme enfaire l’estimation avec les données. Le paramètre de forme est donné dans le titre du graphique.
Annexe 3 :Test d’ajustement du khideux
Graphique QQ plot avec STATISTICA
Le moduleDistribution Fittingajuste des données à des distributions et fait le calcul du test d’ajustementKhideux (ChiSquare)