METHODOLOGIE STATISTIQUEMounir MesbahCOURS 10Mardi 7 Décembre 2010METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010Tests portant sur des échantillons appariés• Lestttestsvusj’jusqu’ààmaiitntenant néiécessittent des ééhchanttillilonsindépendants.• Cela était toujours le cas car ils portaient sur des échantillonsconstituésdesujetsdifférents.• Mais il existe des échantillons non indépendants ce quidemandedestestsappropriésPage : 21METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010Exemples d’échantillons non indépendants(1) deux échantillons A et B composés de sujets dont on amesuré la tension artérielle, B étant constitué des mêmessujetsqueAvus6moisplustard.(2)deux échantillons composés desmêmessujets ayantreçussuccessivementdeuxantalgiquesAetB.(3) un échantillon de fumeurs et un échantillon de nonfumeurs constitués de la façon suivante : à chaque fumeur dupremieréchantillonestassociéunnonfumeurdemêmeâge.(4) un échantillon composé de tous les consultants d’uncentre de prévention pendant une année, et autre de tous lesconsultantsdel’annéesuivante.Pour les exemples 1 à 3, on parle de séries appariéesPage : 3METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010Echantillons appariés1 : 1Echantillon 1 Echantillon 2S S11 21S S12 22 ...
METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010
Tests portant sur des échantillons appariés
es es s vus usqu ma n enan n cess en es c an ons indépendants.
Cela était toujours le cas car ils portaient sur des échantillons constitués de sujets différents.
demande des tests appropriés
Page : 2
1
METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010 Exemples déchantillons non indépendants (1) deux échantillons A et B composés de sujets dont on a sujets que A vus 6 mois plus tard. (2) deux échantillons composés des mêmes sujets ayant reçus successivement deux antalgiques A et B. (3) un échantillon de fumeurs et un échantillon de non fumeurs constitués de la façon suivante : à chaque fumeur du premier échantillon est associé un non fumeur de même âge. (4) un échantillon composé de tous les consultants dun centre de prévention pendant une année, et autre de tous les consultants de lannée suivante. Pour les exemples 1 à 3, on parle de séries appariées Page : 3
METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010
METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010 Comparaison de 2 moyennes sur des échantillons indépendants (Rappel) m 1 − m 2 z O = 2 2 s 1 + s 2 n 1 n 2 Le test peut s'écrire : m 1 − m 2 z O = v a r ( m 1 − m 2 ) 2 σ 2 1 car : var(m 1 ‐ m 2 ) = var(m 1 ) + var(m 2 ) = n 1 + n 22 Cette dernière égalité nest vraie que si les échantillons sont indépendants : Le test Z nest valide qui si les échantillons sont indépendants. Page : 5
METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010 Comparaison de 2 moyennes sur des séries appariées H o : μ 1 = μ 2 H 1 : μ 1 ≠ μ 2 <=> H o : μ 1 ‐ μ 2 = 0 H 1 : μ 1 ‐ μ 2 ≠ 0 <=> H o : μ d = 0 H 1 : μ d ≠ 0 avec d = x 1 ‐ x 2 Observations Echantillon 1 : X 1 Echantillon 2 : X 2 Différences : D = X 1 - X 2 = -m − m z = 1 2 X 12 X 22 D 2 =X 12 -X 22 O m . . . v a r ( m 1 − m 2 ) − . . . = m 1 m 2 m v a r ( m D ) . . . X 1i X 2i D i =X 1i -X 2i . . . . . . . . . X 1n X 2n D n =X 1n -X 2n Total Σ X 1i Σ X 2i Σ D i = Σ( X 1i -X 2i ) Moyenne m m m D 1 2 ² S ² Variances S 1 2 S D ²
Page : 6
3
METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010 Comparaison de 2 moyennes sur des séries appariées H o : μ 1 = μ 2 H 1 : μ 1 ≠ μ 2 = <=> H o : μ d = 0 H 1 : μ d ≠ 0 avec d x 1 ‐ x 2 O m 1 − 2 m 2 ∼ N ( 0 , 1 ) z = s D n n d i d i2 ( d i ) 2 m d = i ∑ = 1 n s 2d = ∑ −− 1 ∑ n Petits échantillons n < 30 n t O = m 1 − 2 m 2 ∼ S t u d e n t à ( n - 1 ) d d l s D n = Condition dapplication : D X 1 ‐ X 2 a une distribution normale
METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010
3 6 ∑ d i = − 2 , 3 ∑ d i2 = 1, 3 2 i = 1 = − 2 , 3 − 0 , 0 6 4 m d = 2 1, 3 2 − ( 2 , 3 ) s d2 = 3 5 3 6 = 0 , 0 3 4 m − 0 , 0 6 4 z O = 2D = = − 2 , 0 8 ; p < 0 , 0 4 s D 0 , 0 3 4 n 3 6 − − B : z O = 2 2 = = = − , N s 1 + s 2 0 , 0 2 8 + 0 , 0 2 6 0 , 0 5 4 n 1 n 2 3 6 3 6 3 6
Page : 9
METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010 Test des signes de Wilcoxon (1) Test des signes de Wilcoxon Le test des signes de Wilcoxon est le pendant non paramétrique du test de Student pour échantillons appariés. Lorsque lhypothèse de normalité de la distribution des différences ne peut être assumée, il permet de tester lhypothèse dégalité des distributions sous jacentes que lon veut comparer. Comme pour le test de Student pour échantillons appariés : . Supposons que lon mesure chez les individus simultanément les caractères quantitatifs X et Y.
Page : 10
5
METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010 Test des signes de Wilcoxon (2) On observe donc un échantillon {(X 1 ,Y 1 ),, (X n ,Y n )} de n paires de valeurs (X i ,Y i ), de la distribution conjointe de (X, Y). Les distributions marginales théoriques de X et de Y sont inconnues. On souhaite tester l h othèse nulle ue ces deux distributions théori ues ont des paramètres de positions (inconnues) identiques. H 0 : Position distribution théorique de X = Position distribution théorique de Y
Page : 11
METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010 Test des signes de Wilcoxon (3) 1) Soit D i = X i ‐ Y i les différences entre les deux variables appariées. 2) Ordonnons ces différences dans lordre croissant de leur valeur absolue. 3) Notons ainsi |D| , la ième valeur absolue de ces différences. 4) Affectons le signe aux rangs des D i négatifs et le signe + aux rangs des D i positifs . Supposons que nous nobservons pas dex ‐ aequos et quaucune valeur D i nest égale à zéro (ce cas, pour cette année, est hors programme) . 5) Notons W + , la somme des rangs affectés des signes +. Le test des signes de Wilcoxon est construit à partir de la statistique W + . La loi exacte de W + sous H 0 est calculable. Néanmoins, sa connaissance est hors programme. On a, sous H 0 , le résultat exact sur les moyennes et variance théoriques de W+.
Page : 12
6
METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010
Test des signes de Wilcoxon (4) , 0
Loi approchée de W X sous H 0 , pour n ≥ 10, on a le résultat suivant :
Page : 13
METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010 Test des signes de Wilcoxon (5) Exemple : Comparaison de la croissance pondérale de nouveau ‐ nés . Appariement sur le poids de naissance à ±50 g. On observe 10 paires a re n Lait 1 :X= 0,95 0,85 1,02 0,88 0,79 0,65 0,75 0,95 0,65 0,45 Lait 2 :Y= 0,98 1,02 1,15 0,76 0,88 0,79 0,86 0,79 0,72 0,75 D=X-Y= -0,03 -0,17 -0,13 0,12 -0,09 -0,14 -0,11 0,16 -0,07 -0,3 |D|= 0,03 0,17 0,13 0,12 0,09 0,14 0,11 0,16 0,07 0,30 R=Rank (|D|)= 1 9 6 5 3 7 4 8 2 10 S=Signe (D) -1 -1 -1 +1 -1 -1 -1 +1 -1 -1 Z = 10 W ( + 10 − 1 + 01()1(020 ++ 1)1/)/424 ∼ N (0,1) Z = W + 9 − ,8217,5 ∼ N (0,1) W + = somme des rangs des différences positives. W + =(5)+(8)=+13 Z o = 139,8217,5 = − 1, 48; NS. Remarque : W ‐ = somme des rangs des différences négatives = (1)+(9)+6+3+7+4+2+10=+42 Z o = 42 − 27,5 = + 1, 48 Le résultat est le même , NS, au signe prêt (sens de la différence). 9,81 Page : 14
7
METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010 Comparaison de 2 pourcentages sur des séries appariées (1) Les mêmes sujets reçoivent successivement 2 traitements T 1 et T 2 . Supposons , T 1 T 2 O 1 Succès O 1 O 2 p 1 = n Echec O 3 O 4 Total n n 2n p 2 = O 2 n o 1 2 1 1 2 P 1 = pourcentage vrai de succès au traitement 1 = E(p 1 ) P 2 = pourcentage vrai de succès au traitement 2 = E(p 2 )
Page : 15
METHODOLOGIE STATISTIQUE Cours 10 Mardi 7 Décembre 2010 Comparaison de 2 pourcentages sur des séries appariées (2) H o : P 1 = P 2 H 1 : P 1 ≠ P 2 sont les mêmes : table 2 : 2x2, succès conditionnel au traitement S/T 1 x S/T 2 T1 Succès Echec Succès b O 2 a + c a p 1 = n T2 Echec c d O 4 a + b = Total O 1 O 3 2n n
Remarque on déduit immédiatement de la table 2, la table 1 : on a O 1 = a+c, O 2 = a+b, O 3 = b+d et O 4 = c+d