Cours 10x

De
Publié par

METHODOLOGIE STATISTIQUEMounir MesbahCOURS 10Mardi 7 Décembre 2010METHODOLOGIE STATISTIQUE    Cours 10             Mardi 7 Décembre 2010Tests portant sur des échantillons appariés• Lestttestsvusj’jusqu’ààmaiitntenant néiécessittent des ééhchanttillilonsindépendants.• Cela était toujours le cas car ils portaient sur des échantillonsconstituésdesujetsdifférents.• Mais il existe des échantillons non indépendants ce quidemandedestestsappropriésPage : 21METHODOLOGIE STATISTIQUE    Cours 10             Mardi 7 Décembre 2010Exemples d’échantillons non indépendants(1) deux échantillons A et B composés de sujets dont on amesuré la tension artérielle, B étant constitué des mêmessujetsqueAvus6moisplustard.(2)deux échantillons composés desmêmessujets ayantreçussuccessivementdeuxantalgiquesAetB.(3) un échantillon de fumeurs et un échantillon de nonfumeurs constitués de la façon suivante : à chaque fumeur dupremieréchantillonestassociéunnonfumeurdemêmeâge.(4) un échantillon composé de tous les consultants d’uncentre de prévention pendant une année, et autre de tous lesconsultantsdel’annéesuivante.Pour les exemples 1 à 3, on parle de séries appariéesPage : 3METHODOLOGIE STATISTIQUE    Cours 10             Mardi 7 Décembre 2010Echantillons appariés1 : 1Echantillon 1                                                                              Echantillon 2S S11 21S S12 22 ...
Publié le : samedi 24 septembre 2011
Lecture(s) : 101
Nombre de pages : 20
Voir plus Voir moins
METHODOLOGIE  STATISTIQUE Mounir  Mesbah
COURS  10
Mardi  7  Décembre  2010
METHODOLOGIE  STATISTIQUE     Cours  10              Mardi  7  Décembre  2010
Tests  portant  sur  des  échantillons  appariés
 es es s vus usqu ma n enan n cess en es c an ons indépendants.
 Cela était toujours le cas car ils portaient sur des échantillons constitués de sujets différents.
demande des tests appropriés
Page  :  2
1
METHODOLOGIE  STATISTIQUE     Cours  10              Mardi  7  Décembre  2010 Exemples  déchantillons  non  indépendants (1) deux échantillons A et B composés de sujets dont on a sujets que A vus 6 mois plus tard. (2) deux échantillons composés des mêmes sujets ayant reçus successivement deux antalgiques A et B. (3) un échantillon de fumeurs et un échantillon de non fumeurs constitués de la façon suivante : à chaque fumeur du premier échantillon est associé un non fumeur de même âge. (4) un échantillon composé de tous les consultants dun centre de prévention pendant une année, et autre de tous les consultants de lannée suivante. Pour  les  exemples  1  à  3,  on  parle  de  séries  appariées Page  :  3
METHODOLOGIE  STATISTIQUE     Cours  10              Mardi  7  Décembre  2010
Echantillons  appariés 1  :  1 Echantillon  1                                                                               Echantillon  2
                                                                                                                                                                                                                                                                                                                                                                                                                                                      
Page  :  4
2
METHODOLOGIE  STATISTIQUE     Cours  10              Mardi  7  Décembre  2010 Comparaison  de  2  moyennes  sur  des  échantillons  indépendants (Rappel)    m 1  m 2 z O  = 2 2 s 1 + s 2 n 1 n 2 Le  test  peut  s'écrire  :   m 1  m 2 z O  = v a r ( m 1 m 2 ) 2 σ 2 1 car  :    var(m 1 m 2 )  =  var(m 1 )  +  var(m 2 )  = n 1 + n 22 Cette  dernière  égalité  nest  vraie  que  si  les  échantillons  sont  indépendants  : Le  test  Z  nest  valide  qui  si  les  échantillons  sont  indépendants. Page  :  5
METHODOLOGIE  STATISTIQUE     Cours  10              Mardi  7  Décembre  2010 Comparaison  de  2  moyennes  sur  des  séries  appariées      H o :  μ 1 =  μ 2 H 1 :  μ 1  μ 2 <=>  H o :  μ 1 μ 2 =  0              H 1 :  μ 1 μ 2 0 <=>  H o :   μ d =  0                    H 1 :  μ d 0  avec  d  =  x 1 x 2  Observations Echantillon 1 : X 1 Echantillon 2 : X 2 Différences : D = X 1 - X 2 = -m  m z = 1 2   X 12 X 22 D 2 =X 12 -X 22 O m . . . v a r ( m 1  m 2 ) . . . = m 1  m 2       m v a r ( m D ) . . . X 1i X 2i D i =X 1i -X 2i . . . . . . . . . X 1n X 2n D n =X 1n -X 2n Total Σ X 1i Σ X 2i Σ D i = Σ( X 1i -X 2i ) Moyenne m m m D 1 2 ² S ² Variances S 1 2 S D ²
Page  :  6
3
METHODOLOGIE  STATISTIQUE     Cours  10              Mardi  7  Décembre  2010 Comparaison  de  2  moyennes  sur  des  séries  appariées      H o :  μ 1 =  μ 2 H 1 :  μ 1  μ 2 = <=>  H o :   μ d =  0                    H 1 :  μ d 0  avec  d   x 1 x 2       O  m 1 2  m 2 N ( 0 , 1 ) z = s D n n d i d i2 ( d i ) 2 m d =  i = 1 n s 2d = 1 n      Petits  échantillons  n  <  30 n t O  = m 1 2  m 2   S t u d e n t à ( n - 1 ) d d l s D n = Condition  dapplication  :   D   X 1 X 2 a  une  distribution  normale
Page  :  7
METHODOLOGIE  STATISTIQUE     Cours  10              Mardi  7  Décembre  2010 Exemple Comparaison  de  la  croissance  pondérale  de  nouveau nés  nourris  avec  2  types  de  laits Appariement  sur  le  poids  de  naissance  à  ±50  g Paire  n° 1 2 3 4 5 6 7 8 9 10 11 12 Lait  1 0,95 0,85 1,02 0,88 0,79 0,65 1 0,9 0,75 0,95 0,65 0,45 Lait  2 0,98 1,02 1,15 0,75 0,88 0,79 1 0,59 0,86 0,78 0,72 0,75 = ‐ ‐ ‐ ‐ ‐ ‐ ‐ ‐ ‐ Paire  n° 13 14 15 16 17 18 19 20 21 22 23 24 Lait  1 0,64 0,68 0,99 1,01 0,76 0,72 0,75 0,86 0,54 0,58 0,8 0,92 Lait  2 0,55 0,95 0,96 1,02 0,68 0,95 0,84 0,75 0,95 0,62 0,58 0,83 d=x1 x2 0,09 0,27 0,03 0,01 0,08 0,23 0,09 0,11 0,41 0,04 0,22 0,09 Paire  n° 25 26 27 28 29 30 31 32 33 34 35 36 Lait  1 0,8 0,65 0,78 0,49 0,55 0,68 0,49 0,82 1 0,96 0,57 0,81 Lait  2 0 99 0 58 0 58 1 05 0 76 0 95 0 68 0 98 0 98 0 95 0 75 0 79 d=x1 x2 0,19 0,07 0,2 0,56 0,21 0,27 0,19 0,16 0,02 0,01 0,18 0,02      H o :  μ 1 =  μ 2 H 1 :  μ 1  μ 2 m 1 = 273,660=0,769 ; s 12 = 0 , 0 2 8 ; m 2 = 2 9 , 9 9 = 0 , 8 3 3 ; s 22 = 0 , 0 2 6 3 6 Page  :  8
4
METHODOLOGIE  STATISTIQUE     Cours  10              Mardi  7  Décembre  2010
3 6 d i = 2 , 3 d i2 =  1, 3 2 i = 1 = − 2 , 3  0 , 0 6 4 m d  = 2 1, 3 2 ( 2 , 3 ) s d2 = 3 5 3 6 = 0 , 0 3 4  m  0 , 0 6 4 z O  = 2D = = − 2 , 0 8 ; p < 0 , 0 4 s D 0 , 0 3 4 n 3 6 − − B : z O  = 2  2 =  =   = − , N s 1 +  s 2 0 , 0 2 8 + 0 , 0 2 6 0 , 0 5 4 n 1 n 2 3 6 3 6 3 6
Page  :  9
METHODOLOGIE  STATISTIQUE     Cours  10              Mardi  7  Décembre  2010 Test  des  signes  de  Wilcoxon (1) Test  des  signes  de  Wilcoxon Le test des signes de Wilcoxon est le pendant non paramétrique du test de Student pour échantillons appariés. Lorsque lhypothèse de normalité de la distribution des différences ne peut être assumée, il permet de tester lhypothèse dégalité des distributions sous jacentes que lon veut comparer. Comme pour le test de Student pour échantillons appariés : . Supposons que lon mesure chez les individus simultanément les caractères quantitatifs X et Y.
Page  :  10
5
METHODOLOGIE  STATISTIQUE     Cours  10              Mardi  7  Décembre  2010 Test  des  signes  de  Wilcoxon (2) On  observe  donc  un  échantillon {(X 1 ,Y 1 ),,  (X n ,Y n )}  de  n  paires  de  valeurs  (X i ,Y i ), de  la  distribution  conjointe  de  (X,  Y).  Les  distributions  marginales  théoriques  de  X  et  de  Y  sont  inconnues. On  souhaite  tester  l h othèse  nulle ue  ces  deux  distributions  théori ues  ont  des  paramètres  de  positions  (inconnues)  identiques. H 0 :  Position  distribution  théorique  de  X  =  Position  distribution  théorique  de  Y
Page  :  11
METHODOLOGIE  STATISTIQUE     Cours  10              Mardi  7  Décembre  2010 Test  des  signes  de  Wilcoxon (3) 1)  Soit  D i =  X i Y i les  différences  entre  les  deux  variables  appariées.  2)  Ordonnons  ces  différences  dans  lordre  croissant  de  leur  valeur  absolue.  3)  Notons  ainsi  |D| ,  la  ième valeur  absolue  de  ces  différences.  4)  Affectons  le  signe  aux  rangs  des  D i négatifs et  le  signe  + aux  rangs  des  D i positifs . Supposons  que  nous  nobservons  pas  dex aequos et  quaucune  valeur  D i nest  égale  à  zéro  (ce  cas,  pour  cette  année,  est  hors  programme) . 5)  Notons  W + ,  la  somme  des  rangs  affectés  des  signes  +.  Le  test  des  signes  de  Wilcoxon est  construit  à  partir  de  la  statistique  W + . La  loi  exacte  de  W + sous H 0 est  calculable. Néanmoins,  sa  connaissance  est  hors  programme. On  a,  sous  H 0 ,  le  résultat  exact  sur  les  moyennes  et  variance  théoriques  de  W+.
Page  :  12
6
METHODOLOGIE  STATISTIQUE     Cours  10              Mardi  7  Décembre  2010
Test  des  signes  de  Wilcoxon (4)           ,   0  
Loi  approchée  de  W X sous H 0 ,  pour  n 10,  on  a  le  résultat suivant :
Page  :  13
METHODOLOGIE  STATISTIQUE     Cours  10              Mardi  7  Décembre  2010 Test  des  signes  de  Wilcoxon (5) Exemple :  Comparaison  de  la  croissance  pondérale  de  nouveau nés  .  Appariement  sur  le  poids  de  naissance  à  ±50  g.  On  observe  10  paires a re n Lait 1 :X= 0,95 0,85 1,02 0,88 0,79 0,65 0,75 0,95 0,65 0,45 Lait 2 :Y= 0,98 1,02 1,15 0,76 0,88 0,79 0,86 0,79 0,72 0,75 D=X-Y= -0,03 -0,17 -0,13 0,12 -0,09 -0,14 -0,11 0,16 -0,07 -0,3 |D|= 0,03 0,17 0,13 0,12 0,09 0,14 0,11 0,16 0,07 0,30 R=Rank (|D|)= 1 9 6 5 3 7 4 8 2 10 S=Signe (D) -1 -1 -1 +1 -1 -1 -1 +1 -1 -1 Z = 10 W ( + 10 1 + 01()1(020 ++ 1)1/)/424 N (0,1) Z = W + 9 ,8217,5 N (0,1) W + =  somme  des  rangs  des  différences  positives.   W + =(5)+(8)=+13 Z o = 139,8217,5 = − 1, 48; NS. Remarque :  W =  somme  des  rangs  des  différences  négatives   =  (1)+(9)+6+3+7+4+2+10=+42 Z o = 42 27,5 = + 1, 48 Le  résultat  est  le  même  ,  NS,  au  signe  prêt  (sens  de  la  différence). 9,81 Page  :  14
7
METHODOLOGIE  STATISTIQUE     Cours  10              Mardi  7  Décembre  2010 Comparaison  de  2  pourcentages  sur  des  séries  appariées (1) Les  mêmes sujets  reçoivent  successivement   2  traitements  T 1 et  T 2 .  Supposons            ,         T 1 T 2 O 1 Succès O 1 O 2 p 1 = n Echec O 3 O 4 Total n n 2n p 2 = O 2  n   o  1  2   1  1  2 P 1 =  pourcentage  vrai  de  succès  au  traitement  1  =  E(p 1 ) P 2 =  pourcentage  vrai  de  succès  au  traitement  2  =  E(p 2 )
Page  :  15
METHODOLOGIE  STATISTIQUE     Cours  10              Mardi  7  Décembre  2010 Comparaison  de  2  pourcentages  sur  des  séries  appariées (2) H o :  P 1 =  P 2 H 1 :  P 1 P 2               sont  les  mêmes :  table  2  :  2x2,   succès  conditionnel  au  traitement   S/T 1 x  S/T 2 T1 Succès Echec Succès b O 2 a + c a p 1 = n T2 Echec c d O 4 a + b    = Total O 1 O 3 2n n
Remarque   on  déduit  immédiatement   de  la  table  2,  la  table  1  :  on  a  O 1 =  a+c,  O 2 =  a+b,  O 3 =  b+d  et  O 4 =  c+d
Page  :  16
8
Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.