La lecture en ligne est gratuite
Télécharger
Cours de biostatistique ./ Illustrations dans Diversite´sge´ne´tiquesettestsdhypoth`eses A.B. Dufour, J.R. Lobry & D. Chessel 31 mars 2008
Approchedelad´ecisionenstatistique.Testsstatistiquesetloide Mendel. Exergue. Unpapastatisticien,`alapsychologierugueuse,veut apprendrelesrudiments`asonls.Ilplace99pie`cesde0.1 e et 1 pi`ecede2 e surunetableetditPrendunepie`ceauhasard.Si tu l’as prise au hasard tu la gardes, sinon je te donne une claque ”. Lepetitprendlapie`cede2 e et une claque. ” Bon, tu n’as pas tout compris.Jetebandelesyeux.Prendunepi`eceauhasard.Situlas prise au hasard tu la gardes, sinon je te donne une claque ”. Le petit, quisem´ee,tireunpeusurlebandeau,voitlapi`ecede2 e et en prenduneautre.Tre`sbien,tuvoisquequandtunevoispas,tu tires au hasard ”. Commequoi,ilyaplusieursfa¸consdesefaireavoir.
1Approchedelad´ecisionenstatistique 1.1 Une petite introduction Lesfondateursdelathe´oriedestestsdhypoth`eses sont Jerzy Nyman et ErgonPearson,lsdeKarl.Neymanmentionnecependantqua`saconnais-sance,lapremie`reapprocheduntestdhypothe`seestduea`Laplaceen1812. Laconstructiondelath´eoriedestestsaeulieuentre1926et1933.Neymanet Pearsonpr´esententleurpointdevueduprobl`e´etantlechoixentre me comme deuxd´ecisions:accepterourefuserunehypothe`seprivil´egi´ee.Bienquecette approcheatendancea`disparaıˆtreauprotdesinterpr´etationssurlesintervalles deconanceetlesprobabilit´es p ,cestcellequenouspr´esenteronsdanscedo-cument. Notons´egalementquelide´edela signicativit´e d’un test a tout d’abord ´ete´propose´parFisherquivitdanslavaleur p unindicedelamesuredel´ecart entrelesdonn´eesetlhypoth`esenulle:pluslavaleurde p est petite, plus grand estl´ecart.Ild´efendit p = 0 05 comme un seuil standard. ’If P is between 0.1 and 0.9 there is certainly no reason to suspect the hypothesis tested. If it is below .02 it is strongly indicated that the hypothesis fails to account for the whole of the facts. We shall not often be astray if we draw a conventional line at 0.05 . . .’
1
A.B. Dufour, J.R. Lobry & D. Chessel
NeymanetPearsonsesontoppose´s`acetteapprochesubjectiveetontpropose´ uneapprocheded´ecisionthe´oriquelie´eauxre´sultatsduneexpe´rimentation. Unefoisde´niesuncertainnombredere`glesdede´cision,lere´sultatdelanalyse consistesimplement`aaccepterourejeterlhypoth`esenulle.
1.2Leparadigmedelade´cision Lestestsontpourbutdev´erier,a`partirdedonne´esobserve´esdansun ouplusieursechantillons,lavalidite´dhypothe`sesrelativesa`uneouplusieurs ´ populations.Pourcefaire,ilestn´ecessairedavoiruneproce´dureobjectivede rejetoudacceptationdunehypoth`ese. Andebiencomprendrelanatureduntest,nousallonsre´aliseruneanalogie aveclesyste`mejudiciaire.Unpre´venuestpre´sente´devantuntribunalparcequil estsoup¸connhypoth`esespeuventeˆtre´emises:lindividuest ´edemeurtre.Deux innocent,lindividuestcoupable.Lapremie`reestappele´e hypoth`esenulle et not´ee H 0 , la seconde hypothe`sealternative etnot´ee H 1 . Nous avons d’une part lar´ealit´e:lindividuestinnocentoulindividuestcoupable.Maiscetter´ealit´e estinconnuepourlesmembresdujury.Nousavonsdautrepart,lade´cisionque vaprendrecemeˆmejury.Lasituationdevientalorslasuivante. re´alite´inconnue H 0 H 1 d´ecision H 0 erreur II H 1 erreur I Ilyaquatrepossibilite´s:deuxsontfavorablesetdeuxsontde´favorables.Les deuxpossibilit´esfavorablessontlesde´cisionsdujuryenaccordaveclare´alite´: de´clarerlepr´evenuinnocentalorsquedanslar´ealite´,ilesteectivementinno-cent:de´clarerlindividucoupablealorsquedanslar´ealit´e,ilesteectivement coupable.Lesdeuxpossibilit´esde´favorablessontdeuxerreursjudiciaires:de´-clarerlindividuinnocentalorsquilestcoupable;d´eclarerlindividucoupable alorsquilestinnocent.Silhypoth`ese H 1 estchoisiequandlhypoth`ese H 0 est vraie, alors on dit qu’une erreurdepremie`reespe`ce a´et´ecommise.Silhy-pothe`se H 0 estchoisiequandenfaitlhypoth`ese H 1 est vraie, alors on dit qu’une erreurdedeuxie`meesp`eceae´tecommise . ´ Biensuˆr,nousvoudrionspouvoirprendreunede´cisionenminimisantles probabilite´sdecommettredeserreurs.Malheureusement,ilyauncompromis entreleserreursdepremi`ereetdedeuxi`emeesp`ecesquiempeˆchedeminimiser enmˆemetempslesdeuxprobabilit´es.LaformulationselonNeyman-Pearson accordantuneplaceprivil´egi´eea`lhypoth`esenulle H 0 revient`adirequele risquedepremie`reespe`ceestplusagrantquelerisquededeuxie`meespe`ce. Cetteformulationimposeunelimitesupe´rieure,tol´eranceassocie´eacerisque ` depremi`ereesp`ece,appele´le niveau de signification . Dans la description des r´esultatsduntest,beaucoupdestatisticienspre´f`erentlaphraseonae´choue´a` rejeterlhypothe`senulleplutoˆtquedireonacceptelhypoth`esenulle.Pour-quoi?parcequechoisirlhypothe`se H 0 ne signifie pas que H 0 est correcte mais seulementqueleniveaud´evidencecontre H 0 n’est pas suffisant pour garantir
LogicielRversion2.6.1(2007-11-26)bs04.rnwPage2/15Compil´ele2008-03-31 Maintenance : S. Penel, URL : http://pbil.univ-lyon1.fr/R/cours / bs04.pdf