2 Statistique En g´en´erale, je vais vous donner un jeu de donn´ees (comme dans le cours) avec une description de ce qu’ils representent, une hypoth`ese (verbale ou formelle), et ensuite c’est `a vous d’y appliquer le bon test. 1. Avez-vous une id´ee pr´ecise des termes suivants : population, ´echantillon, param`etre, param`etre statistique (ou simplement statistique), erreur type I, erreur type II, puissance d’un test, une sta- tistique sans biais, une statistique convergente, donn´ees nominales/ordinales/continues, variable al´eatoire, mode, moyenne, m´ediane. 22. Comment s’appelle s ? Est-ce un param`etre ouu` nparam`etre statistique ? 3. Quel type de donn´ees repr´esentez-vous en diagramme en bˆaton? Lequel en histogramme? 4. On mesure le temps (min) que prennent des rats lib´er´es dans la partie centrale d’un labyrinthe pour trouver la sortie. Deux lign´ees diff´erentes sont compar´ees. Lign´ee A Lign´ee B 8.8 9.9 8.4 9.0 7.9 11.1 8.7 9.6 9.1 8.7 9.6 10.4 9.5 Les donn´ees ont une distribution normale dans les cas de deux lign´ees mais on n’a pas d’infor- mations sur leurs variances. D´eterminez si les deux lign´ees de rats r´esoudent le probl`eme avec la mˆ eme vitesse. Dans tous les cas formulez les hypoth`ese nulles et alternatives correspondantes. Quelle analyse ferait-on si au lieu de deux lign´ees il s’agissait d’une seule lign´ee ´etudi´ee lors de deux essais cons´ecutifs (le septi`eme individu est mort entre les deux tests, on l’´ecarte du jeu de donn´ees) ? 5 ...
2 Statistique Enge´n´erale,jevaisvousdonnerunjeudedonne´es(commedanslecours)avecunedescription decequ’ilsrepresentent,unehypothe`se(verbaleouformelle),etensuitec’est`avousd’yappliquerle bon test. 1.Avez-vousuneid´eepr´ecisedestermessuivants:population,e´chantillon,parame`tre,parame`tre statistique (ou simplement statistique), erreur type I, erreur type II, puissance d’un test, une sta-tistiquesansbiais,unestatistiqueconvergente,donne´esnominales/ordinales/continues,variable ale´atoire,mode,moyenne,me´diane. 2 2. Comments’appellessttitaes?ueiqceun?Est-m`etparauupner`oe`rtrama 3.Queltypededonne´esrepr´esentez-vousendiagrammeenbˆaton?Lequelenhistogramme? 4.Onmesureletemps(min)queprennentdesratslibe´re´sdanslapartiecentraled’unlabyrinthe pourtrouverlasortie.Deuxligne´esdiff´erentessontcompar´ees. Ligne´eALigne´eB 8.8 9.9 8.4 9.0 7.9 11.1 8.7 9.6 9.1 8.7 9.6 10.4 9.5 Lesdonn´eesontunedistributionnormaledanslescasdedeuxligne´esmaisonn’apasd’infor-mationssurleursvariances.De´terminezsilesdeuxligne´esderatsre´soudentleprobl`emeavecla meˆmevitesse.Danstouslescasformulezleshypothe`senullesetalternativescorrespondantes. Quelleanalyseferait-onsiaulieudedeuxlign´eesils’agissaitd’uneseuleligne´e´etudi´eelorsde deuxessaisconse´cutifs(lesepti`emeindividuestmortentrelesdeuxtests,onl’´ecartedujeude donne´es)? 5.Lesdonn´eessuivantespre´sententlenombredesourismortes(parmois)dansuneanimaleriede l’universite´Paul-Sabatierpendantlesanne´es2000et2001. 2000 2001 janvier 12585 fe´vrier15080 mars 8085 avril 5040 mai 4045 juin 4340 juillet 8042 aouˆt7543 septembre 8050 octobre 6536 novembre 5078 d´ecembre9583 D´eterminez1)silamortalit´edessourisdel’animaleriedel’UPSestdistribu´eedefa¸connormale pourchaqueann´eeet2)silamortalite´dessourisvaried’uneanne´e`al’autre.(Danslesdeux casformulezleshypothe`senullesetalternatives). 6.Vousavezenregistre´enTPlesr´esultatsd’uneanovaa`unfacteursouslaformesuivante: Call: aov(formula = delta ~ dm, data = souris.mul)
Terms: dm Residuals Sum of Squares5580.844 2450.125 Deg. of Freedom3 28
Residual standard error: 9.354382
5
Combiensd’´echantillons/groupesavez-vouscompare´?Alamaisonvousvoulez´ecrirelerapport (a`rendrelelendemaina`7h30danslebureauduprof)etvousvousrendezcomptequevous n’avezpasenresgistre´l’interpr´etationdel’analyse!Vousn’avezpasnonplusd’ordinateurou lesdonn´eespourrefairel’analyse.Commentvousd´ebrouillez-vouspourquand-mˆememettreles r´esultatscorrectsdansvotrerapport? 7.Vousavezcalcule´surune´chantillonde31donne´eslamoyenne(¯x= 16.3)elt´’ceraytep(s= 2.4). Donnezl’intervaldeconfiance`a(1−α), α= 5%. Est-ce que cette moyenne est significativement diff´erented’unevaleurthe´oriquede20.5? 8.Vousavezmesur´eletempsd’exploration(ens) d’un nouveau objet pour 20 souris : 42, 31, 39, 34,45,34,38,42,47,40,40,33,38,40,37,41,40,48,39,38.Vousavezoubli´elesformules pour calculer un intervalle de confiance pour la moyenne de ce temps d’exploration, mais vous disposez d’un ordinateur avecRpsundoeuc:r´eezivdoc-eRqui calcule cet interval de confiance `a95%aveclame´thodedubootstrapetdespercentiles. 9.Lesvolcansdedeuxproducteursdefeuxd’artifices,“Aaaah”et“Ooooh”,onte´t´etest´esurla dur´eedebruˆler.Les8exemplairesdelamarque“Aaaah”ontdure´50,57,57,60,60,62,64et 70s. Les 12 exemplaires de la marque “Ooooh” ont eu une moyenne 5sau dessus de celle de lamarque“Aaaah”(aveclamˆemevarianceempirique).Est-cequ’ilyaunediffe´renceentrela dur´eedebruˆlerentrelesdeuxmarques?Onsupposequeledeuxi`eme´echantillonestnormal. Est-cequec’estuntestunilat´eraloubilate´ral?FormulerlesH0etHAezlaTest.ceecvareneid´ff untestad´equatetα= 5%. 10.Onrecenselapr´esenced’uncomportementchezlesmaˆlesetlesfemellesd’unemeutedeloups durantl’ann´ee(leseffectifsrestentconstants)etonobtientletableausuivant: printemps´et´eautomnehiver Mˆales1631357143 Femelles 8677 4038 2 Utilisez leχpour testerH0mefteseltsesellequpaoplereocpmtrudmentorteemˆaentr inde´pendantdesquatresaisons. 11.Deuxgroupesd’´etudiantsone´t´eforme´pardeuxmoniteursdurantlesTP.Al’examenfinaleils ont eu les notes suivantes groupe 1groupe 2 20 19 20 19 19 18 18 17 18 15 11 13 11 13 10 12 10 10 10 9 7 8 7 6 3 Un Shapiro-Wilk test sur le premier groupe donne Shapiro-Wilk normality test