La lecture en ligne est gratuite
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
Télécharger Lire

Etalonnage et critique des tests. Technique psychométrique. - compte-rendu ; n°1 ; vol.37, pg 783-793

De
12 pages
L'année psychologique - Année 1936 - Volume 37 - Numéro 1 - Pages 783-793
11 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Voir plus Voir moins

3° Etalonnage et critique des tests. Technique psychométrique.
In: L'année psychologique. 1936 vol. 37. pp. 783-793.
Citer ce document / Cite this document :
3° Etalonnage et critique des tests. Technique psychométrique. In: L'année psychologique. 1936 vol. 37. pp. 783-793.
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1936_num_37_1_5491ETALONNAGE ET CRITIQUE DES TESTS 783
difficiles pour les enfants de cet âge est préoccupée établir
une échelle qui leur soit adaptée et application aisée
Cette échelle comporte parties une concernant le chant
capacité de reconnaître et de produire des sons une certaine hauteur
autre se rapportant au rythme Elle est basée sur la méthode
enseignement musical Merril-Palmer et établie suivant la concep
tion exposée par Thurstone dans Measurement of attitude
Quelques épreuves sont proposées au sujet qui re oit un nombre
de points en rapport avec la qualité de ses réponses Le total de ses
résultats permet de le situer sur échelle indiquant le niveau de
ses dispositions ses progrès etc Les échelons ont été fixés par
97 juges tous musiciens et plus ou moins entraînés enseignement
de cet art aux enfants très jeunes
1437 RTU Die Keilschlagprobe im Leistungsschaubild
épreuve du tampon et enregistrement de la rappe Ind
Psychol XIII 1936 65-78
construit un dispositif permettant enregistrement gra
phique des mouvements du sujet il enfonce une pièce de bois
en frappant au marteau
Les expériences effectuées sur une quinzaine de sujets permettent
évaluer une part le dsgré de réussite dans épreuve proprement
dite et autre en étudiant la courbe du travail on relève
les modifications pendant la période adaptation qui semblent
fournir des indications plus fines utiles pour étude des cas indivi
duels
ETALONNAGE ET CRITIQUE DES TESTS
TECHNIQUE PSYCHOMETRIQUE
14 38 NICEFORO Enquête sur la valeur limite entre nor
malité et anormalité en Biometrie S. 1936 Extrait
pages
Réponse une enquête du Pr Frassetto publiée dans le Bulletin
du Comité international pour la Standardisation Anthropologique
Synthétique)
Pour N. la détermination de la limite de la normalité pour un
trait donné doit se faire après un centilage préalable On dira que
la normalité est comprise entre le 1er ou le 2e et le 9e ou le 8e
déciles Ou bien on définira la zone normale après erreur probable
067 de écart étalon) sortant de cette zone ceux qui dépassent le
double de soit 18 dans une répartition normale ou le
triple )
De fa on générale propose pour désigner des individus
en ce qui concerne un trait déterminé emploi des notations sui
vantes Les catégories peuvent être définies
par des groupes égaux de 20 centiles ou des groupes inégaux 10
20 40 20 10 784 ANALYSES BIBLIOGRAPHIQUES
1439 TH SIMON Généralement appliqués aux enfants
les tests pour la mesure du développement de intelligence valent-
ils pour les adultes An Méd.-Ps. XV 94 II 1936 474-477
Faut-il exprimer en années âge le niveau mental un adulte?1
Ibid. 477-480
rappelle que échelle Binet-Simon pas été seulement
étalonnée sur des enfants mais accessoirement aussi sur des adultes
Elle leur convient donc bien il soit évidemment légitime de
chercher en quoi un adulte débile peut se distinguer de enfant dont
il âge mental
La désignation du niveau mental par mental implique une
forte dose de convention Il vaudrait mieux la modifier pour éviter
des illusions fâcheuses ou des objections injustifiées IL
1440 BURLING PEATMAN et GRAY PEATMAN
The adequacy of the shortened single-list vocabulary test of the
Binet-Simon tests Valeur du test de vocabulaire abrégé liste
unique de échelle Binet-Simon of ed Ps. XXVII
1936 160-172
utilisation une partie seulement du test de vocabulaire de
échelle B.-S paraissant se généraliser les se préoccupent de
vérifier la légitimité une telle pratique
Cette méthode qui consiste appliquer la première ou la deuxième
moitié du test 50 mots sur 100 série de droite ou de gauche et
multiplier le résultat par au lieu employer les 100 mots indiqués
est préconisée par Record Booklet et beaucoup de psychologues
ont recours soucieux de gagner du temps dans application de
cette épreuve qui prise intégralement est très longue
Dans cette étude les emploient la totalité de épreuve ur
un groupe important de sujets des sexes 642) de milieux et de
niveaux intellectuels différents Puis traduisant suivant la conven
tion le nombre de réponses exactes en âges mentaux ils comparent
les résultats fournis pour chacune des moitiés et la totalité Au-des
sous de 20 réponses exactes âge mental est inférieur ans
20 correspondent ans
30 40 10
40 50 12
50 65 14
65 75 16
75 et plus adultes supérieurs
De cette manière des groupes purent être constitués les uns
dont la majorité des cas ne subissait pa de modification quelle
que soit la technique employée totalité des mots ou une ou autre
colonne et les autres où un décalage rendait inadmissible emploi
des moitiés ou une elles préférable suivant que le classement
différait ou non de celui obtenu avec épreuve intégrale
Pratiquement pour des sujets ayant un âge mental inférieur
ans si enfant donne moins de 10 bonnes réponses dans la
série de droite il suffit de doubler le nombre des réussites il définit
correctement plus de 10 mots il est nécessaire de voir les colonnes ETALONNAGE ET CRITIQUE DES TESTS 785
Si le sujet ans ou plus il faut administrer la colonne de
gauche il donne moins de 10 définitions correctes il suffit en
doubler le nombre il plus de 10 bonnes réponses il est prudent
appliquer la liste complète
Ceci applique tous les sujets gar ons et filles mais dans
tous les cas les jugent préférable utiliser le test intégralement
quand est possible
1441 LO TTI et HARVEY STACKMAN The relation
ship between Porteus maze and Binet performance Relation
entre le labyrinthe de Porteus et le test de de Binet
of ed Ps. XXVII 1936 18-25
tude des deux types de tests en vue de déterminer ils peuvent
-être utilisés comme complément un de autre ou substitués un
autre Bien que Porteus ait présenté son test de labyrinthe
que comme un complément utile aux données fournies par échelle
B.-S. les A. après autres essayent un parallèle entre les résultats
fournis dans les catégories épreuves par des groupes de sujets
100 filles et 100 gar ons Les obtenus sont élevés 061 chez les
gar ons et 073 chez les filles et 054 et 068 âge constant Ils sont
suffisamment importants pour on ne puisse douter de la présence
de facteurs communs impliqués dans les types de tests mais pas
assez cependant pour on puisse les utiliser indifféremment
des sont parmi les plus élevés qui aient été obtenus dans de sem
blables recherches utilisant des sujets âge dispersés de 14 ans
La supériorité du chez les filles paraîtrait indiquer une moindre
participation de intelligence motrice dans la réussite générale
que chez les gar ons mais cette différence étant en sens opposé
<lans autres travaux les proposent attendre de nouvelles
vérifications avant de conclure
1442 LORGE Thé influence of the test upon the nature of
mental decline as fonction ot âge Influence du test sur la nature
du déclin mental en de âge of ed Ps. XXVII
1936 100-110
La mesure une relation entre âge et le niveau intellectuel
<iépend de la manière envisager aptitudes et âge nous dit A.
qui dans son travail tenté apporter quelques précisions dans
ce domaine
Les groupes âge en particulier si la dispersion est importante
sont généralement constitués sans tenir compte des différences
éducation et expériences chez les sujets autre part les épreuves
utilisées comme tests intelligence qui consistent effectuer correc
tement soit des tâches de difficulté graduée soit le maximum de
tâches de môme difficulté dans un temps donné font intervenir
la rapidité ou habileté de manière prépondérante ou un mélange
des deux sans préciser Il ne faut donc pas étonner des divergences
de résultats obtenues dans diverses études suivant les tests utilisés
Comparant les données qui lui furent fournies par des sujets de
20 70 ans celles publiées par divers auteurs il met en lumière
importance du choix des épreuves et tire cette conclusion on
ANNEE PSYCIIOI OGIQ XXXVII 50 786 ANALYSES BIBLIOGRAPHIQUES
fortement exagéré influence de âge sur la richesse intellectuelle
Il lui paraît illégitime apprécier au moyen de tests courants la
valeur mentale adultes dont la rapidité est diminuée Leur longue
préoccupation des problèmes de la vie courante sans rapport
avec ceux que proposent les tests les déshabitués de cette-
forme activité et ils se trouvent ainsi désavantagés dans les épreuves
de performance
1443 MAX HERTZMAN The effects ot the relative difficulty
ot mental tests on patterns of mental organization Les effets de la
difficulté relative des tests mentaux sur les systèmes figurant Inorga
nisation mentale Ar of Ps. XXVIII n0 197 1936 69 pages
Un coefficient de corrélation nous laisse ignorer si les différents-
éléments des tests contribuent également ou non la corrélation
trouvée on peut même craindre intérieur des tests considérés
comme unités indépendantes jouent des tendances relationnelles
opposées Or un test est en général composé éléments de difficulté
graduée et est demandé si cela ne créait pas une hétérogénéité
fonctionnelle pouvant notamment interférer avec influence d&
âge sur organisation mentale confirmée récemment par Asch
Il rappelle que Spearman et Hamid ont conclu un matériel
de difficulté moyenne est probablement le plus favorable aux
intercorrélations élevées Les données de ïhorndike le confirment
bien que les différences effacent après la correction atténuation
jugée excessive par qui discute aussi le problème de la fidélité
des tests)
utilisé les données de tests numériques et spatiaux
appliqués par Smith mémoire de 1933 Chaque test compre
nant trop peu éléments pour on pût utilement le scinder en
parties seulement considéré sous-tests facile et difficile
les éléments ayant été rangés après le nombre erreurs commises
puis séparés au niveau du médian On peut ainsi établir que dans
chaque sorte de test numérique ou spatial) le niveau de difficulté
était une source hétérogénéité
Les sous-tests spatiaux ont pour chacun des niveaux de-
difficulté la même intercorrélation moyenne coefficient de Fisher
== 044) mais les corrélations croisées sont inférieures 035 Les
sous-tests numériques faciles ont de faibles intercorrélations moy
des == 026) alors que pour les difficiles == 041 les corréla
tions croisées sont intermédiaires 032
Un calcul montre que si les tests avaient été homogènes et
les numériques assez difficiles) les corrélations eussent été plus
élevées même semble-t-il entre matériels différents Il resterait
préciser pour chaque test appliqué un groupe donné le niveau
optimum de difficulté
Les éléments faciles et les éléments difficiles un test ne mesurent
donc pas la même habileté Par contre la distinction des habiletés
numérique et spatiale reste une hypothèse de travail trouve une
corrélation moyenne de 037 entre certains tests numériques et
spatiaux supérieure celle de certains tests numériques entre eux
026 TALONNAGE ET CRITIQUE DES TESTS 787
1444 MAIZLISII New possibilities in intelligence testing
interview form Nouvelles possibilités dans examen de Inintelli
gence par entretien of appi Ps. XX 1936 599-608
Les entretiens et les questionnaires relatifs aux renseignements
ordre familial et personnel permettent de glisser un test intelli
gence déguisé sans donner au sujet impression de subir un test
proprement parler Les exemples proposés par Maiziish ne constituent
que des tests de richesse de vocabulaire mais le principe de la
méthode semble pouvoir être étendu et mériterait de être
1445 ST KRUK Contribution étude de la valeur
diagnostique des tests intelligence du point de vue de la pratique
scolaire en polonais Kwart Ps. VII vol jubilaire dédié
au Pr Witwicki 1935 311-328
compare les résultats des tests avec la réussite scolaire
et arrive la conclusion suivante Le fait que les élèves sont ou
non aptes passer dans la classe suivante accorde avec des
résultats meilleurs ou pires dans les tests intelligence Les tests
de mémoire et ceux de Bourdon ont une valeur diagnostique beaucoup
plus petite
Pour les enfants les plus jeunes les tests de langage sont les plus
significatifs pour les âgés les intelligence logique
1446 RICHARDSON The relation between the diffi
culty and the differential validity of test La relation entre la
difficulté et la validité différentielle un test Psychometrika
1936 33-49
La validité un test utilisé introduire une coupure dans un
groupe dépend de ajustement harmonieux de la difficulté de
ses questions la place de la coupure Par exemple un test composé
de ayant un pourcentage de réussite moyen de 50
ne convient bien que si on en sert pour scinder une distribution
vers son médian auteur étudié empiriquement sur un long
test servant de critérium et de réservoir pour la constitution de
tetss-types application 1.200 étudiants) la relation qui existe
entre la validité discriminative du test et le niveau de difficulté
de ses questions Les résultats montrent combien on tort de négliger
dans la construction un test étude préalable de la difficulté de
ses composantes
1447 DOUGLAS SCATES Complexity of test items as
factor in the validity of measurement Complexité des articles un
test comme facteur de la validité des mesures of Ed Res.
XX 1936 77-92
Cette étade porte particulièrement sur les tests scolaires utilisés
pour vérifier les progrès des enfants en différentes matières
en garde les éducateurs et les auteurs de tests contre
le danger mesures établies en partant épreuves qui ne corres
pondent pas des situations réelles La réussite un enfant est 788 ANALYSES BIBLIOGRAPHIQUES
subordonnée un très grand nombre de facteurs les uns ordre
intellectuel autres liés sa personnalité et aux circonstances
présentes facteurs il est difficile de faire intervenir convena
blement dosés dans épreuve qui testera ses capacités
On ne peut se contenter de tests élémentaires variés et réunis
en plus ou moins grand nombre dit-il car la somme des résultats
est sans rapport avec ce qui serait obtenu dans une situation unique
faisant intervenir tous les facteurs représentés Quant aux épreuves
complexes elles offrent autres inconvénients elles sont très diffi
ciles établir judicieusement car des degrés différents de complexité
correspondent la mesure de choses différentes
se propose de compléter ultérieurement ces premières obser
vations
1448 PERCIVAL SYMONDS Influence of order of presen
tation of items in ranking Influence de Vordre de présentation
des articles dans le classement of ed Ps. XXVII 1936
445-450
Cette étude confirme des résultats antérieurs sur importance
de la situation de chaque article un test par rapport ensemble
Cette influence est indépendante de âge et de la maturité des
sujets mais elle varie suivant le type de présentation par exemple
horizontal ou vertical La modification subie en renversant ordre
des articles exprime par une relation linéaire
Ce travail comporte quelques tableaux précisant la valeur de
ce facteur et indiquant la correction qui doit être apportée chaque
article
1449 SMITH Thé relation between objectivity and validity
in the arrangement of items in rank order La relation entre obfec-
tivite et la validité dans arrangement des éléments par ordre de
rangs of appi Ps. XX 1936 154-160
En demandant aux étudiants effectuer divers classements
classer les formes examens scolaires par degré de préférence
les photographies enfants par degré présumé intelligence des
poids qui variaient de 16 176 gr par échelons un dixième)
par ordre de grandeur on trouvé que la corrélation moyenne
entre le classement effectué par un observateur et celui effectué par
un autre observateur été médiocre 03-04 Par contre le classe
ment moyen pour un groupe observateurs offre avec le classement
un autre jury des corrélations élevées 09 Il fallait attendre
Mais objectivité ne garantit nullement exactitude dans le test
des poids le classement moyen offrait un == 073 avec le
classement qui correspondait aux poids véritables
1450 GOODENOUGH critical note on the use of the
term reliability in mental measurement Note critique sur
emploi du terme fidélité dans la mesure mentale of ed
Ps. XXVII 1936 173-178
Quelques observations sur les différentes méthodes de calcul des
indices de fidélité entre deux formes du test entre la somme des ETALONNAGE ET CRITIQUE DES TESTS 789
questions paires et des questions impaires entre deux applications
successives de la même épreuve
La diversité des coefficients obtenus suivant la méthode choisie
révèle hétérogénéité des facteurs atteints dans les différents cas
Dans ces conditions emploi un terme unique fidélité est impropre
propose renoncer et indiquer la méthode qui été choisie
Il ne peut être question élire une elles exclusion des
autres mais dans chaque cas une méthode est préférable/suivant
le genre information recherché En général conseille la compa
raison de deux coefficients différents
1451 SODERQUIST new method of weighting
scores in true-false test Nouvelle méthode pour appréciation
des résultats dans un test vrai-faux of Ed Res. XXX
1936 290-292
Dans ce type de notation il est tenu compte du degré de certitude
éprouvé par le sujet égard de sa réponse
Un test deux alternatives vrai ou faux lui est présenté avec
invitation de préciser son attitude devant la réponse choisie
du doute extrême certitude il indique par un chiffre
ou Il est prévenu en cas erreur la pénalisation sera égale
au double du chiffre noté Les sujets non désireux de bénéficier du
crédit accordé la conviction re oivent comme note finale la diffé
rence entre la somme des bonnes et celle des mauvaises réponses
La notation des résultats après la nouvelle méthode et autre
part en calculant simplement la différence entre bien et mal présente
quelques modifications un de 090 été obtenu entre les deux
systèmes de correction
Mais la fidélité calculée entre deux moitiés donné 085 pour
la nouvelle méthode et 072 avec la notation courante Ce qui permet
auteur de comparer le rôle de cette modification celui de allon
gement des tests Un autre avantage est de réduire au minimum les
réponses au hasard et de signaler les sujets qui pour diverses raisons
cherchent limiter les conséquences de leur choix
1452 HERTZ The method of administration of the
Rorschach ink-blot test La méthode du test
des taches encre de Rorschach Child dev. VII 1937 237-
254
étudie en grand détail la technique de administration du
test de Rorschach Elle insiste en particulier sur les questions
poser aux enfants qui ont souvent besoin être encouragés et de
recevoir quelques explications sur ce on attend eux mais
il faut éviter les questions suggestives Pour noter rapidement
les réponses de enfant on peut faire usage de diagrammes où toutes
les particularités des taches susceptibles attirer attention sont
avance désignés par des nombres ou par des symboles Cet article
donne une bibliographie de la question mais ne pose pas le problème
de interprétation psychologique des réponses
1453 SUNNE Rorschach test norms of young children 790 ANALYSES BIBLIOGRAPHIQUES
Normes de jeunes enfants dans le test de Rorschach Child
dev. VII 1936 304-313
On comparé aide du test de Rorschach trois groupes
enfants de ans mois 11 ans Américains de race blanche
nègres américains ces deux groupes appartenant la population
urbaine et villageois une région montagneuse assez isolée on
est surtout attaché classer les objets vus par les enfants dans
les taches encre Mais il est difficile de savoir si la fréquence de
tel ou tel objet explique par les conditions du milieu naturel ou
social ou il faut voir une expression du type de caractère
1454 MC GL RE The effect of varying verbal instructions
on the motor responses of preschool children effet de la variation
des instructions verbales sur les réponses motrices des enfants
âge pré-scolaire Child dev. VII 1936 276-290
Dans administration de tests de très jeunes enfants on
comparé deux deux plusieurs manières de présenter chaque pres
cription demande ou ordre prescription générale ou spécifique
pressante ou non positive ou négative dans sa forme présentée
comme une affirmation ou une question accompagnée ou non une
justification faisant ou non appel émulation mettant accent
sur le but immédiat ou lointain sur le succès ou sur échec faisant
intervenir le blâme ou éloge etc Dans certains cas la forme de
la prescription est au second plan et est intérêt propre ou la
facilité de action qui sont décisifs dans autres efficacité varie
avec âge de enfant
1455 HOVLAND new method of increasing the reliabi
lity of the true-false examination Une nouvelle méthode pour
accroître la validité des tests de vrai ou faux of ed Ps.
XXVI no 1935 388-394
groupes élèves de classes élémentaires de psychologie sont
soumis un test de vrai ou faux Pour le 1er groupe la partie essen
tielle de chaque phrase du test était soulignée La validité atteint
090 et même 092 Cette méthode est sensiblement préférable
celle employée généralement
1456 NEWHALL et RODNICK The influence
of the reporting-response upon the report influence de la
nécessité de faire un rapport sur le rapport lui-même Am
of Ps. XLVIII 1936 316-325
tude de différents facteurs susceptibles influencer un rapport
intimidation la facilité exercice les associations etc
Les expériences des sur le seuil différentiel de la brillance
avec trois sortes de réponses par description verbale en pressant
une clef de Morse avec les mains ou avec les pieds ont pas donné
des différences essentielles dans les résultats
1457 OLSON The waiver of signature in personal TALONNAGE ET CRITIQUE DES TESTS 791
Tepori anonymat dans les renseignements ordre personnel
of appi Ps. XX 1936 442-450
Le questionnaire de Mathews-Woodworth qui interroge sur la
présence des divers symptômes psychopathologiques été rempli
deux reprises par deux groupes étudiantes le premier donné
abord des feuilles anonymes puis rempli une deuxième fois
le questionnaire en le signant ordre des deux applications été
-inversé pour le deuxième groupe de sujets
existence de symptômes psychopathologiques un caractère
assez général ennui lassitude sensation de irréel signes phy
siques de tendances neuropathiques été affirmée avec une
plus grande fréquence par le premier groupe au cours des premières
réponses anonymes Pour le deuxième qui donné abord
des réponses signées les réponses anonymes subséquentes ont
pas présenté un excès aussi prononcé de symptômes psychopathiques
invoque une sorte de persévérance qui empêcherait une plus grande
sincérité des réponses anonymes lorsque le sujet déjà fourni des
réponses réticentes
1458 BROWNELL et BRAN LEY WATSON The
comparative worth of two diagnostic techniques in arithmetic
Valeur comparative de deux techniques de diagnostic en arith
métique of Ed Res. XXIX 1936 664-676
Méthode examen individuel et méthode collective sont compa
rées dans une expérience réalisée auprès de 245 écoliers avec des
épreuves arithmétique addition de fractions
examen individuel fut limité 20 minutes par enfant ceux-ci
avaient expliquer comment ils pensaient opérer pour résoudre
les problèmes proposés Les résultats furent analysés aux points
de vue du nombre et de la nature des succès et des échecs
La fidélité des mesures fut calculée en comparant les corrections
faites deux reprises par le même opérateur et en comparant
les interprétations des résultats envisagés de diverses fa ons par
des juges différents De toutes les manières étudiées on trouve une
légère supériorité de la méthode individuelle
Dans ensemble les deux méthodes sont équivalentes il agit
un diagnostic rudimentaire détermination du nombre total
des fautes ou des omissions des erreurs de certains types etc
Mais il est nécessaire de procéder un examen détaillé et précis
la méthode individuelle paraît préférable supérieure en fidélité
et en validité
1459 HERBERT SCHIFF Intelligenz und Lückentest Intel
ligence et test de complètement de phrases ges Ps. XCVI
1-2 1936 1-22
On se préoccupe généralement dans étude un test de sa valeur
comme instrument de mesure est-à-dire de sa constance de son
homogénéité et de sa sensibilité analyse approfondie de la fonction
laquelle adresse cet instrument de mesure ne prend pas beaucoup
de place dans les préoccupations des créateurs de tests consacre
cette courte mais intéressante étude montrer Quelles sont les

Un pour Un
Permettre à tous d'accéder à la lecture
Pour chaque accès à la bibliothèque, YouScribe donne un accès à une personne dans le besoin