Etalonnage et critique des tests. Technique psychométrique - compte-rendu ; n°1 ; vol.40, pg 811-821

De
Publié par

L'année psychologique - Année 1939 - Volume 40 - Numéro 1 - Pages 811-821
11 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : dimanche 1 janvier 1939
Lecture(s) : 23
Nombre de pages : 12
Voir plus Voir moins

3° Etalonnage et critique des tests. Technique psychométrique
In: L'année psychologique. 1939 vol. 40. pp. 811-821.
Citer ce document / Cite this document :
3° Etalonnage et critique des tests. Technique psychométrique. In: L'année psychologique. 1939 vol. 40. pp. 811-821.
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1939_num_40_1_5868ÉTALONNAGE ET CRITIQUE DES TESTS 811
enseignement. Elles ont proposé à deux groupes de mères adoptives
un test de connaissances et de jugement en matière de pédagogie et
■de puériculture ; un groupe avait suivi la série de conférences ; l'autre,
semblable au premier quant au niveau d'instruction scolaire, à la
profession du mari et à la « socialite », — qualité déterminée aupara
vant au moyen du questionnaire de Leahy sur le « Urban Home
environment », — n'avait pas assisté aux cours. Les résultats n'ont
pas montré de différences significatives entre les deux groupes, ce qui
laisserait supposer que les conférences n'avaient rien ajouté d'essent
iel à l'éducation pratiquée individuellement par les assistantes-
visiteuses chargées de veiller sur les enfants placés. D. W.
1459. — E. F. WONDERLICet G. I. HOVLAND. — The personnel
test : a restandardized abridgement of the Otis S-A Test for
business and industrial use (Le « test de personnel » : une échelle
abrégée et réétalonnée du test S-A (TOtis pour l'emploi dans le
commerce et l'industrie). — J. of appl. Ps., XXIII, 6, 1939,
p. 685-702.
En sériant les questions du test d'Otis S-A, forme supérieure, les A.
en ont tiré trois modèles de tests, E, F et G, dont le temps d'application
(pour chacun des trois modèles) a été fixé à 12 minutes. Le nouveau
test a été appelé « Personnel Test » afin d'éviter les inhibitions
qu'éprouvent les sujets adultes, qui postulent un emploi, à voir exa
miner et juger le degré de leur intelligence ; il a été très soigneusement
étudié et l'on s'est assuré, en analysant le nombre de bonnes réponses
par question, que la répartition obtenue pour chacune des trois
formes du test était satisfaisante. La fidélité, par comparaison des
moitiés d'un test et par application de la formule de Spearman-
Brown, a donné des coefficients d'homogénéité de 0,92 à 0,95. Enfin,
la validité a été déterminée par corrélation avec d'autres tests, et
surtout par les succès pratiques obtenus par les différents groupes
de sujets dans des emplois de commerce ou d'industrie. Dans un
groupe de représentants d'une grande entreprise financière, il a été
observé un an après la sélection que 78 % des candidats ayant donné
dans le test des résultats inférieurs à 25 points avaient démissionné
ou avaient été congédiés, alors que seulement 18 % des sujets dont les
résultats étaient supérieurs à 25 points avaient dû quitterl'emploi. Dans
une grande compagnie d'assurances le test a été employé avec succès
pour la sélection des comptables. D'autres enquêtes ont confirmé ces
résultats. D. W.
3° Étalonnage et critique des tests
Technique psychométrique
1460. — H. J. EYSENCK. — The validity of judgments as a function
of the number Of judges (La validité des jugements comme fonction
du nombre des juges). — J. of exp. Ps., XXV, 1939, p. 650-654.
On a trouvé que la validité des jugements augmentait avec le
nombre des juges dans une épreuve de discrimination de poids, pour
laquelle il existe un critérium objectif de validité. En est-il de même 812 ANALYSES BIBLIOGRAPHIQUES
dans une appréciation esthétique ? Comme il n'y a pas ici de crit
érium objectif, l'auteur se borne à étudier les .corrélations entre un
premier groupe de 700 jugements, considéré comme standard, et les
jugements en groupes plus ou moins nombreux de juges : il trouve
une corrélation de grandeur croissante à mesure que le nombre de
juges augmente. P. G.
1461. — IRVING LORGE. — The Thurstone attitude scales :
I. Reliability and consistency of rejection and acceptance (Les
échelles d'attitude de Thurstone : Fidélité et cohérence du refus et de
V acceptation). — J. of soc. Ps., X, 2, 1939, p. 187-198. — The
Thurstone attitude scales : IL The reliability and consistency of
attitudes of younger and older intellectual peers (Les échelles d'atti
tude de Thurstone : II. Fidélité et cohérence des attitudes de sujets
jeunes et de sujets plus âgés, intellectuellement équivalents). —
Ibid., p. 199-208.
Dans un travail préalable, l'A. détermine le mode de notation qui
permet la plus grande constance dans l'interprétation des attitudes
des sujets, exprimées sous forme d'acceptation ou de rejet de propos
itions relatives à certains problèmes sociaux, religieux, politiques, etc.
Il conclut à la supériorité de la méthode du médian des valeurs
positives, et à l'impossibilité d'attribuer un poids équivalent aux
refus et aux adhésions.
Puis, il applique ces conclusions dans une recherche poursuivie
auprès de 107 adultes âgés de 20 à 70 ans et groupés par paires
équivalentes au point de vue intellectuel. Un jeune (20-25 ans) est
associé à un sujet âgé (40 ans ou plus) ayant eu un égal succès aux
tests CAVD. Deux formes équivalentes des questionnaires d'attitude
de Thurstone leur sont appliquées, à un intervalle de deux semaines.
A niveau mental égal, les sujets âgés se sont montrés nettement
plus stables que les jeunes (la stabilité étant donnée par la comparai
son des réponses dans les deux formes de questionnaires) ; ils sont
aussi plus cohérents ; les femmes offrent davantage de contradictions
dans leurs réponses à une même liste de sentences, acceptant ou
refusant alternativement des propositions correspondantes.
L'A. attribue cette plus grande régularité d'attitude chez les
vieux à l'existence de racines profondes, « à moins, dit-il, que ces
racines ne soient des stéréotypes non raisonnes ». J. M.
1462. — F. BAUMGARTEN. — A propos de la méthode dans les
recherches caractérologiques. — J. de Ps., XXXV, 1938, p. 609-
616.
Indication de quatre méthodes employées par l'auteur pour
étudier la gratitude, et qui, appliquées à l'examen de n'importe
quelle qualité de caractère, fourniraient des résultats plus précis
que les méthodes actuellement en usage. G. -H. L.
1463. — F. BAUMGARTEN-TRAMER. — La méthode des cas
possibles dans la solution des tests. — J. de Ps., XXXVI, 1939,
p. 99-106,
Pour apprécier les qualités d'un sujet soumis à un test, il faut ÉTALONNAGE ET CRITIQUE DES TESTS 813
prendre en considération non seulement le rendement brut, la solution
du problème, mais aussi la manière dont elle a été obtenue, la méthode
de travail. L'exemple de quelques tests illustre cette idée. Il faut
envisager toutes les formes possibles de la conduite individuelle des
sujets devant une tâche donnée ; chacune de ces formes permet de
déterminer l'existence de certains traits de caractère d'après chaque
aspect de la conduite individuelle du sujet. En tenant compte, non
seulement des réponses justes, mais aussi des réponses insuffisantes,
et en essayant d'envisager et d'interpréter tous les cas possibles, on
pourra fixer une typologie. L'exactitude du diagnostic d'un type do
caractère est naturellement d'autant plus probable qu'on examine
un plus grand nombre de sujets. Cette méthode écarte la subjectivité
du jugement. G. -H. L.
1464. — D. SHAKOW et B. PARELAN. — Adult norms for
the K-S Clinical Form-Board (Normes des adultes pour le test
clinique des planchettes K-S). — J. of appl. Ps., XXIII, 4, 1939,
p. 495-502.
Dans les avec formes à encastrer, un modèle réduit
développé par Kent et Shakow en 1928 pour l'emploi clinique n'a
pas été étalonné jusqu'à présent. Le présent article fournit les
barèmes obtenus sur quatre groupes d'adultes, — un groupe
d'hommes et un groupe de femmes, semblables à la population
générale, et deux groupes pris parmi les individus doués d'une instruc
tion supérieure. D. W.
1465. — S. D. PORTEUS. — The validity of the Porteus maze test
(Validité du test de labyrinthe de Porteus). — J. of ed. Ps., XXX,
3, 1939, p. 172-178.
Réfutation des critiques apportées par Moshe Brill à ce test de
labyrinthe, dans un précédent article, paru dans la même revue :
1937, p. 481-483 {Année Psychologique, 1937, n° 1781).
Les conclusions de M. B. étaient défavorables au test envisagé
comme instrument de mesure de la capacité d'adaptation sociale.
Mais P. lui reproche d'avoir choisi peu judicieusement ses groupes
expérimentaux, pensionnaires de maisons de rééducation, probable
ment inadaptés sociaux à divers degrés ; d'autre part, il n'a pas été
fait de discrimination soignée entre les débiles et les sujets d'intell
igence normale.
Stimulé par ces recherches, dit P., il s'efforce d'éclaircir le pro
blème et étudie la validité de son test : 1° sur un groupe de déli
nquants ; 2° sur des anormaux mentaux.
Dans les 2 cas, il trouve une corrélation très élevée avec les
résultats donnés par ces sujets au test de Binet.
Pour le deuxième groupe, où les enfants étaient jugés par un
médecin spécialiste, au point de vue de leur comportement actuel et
du pronostic pouvant être formulé à propos de leur adaptation
sociale, les r obtenus furent : 0,57 avec les tests Binet et 0,77 avec le
test de labyrinthe. J. M.
1466. — G. S. MAC VAUGH. — Centile and T scale norms for revised
alpha examination, form 5 [Barème en centiles et échelons T pour 814 ANALYSES BIBLIOGRAPHIQUES
la batterie revisée des tests alpha, forme 5.) — J. of appl. Ps.,.
XXIII, 6, 1939, p. 720-722.
La batterie revue des tests alpha étalonnée par Wells, est
réétalonnée par l'auteur sur 5.000 adultes en vue d'obtenir des
normes pour les sujets qui obtiennent moins de 60 points. Ces barèmes
sont indiqués in extenso. D. W.
1467. — C. I. HOVLAND et E. F. WONDERLIC. — A critical
analysis of the Otis self-administering test of mental ability,
higher form (Analyse critique de l'auto-test d'intelligence d'Otis,
forme supérieure). — J. of appl. Ps., XXIII, 3, 1939, p. 367-387.
Le test d'Otis destiné aux adultes et pouvant être appliqué
par le sujet lui-même sans le concours de 1'opéBateur, a été
à près de 9.000 sujets de différents milieux et les résultats soumis à
une étude détaillée. Il résulte de cette étude : que la forme actuelle du
test est trop facile, 40 % des sujets ayant pu le terminer avant
l'expiration du temps accordé. D'autre part, 60 % des questions ont
été résolues par plus de 75 % des sujets. Les auteurs ont procédé à un
réétalonnage complet du test et ont retenu pour une forme abrégée
les questions qui avaient donné des répartitions satisfaisantes, d'un
ordre de difficulté convenable. Ramené à un temps d'application
de 12 minutes, le nouveau test offre cependant un coefficient d'homog
énéité de 0,92. D. W.
1468. — J. E. ANDERSON. — The limitation of infant and preschool
tests in the measurement of intelligence (Réserves à faire sur les pour petits enfants et tests préscolaires dans la mesure d&
V intelligence). — J. of Ps., VIII, 1939, p. 351-379.
Wellman, Skeels et Skodak ont bien mis en lumière que les
tests pour le premier âge donnent plutôt des indications sur les
possibilités de développement dans un certain milieu que sur les
facteurs héréditaires. La querelle récente au sujet des recherches
faites par l'École de Iowa sur les oscillations du Q. I. ne se serait pa&
envenimée si au lieu de s'affronter les chercheurs avaient bien voulu
examiner d'un œil critique non la méthode, mais le test lui-même ;
une analyse très détaillée amène en effet à conclure que l'apprentis
sage joue un grand rôle dans les appréciations sur l'âge mental et
qu'il faudrait distinguer nettement le facteur intelligence du facteur
réussite. L'échelle de Binet et ses remaniements permettent quelques-
mesures d'intelligence, mais elles demanderaient à être complétées
par des échelles de personnalité ou de caractère, d'habileté mécanique
et motrice, sur lesquels nous n'avons aucun point de repère pour le petit
enfant, sinon dans l'observation des stades de ses progrès. On ne
peut donc se baser sur la seule mesure du Q. I., il faut suivre les-
enfants d'étape en étape et étudier les résultats comparés des tests
au cours de leur développement. Alors seulement la désignation du.
niveau que nous attribuons à l'enfant prendra-t-elle son sens plein,
et pourrons-nous critiquer ce qui jusqu'ici n'a jamais prétendu être
une appréciation globale du comportement sous tous ses aspects.
I. L. ÉTALONNAGE ET CRITIQUE DES TESTS 815
1469. — MORRIS KRUGMAN. — Same impressions of the revised
Stanford-Binet scale (Quelques impressions sur V échelle Binet-
Stanford révisée). — J. of ed. Ps., XXX, 8, 1939, p. 594-603. —
M. I. ELWOOD. — A preliminary note on the vocabulary test
in the revised Stanford-Binet scale (Note préliminaire sur le test
de vocabulaire de l'échelle Binet- Stanford révisée, forme L). - —
Ibid., p. 632-634.
Étude critique de la nouvelle révision de l'échelle Binet — forme L.
En résumé, il semble bien qu'elle soit un progrès sur les précédentes
Aversions.
Cette révision a, d'après K. le mérite de supprimer certains
inconvénients graves, généralement constatés dans l'ancienne, d'une
mauvaise adaptation des épreuves aux âges extrêmes et d'une limi
tation trop rapide. Mais, quelques faiblesses nouvelles, par contre,
sont notées : allongement du temps d'application, trop grande
importance accordée aux épreuves verbales de certains âges, et aux
exercices de mémoire aux niveaux élevés, manque de clarté des
instructions, etc.
En ce qui concerne les épreuves verbales, E. signale l'amélioration
apportée, tout en indiquant l'insuffisance encore constatée actuell
ement ; les sujets de certains âges ont une grande difficulté à répondre
à diverses questions.
Mais, dans l'ensemble, les 2 A. concluent d'une manière favorable
à cette nouvelle adaptation d'échelle. J. M.
1470. — C. R. AT WELL. — Comparison of vocabulary scores on the
Stanford-Binet and the revised Stanford-Binet (Comparaison de
résultats dans les épreuves de vocabulaire des échelles Binet- Stanford
et Binet- Stanford révisée). — J. of ed. Ps., XXX, 6, 1939, p. 467-
469.
Une application successive de ces deux épreuves de vocabulaire,
à 100 adultes, a révélé une divergence notable entre l'interprétation
des résultats dans les deux cas.
Des différences furent constatées, régulièrement, dans le sens
d'une notation plus favorable pour la révision ; l'augmentation
moyenne fut : 3 ans 81, avec 1 an 33 et 6 ans 33 comme différences
extrêmes. La corrélation entre les deux séries de résultats atteint :
0,86. J. M.
1471. — G. ARTHUR. — The agreement of Kuhlmann-Binet and
Stanford-Binet ratings for 200 cases (L'accord entre les note?
dans les tests Kuhlmann-Binet et celles des tests Stanford-Binet). — -
J. of appl. Ps., XXIII, 4, 1939, p. 521-524.
L'emploi des tests Binet-Simon se généralise aux États-Unis
où l'on fait usage des révisions américaines de l'échelle de Binet.
Parmi ces révisions, celles de Terman à l'Université Stanford et celle
de Kuhlmann étant les plus répandues, l'A. compare, sur 200 cas
qui ont passé par des cliniques infantiles et y ont été testés à deux
reprises chaque fois à l'aide d'une autre révision, les résultats de ces
deux révisions. Il trouve que les écarts entre les des deux
examens ne sont pas plus élevés que ceux rapportés par Terman 816 ANALYSES BIBLIOGRAPHIQUES
dans l'application répétée de l'échelle de Stanford ; la différence
médiane n'a été que de 3 points de Q. I., avec un très léger écart
systématique, les Q. I. fournis par Stanford-Binet étant d'envi
ron 2 points supérieurs à ceux de la révision Kuhlmann. La traduction
des résultats en unités de « constantes personnelles », d'après la
méthode de Heinis, a confirmé ces conclusions. Pratiquement, les
deux révisions constituent des échelles interchangeables. D. W.
1472. — A. A. HARTMAN. — A comparison of the ratings of ment
ally retarded prisoners on Army Alpha and Stanford-Binet
(Comparaison des résultats fournis par des prisonniers mentalement
arriérés dans les tests Alpha de l'Armée et dans les tests Stanford-
Binet). — J. of appl. Ps., XXIII, 5, p. 608-611.
La comparaison des résultats fournis par les prisonniers dans les
tests Alpha de l'Armée avec les résultats obtenus dans la révision
Stanford des tests Binet-Simon aboutit à la conclusion que les
tests Alpha peuvent être utiles même pour des arriérés, à condition
qu'il ne s'agisse pas de sujets illettrés. Lorsque les tests Alpha et les
tests Binet-Simon fournissent des résultats discordants, l'interpréta
tion doit se faire en fonction des connaissances acquises par l'exami
nateur, quant aux conditions expérimentales et à la personnalité du
sujet. D. W.
1473. — G. HILDRETH. — Comparison of early Binet records with
college aptitude test scores (Comparaison de la réussite de collégiens
dans un test d'aptitude avec les résultats obtenus antérieurement aux
tests Binet). — J. of ed. Ps., XXX, 5, 1939, p. 365-371.
70 enfants ayant pu être suivis, de leur 9e année (âge médian du
groupe) à la 18e, on mit en parallèle le Q. I. déterminé au début de
leur scolarité, avec l'échelle Binet-révision Stanford 1916 — et les
résultats aux tests « American Council psychological examination ».
Les résultats furent, dans les deux cas, traduits en centiles, et on
calcula pour chaque sujet la perte ou le gain constaté entre les
2 épreuves.
En général, la modification fut à l'avantage des élèves. Pas de
différence significative entre le groupe des garçons et celui des filles.
Parmi ces sujets, bien doués pour la plupart (Q. I. initiaux compris
entre 95 et 170 avec un médian de 120), les plus brillants dans l'en
fance tendent à conserver un rang élevé après un intervalle de
plusieurs années. Les moyens varient davantage, ainsi que les
médiocres.
La variation médiane, en centiles, a été de 3,2 points : 2,9 chez les
garçons et 3,75 chez les filles. J. M.
1474. — R. RUGGLES et G. W. ALLPORT. — Recent applications
Of the A. S. reaction Study (Applications récentes du test d'asce
ndance-soumission) — J. of Abn. Ps., XXXIV, 4, 1939, p. 518-527.
Le test d'ascendance-soumission, jusqu'ici surtout appliqué aux
hommes, a été étalonné pour les femmes dans des conditions garan
tissant une fidélité de 0,80 et faisant preuve d'une validité aussi
grande pour les femmes que pour les hommes. On trouvera, dans le ÉTALONNAGE ET CRITIQUE DES TESTS 817
compte rendu d'onze années de recherches et d'applications, des
encouragements suffisants pour étendre cette épreuve au domaine
■des examens professionnels et des analyses psychologiques indi
viduelles. I. L.
1475. — D. G. HUMM. — Discussion of « A statistical analysis of the
H umm- Wads worth temperament scale » (Discussion « d'une
analyse statistique de l'échelle de Humm-Wadsworth »J. — J. of
appl. Ps., XXIII, 4, 1939, p. 525-526.
Critique d'un travail de B. L. Kruger (cf. An. Ps., XXXIX,
1939, 1609) ; H. reproche à cet auteur d'avoir utilisé un groupe mal
« échantillonné et de n'avoir pas employé les méthodes statistiques »
convenables pour parer à l'asymétrie de ses distributions et permettre
ie calcul, — nécessaire d'après H., — des corrélations partielles.
D. W.
1476. — D. G. HUMM, R. C. S. STORMENT et M. E. IORNS. —
Combination scores for the Humm-Wadsworth temperament
scale (Notes combinées pour l'échelle de tempérament de Humm-
Wadsworth). — J. of Ps., VII, 1939, p. 227-253.
On trouvera là un nouvel étalonnage du test de Humm-Wadsw
orth qui permet de distinguer du type normal les tempéraments
hystéroïdes, cycloïdes, schizoides, épileptoïdes. Cette échelle de
318 points comporte un grave désavantage, celui d'être fortement
influencée par les omissions dans les réponses. Les A. établissent des
équations de régression pour obtenir des combinaisons de notes
permettant de contrebalancer les effets de cette variation. On
trouvera le nouvel étalonnage présenté en 18 tableaux à la fin de cette
étude. I. L.
1477. — D. W. DYSINGER. — A critique of the Humm-Wadsworth
temperament scale (Une critique de l'échelle de tempérament de
Humm-Wadsworth). — J. of Abn. Ps., XXXIV, 1, 1939, p. 73-83.
Les résultats obtenus par l'A. dans l'application de l'échelle de
tempérament de Humm-Wadsworth ne concordent pas avec l'ét
alonnage primitif, mais peut-être n'y a-t-il là qu'une question de
différence d'âge et de sexe pour justifier le décalage ; l'étalonnage
primitif n'étant basé que sur des expériences faites sur des hommes.
On ne trouve aucune concordance entre cette épreuve et un test
d'intelligence, mais une validité suffisante pour le diagnostic des
tendances hystériques, schizoides ou cycloïdes et l'établissement d'un
type normal. L'échelle n'est pas d'un grand secours dans l'étude des
caractéristiques émotionnelles du type épileptoïde. I. L.
1478. — H. F. DICKENSON. — Pattern sectioned pupils in lieu of
equivalent test forms for classroom testing (Tests équivalents dans
examen collectif remplacés par modèle à clé différente selon le groupe
d'élèves examiné). — J. of Ed. Res., XXXIII, 3, 1939, p. 183-188.
Les fraudes sont fréquentes en examen collectif parce qu'un
©lève peut toujours suivre les gestes de ses camarades pour retrouver
par exemple la place de la réponse à pointer dans une épreuve de
l'année psychologique, xi. 52 ANALYSES BIBLIOGRAPHIQUES 818
choix multiples ; par ailleurs on ne peut renouveler perpétuellement
l'épreuve sous forme équivalente. L'A, propose de sectionner la
classe en différents groupes, chacun devant répondre au même test
en employant un code différent auquel il est facile de s'adapter ; Ifr
système est ingénieux et permet des comparaisons plus équitables que
des formes équivalentes de tests scolaires, où l'étendue du vocabulaire
acquis a son rôle à jouer. L L.
1479. — T. M. ABEL. — Subnormal girb with discrepant test pat
terns (Filles subnormales ayant donné des schémas discordants
de tests). — J. of appl. Ps., XXIÎI, 3, 1939, p. 398-404.
Le « test-pattern » est le rapport du Q. ï. établi d'après l'échelle
non-verbale de Pintner au Q. I. déduit des tests verbaux Otis (Inter-
mediate S. A. Exam.). Dans un groupe de 400 jeunes filles arriérées
d'âges civils de 15-16 ans, occupées à l'apprentissage delà confection,
on a prélevé deux sous-groupes extrêmes, tous deux composés de
sujets qui ont donné aux tests d'Otis des Q. I. de 60-80 ; mais un
sous-groupe de 30 sujets a présenté aux tests de Pintner des Q. I.
de 100-109 et des « tests patterns » de 1,3 à 2 ; un autre groupe
de 26 sujets a des Q. I. de 60-80 aux tests de Pintner et des rapports
de 0,81 à 1,05.
Le premier groupe a montré par rapport au second une supériorité
assez prononcée dans divers autres tests, surtout des tests non-
verbaux ; il s'est montré aussi, d'après des appréciations des maît
resses, nettement supérieur à l'apprentissage ; dans le deuxième
groupe, 20 -sujets sur 25 ont été jugés incapables d'apprendre le
métier. D. W.
1480. — J. J. SMITH. — Reliability of scoring an academic test te
which the examinees responded by writing sentences (Validité
dans l'étalonnage d'un test scolaire auxauels les sujets ont répondu
par écrit). — J. of Ed. Res., XXXIII, 2, 1939, p. 81-88.
Dans la plupart des tests scolaires le sujet ne peut pas répondre
autrement que par oui ou non, à moins qu'on ne lui offre la possibilité
de trouver une réponse adéquate parmi des solutions variées. Mais
l'A. trouve une validité égale à un type d'épreuves auquel il est
permis de répondre par des phrases de son propre cru, l'épreuve étant
cotée par le professeur ou au moyen d'un système de correction
préétabli. Il y aurait donc peut-être moyen de donner plus de sou
plesse à la forme même du test scolaire. I. L.
1481. — LEE J. CRONBACH. — Note on the multiple trae-faïse test
exercise (Note sur V emploi de tests à réponse vrai-faux). —
J. of ed. Ps.; XXX, 8, 1939, p. 628-631.
Quelques indications sur les avantages présentés par le type de
tests à réponses multiples.
L'un des principaux est la facilité de correction : la notation se
faisant par -f ou 0, si l'on a pris soin de disposer verticalement les
réponses possibles, il suffit d'un coup d'oeil rapide pour se rendre
compte de la valeur des résultats. D'autre part, si le nombre des est important pour chaque question, 5 ou 6 solutions étant ÉTALONNAGE ET CRITIQUE BES TESTS 819
offertes à la réflexion des sujets, parmi lesquelles 2 ou plus peuvent
convenir, on a immédiatement une quantité de réponses assez consi
dérable pour un nombre de problèmes proposés relativement faible.
Ainsi, dans les cas d'examen de connaissances, de capacité de
généralisation, de classification, un exercice de ce genre renseigne
aussi rapidement que 4 ou 5 questions posées sous la forme courante.
J. M.
1482. — E. R. SKAGGS. — Effects of training on individual diffe
rences, series II (Effets de r apprentissage sur différences individ
uelles, série II). — J. of gen. Ps., XVIII, 2, 1938, p. 357-366.
L'auteur attire l'attention sur les différences qui peuvent naître
des variations dans les méthodes de computation, il propose d'établir
des techniques précises permettant d'éliminer cet élément de trouble.
I. L.
1483. — PERGIVAL M. SYMONDS. — Research on the interviewing
process ( Recherches relatives au processus de V interview ). — - J. of
ed. Ps., XXX, 5, 1939, p. 346-353.
Courte étude des causes d'erreurs possibles dans l'interprétation
des sentiments et des opinions de la personne interrogée. Celles qui
sont inhérentes à la personnalité même du sujet (inintelligence,
émotivité, antipathie à l'égard de l'interrogateur, etc.), sont diff
icilement remédiables ; il en est de même pour la partie adverse.
L'opérateur sait plus ou moins bien conduire un interrogatoire et
inciter l'interlocuteur à la franchise, à la liberté de paroles.
Mais en ce qui concerne l'établissement du rapport de l'entrevue,
l'A. est formel, et conseille d'y procéder sans perdre de temps et aussi
fidèlement que possible. Il envisage deux moyens : sténographie
directe des paroles prononcées par une personne dissimulée par un
paravent, ou, de préférence : enregistrement de la conversation par
un dispositif électrique.
Il indique brièvement les avantages et inconvénients des divers
systèmes actuellement fabriqués et dont l'usage est répandu en
Amérique. J. M.
1484. — L. D. ANDERSON. — The predictive value of infancy tests
in relation to intelligence at five years (La valeur prédictive de
tests de première enfance par rapport à V intelligence de Venfant
de 5 ans). — Child Dev., 3, 1939, p. 203-212.
Analyse de la valeur prédictive des échelles de performance de
petits enfants comparées au niveau mental de 5 ans. Il en résulte que
l'échelle de performance du bébé a très peu de signification quant à
la prévision de son niveau mental à l'âge de 5 ans. Par contre la
compréhension des mots et le développement du langage jouent un
très grand rôle au point de vue prévision. Les tests de 3 et 6 mois
et ceux de 18 mois ont plus de validité que ceux de 9 et de 12 mois.
La combinaison de résultats des tests de 3, 6, 9, 12, 18 et 24 mois a
une corrélation de -j- 0,64 avec le niveau mental de 5 ans. D. M.
1485. __ e. DONALD SISSON. — Suggestion in art judgment

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.