Étalonnage et critique des Tests. Technique psychométrique - compte-rendu ; n°1 ; vol.32, pg 887-899

De
Publié par

L'année psychologique - Année 1931 - Volume 32 - Numéro 1 - Pages 887-899
13 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : jeudi 1 janvier 1931
Lecture(s) : 22
Nombre de pages : 14
Voir plus Voir moins

3° Étalonnage et critique des Tests. Technique psychométrique
In: L'année psychologique. 1931 vol. 32. pp. 887-899.
Citer ce document / Cite this document :
3° Étalonnage et critique des Tests. Technique psychométrique. In: L'année psychologique. 1931 vol. 32. pp. 887-899.
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1931_num_32_1_5130tSYCHOTECHNÎQUE. ÉTALONNAGE, CRITIQUE DES TESTS 88?
3° Etalonnage et critique des Tests
Technique psychométrique x
1609. — H. F. ADAMS. — Measurement in Psychology {La mesure
en psychologie). — J. of appl. Ps., XV, 6, 1931, p. 545-554.
Les mesures en psychophysique exprimées en unités des intensités
liminaires ont une claire signification. Mais lorsqu'on pense évaluer
la capacité mentale d'un sujet par le nombre de questions résolues
dans un test d'intelligence, c'est comme si l'on exprimait la capacité
d'un coureur par le nombre de jalons, placés à des distances inégales
(les questions des tests étant d'inégales difficultés) qu'il a dépassés en
3 minutes 1/2. Et le quotient intellectuel est la plus fallacieuse des
mesures, s'il est vrai, comme on l'affirme, que les questions deviennent
de plus en plus difficiles à mesure qu'on s'élève dans l'échelle des âges :
ainsi se trouvent exagérées les déficiences et pénalisées les intelligences
brillantes.
Et l'auteur rappelle que tous les résultats de tests et toutes les
évaluations par des juges compétents, n'ont point la valeur de
nombres, mais seulement celle d'un plus ou un moins, lorsque deux
ou plusieurs sujets sont comparés entre eux, La méthode de compar
aison « par couples » et la méthode « de classement » sont les deux qui
satisfont à cette exigence et sont suffisamment souples pour être
employées au laboratoire et en dehors du laboratoire. D. W.
1610. — B. BIEGELEISEN. — La valeur diagnostique des examens
psychotechniques. — W. KOWALSKI. — Remarques critiques
à propos de l'article de M. Biegeleisen (en polonais). — Psychot., V,
1931, 1, p. 10-37 et 3 p. 126-130.
La nécessité pratique d'introduire une synthèse dans les résultats
de testa, indépendamment de tout problème général sur les fonctions
psychiques, soulève certaines difficultés, En analysant celles-ci,
avec de nombreux exemples à l'appui, B. conclut qu'il est indispen
sable d'affecter les tests de coefficients de poids différents. Ceux-ci
seront déterminés d'après trois facteurs : échelle de notation, difficulté
du test, sa corrélation avec la réussite dans la vie pratique. Pour rendre
les échelles homogènes (ce qui est inutile lorsqu'on a affaire aux
centiles ou aux déciles) B. propose le quotient des résultats bruts
par l'écart-étalon. Pour la détermination de là difficulté du test, il
préconise l'une des trois formules suivantes : 1° D = M. A. de tous
les résuit. — résuit, max. ; 2° d'après Pearson D = 3 (M. A. — Val
eur Mé.) ; 3° d'après Kelley : D = P50 - 1/2 (P10 + P90). La
difficulté des tests à problèmes multiples pourrait être évaluée par le
rapport entre les temps moyens nécessaires à la solution d'un pro
blème de chaque test. La corrélation avec la réussite devrait être
calculée d'après la formule de Spearman ou celle de Pearson. Le poids
du test serait ainsi proportionnel à sa difficulté et au coefficient de
corrélation avec la réussite.
La critique de K., porte principalement sur le facteur difficulté.
1. Voir aussi les n01 530, 534, 1221. 888 ANALYSES BIBLIOGRAPHIQUE^
D'une façon générale la difficulté ne lui semble pas être une condition
de la valeur diagnostique du test. Quant aux formules proposées par
B., elles ne sont pas d'usage facile ; donnant souvent des coefficients
négatifs. L'introduction du facteur temps n'est ni fondée ni pratique,
contraire à la tendance actuelle de restreindre le temps des épreuves.
Seul le coefficient de corrélation avec la réussite pratique semble à K.
utilisable, mais insuffisant par lui-même. A. R.
1611. — G. R. SMITH. — Mental : Growth. Criticism (La croissance
mentale : remarques critiques). — J. of appl. Ps., XV, 3, 1931,
p. 319-323.
Critique d'un travail de Jordan de l'an dernier qui indiquait une
croissance linéaire pour tous les groupes d'enfants étudiés en em
ployant des tests de niveau mental. A. indique que cette linéarité,
que l'on doit fatalement retrouver en moyenne, peut être interprétée
de façon différente si au lieu de noter les progrès en âges mentaux,
on note le quotient intellectuel et il demande qu'une courbe de crois
sance soit établie avec l'emploi des mêmes tests pour tous les âges.
D. W.
1612. - B. BIEGELEISEN. - Ueber den diagnostischen Wert psy-
chotechnischer Eignungsprüfungen {Sur la valeur diagnostique des
tests psychotechniques d'aptitude). — Ind. Psychot., VIII, 4, 1931,
p. 113-128.
L'auteur insiste sur l'importance de connaître la valeur diagnos
tique de chaque test, ainsi que le degré de difficulté de ce dernier,
pour pouvoir apprécier le rendement d'une série de tests. La valeur
diagnostique du test s'obtient par comparaison du rendement du test
avec le rendement professionnel de l'individu, la difficulté du test,
d'après la forme de la courbe de fréquence, de distribution des résul
tats. En apportant comme exemple des expériences personnelles,
l'auteur montre la supériorité de cette méthode d'évaluation sur la
méthode consistant à évaluer les résultats de l'examen psycho
technique par simple addition des rendements des tests. B. N.
1613. — A. FORD. — Neutralising Inequalities of Rating (Pour ni
veler les inégalités des évaluations). — Pers. J., IX, 1931, p. 466-
469.
Même lorsqu'ils sont censés employer la même échelle d'évaluation,
les juges différents diffèrent entre eux, aussi bien pour la sévérité gé
nérale de leurs appréciations que pour la dispersion des notes effe
ctivement employées. Pour rendre ces notes comparables, l'A. pro
pose d'en égaliser d'abord le degré de sévérité, par une correction
égale à la différence entre les moyennes des deux séries, et pour
neutraliser l'influence de la dispersion variable, il propose de rappor
ter les écarts à l'écart moyen de l'un des juges choisi comme étalon.
On ne voit pas quel avantage peut présenter ce procédé par rap
port à la méthode classique des écarts réduits. D. W.
1614. - B. F. HAUGHT. - The Language Difficulty of Spanish-
American Children (Les difficultés de langue chez les enfants espa
gnols en Amérique). — J. of appl. Ps., XV, 1, 1931, p. 92-95.
On a pensé que l'infériorité manifestée par les enfants espagnols en Psychotechnique, étalonnage, critique des tests 889
Amérique dans les tests de niveau mental était attribuable aux diffi
cultés de langue et s'atténuait avec l'âge et le temps de fréquentat
ion scolaire.
H. a examiné des enfants d'origine espagnole de 7 à 19 ans. LesQ. I.,
loin d'augmenter avec l'âge, restent assez constants : la moyenne est
de 79. D. W.
1615. — M. SIRKIN. — Constance des résultats des mesures psycho
physiologiques. — Psychot. i. psychoph. Tr., IV, 2-3, 1931, p. 112.
(en russe).
Sirkin ne se lasse pas de rappeler, — avec raison, — combien il
importe de tenir compte de l'inconstance des mesures psycho -physio
logiques et de distinguer la variabilité systématique de la variabilité
fluctuante.
Les déceptions qui se font jour dans la psychotechnique indust
rielle allemande seraient dues, de l'avis de S., à la constance insuffi
sante des tests sensoriels et moteurs dont le marché
est encombré.
S. a fait l'étude de l'impulsomètre sur lequel le sujet doit effectuer
des frappes de marteau, la première avec une force quelconque, la
deuxième , avec une force égale à la première. L'écart de force entre
les deux frappes mesurait la précision de l'effort.
Vingt déterminations ayant été faites pour chaque sujet dans une
même séance, les corrélations entre quelques-unes des déterminations,
prises au hasard, ont été très faibles : entre la 3° et la 6°: 0,10; entre la
10e et la 11e : 0,22 ; entre la 15e et la 18e : 0,08.
Lorsque le sujet était instruit des erreurs commises et devait
maintenir toutes les frappes constantes, la stabilité des écarts entre
deux frappes a été de 0,33 ; par contre, la pression initiale que le sujet
avait également pour mission de maintenir constante a donné une
stabilité élevée : corrélation de 0,83 en moyenne.
Dans le cas où l'on dispose de plusieurs mesures pour un même
sujet, S. recommande d'exprimer la stabilité des tests par la diffé
rence entre l'unité, et le carré du rapport de la variabilité individuelle
à la variabilité du groupe.
Cette recherche a montré aussi que la formule de prévision de
Spearman-Brown n'était pas toujours vérifiée. D. W.
1616. - A. H. TURNEY. - A Study of the Reliability of Judgments
to the Certainty of the Judgments, to the Interval between Jud
gments, and to the Number of Subjects judged [Une étude de la
validité des jugements en relation avec la certitude des jugements,
V intervalle de temps entre les jugements et le nombre de sujets jugés).
- J. of appl. Ps., XV, 3, 1931, p. 259-272.
A. a utilisé des échelles analogues à celles de Terman avec repré
sentation graphique des notes pour demander aux maîtres de juger
leurs élèves au point de vue d'un certain nombre de traits de caract
ères. Les différents juges ont eu un différent de sujets à
apprécier, de 21 à 76, et l'intervalle de temps entre les deux jugements
a varié de 51 à 80. Or, le juge qui jugeait le plus petit nombre d'en
fants n'a pas été le plus constant, bien que ses deux notations aient 890 ANALYSES BIBLIOGRAPHIQUES
été faites avec l'intervalle de temps le plus court. A. en conclut que,
ni le nombre de sujets à apprécier, ni le temps écoulé entre les juge
ments ne sont des facteurs importants de la stabilité du jugement ;
celle-ci relèverait d'une aptitude individuelle du juge.
Il y aune légère corrélation positive entre la certitude des jugements
et leur stabilité. D. W.
1617. — M. SMITH. — Group judgments in the field o£ personnality
traits (Jugements de groupe dans le champ des traits de personnalité).
- J. of exp. Ps., XIV, 1931, p. 562-565.
On lit à 50 étudiants des observations sur un enfant ; on leur de
mande d'apprécier la fréquence (sur une échelle de 0 à 4) de chaque
trait de caractère, et on cherche entre ces jugements des corrélations
statistiques. Contrairement à l'opinion de Gordon, les corrélations
ne s'élèvent pas à mesure qu'on compare des groupes de juges pius
nombreux. ■ P. G.
1618. — W. A. BARTON, Jr. — Improving the True-False Examinat
ion [Amélioration à la Méthode des Tests «vrai- faux»). — S. and
S., n° 877, 17 octobre 1931, p. 544-546.
L'A. pense que la méthode qui consiste à répondre à un test par
oui ou par non n'est pas du tout efficace, car il y a des degrés et des
nuances multiples et faire le total des « oui » et des « non » ne signifie
pas grand chose ; c'est pour pallier à ce manque de certitude qu'il
expose à l'aide de tableaux une façon spéciale de répondre aux ques
tions qui rend mieux compte de ce que pense l'étudiant.
L. B.
1619. - F. F. BRADSHAW. - Revising Rating Techniques {La
révision des techniques d'évaluation). — Pers. J., Xy 4, 1931, p. 232-
245.
L'auteur discute les différents moyens psychologiques pour l'éva
luation de la personnalité humaine, et en particulier les deux échelles
proposées ces temps-ci par Scott Company et par « Committee on
Personnel Procedures of the American Council on Education ». Il con
clut que le point le plus important dans les nouvelles échelles consiste
dans l'inclusion du « behaviogram » (illustration par la conduite du
sujet ou par les faits, des traits évalués). Une échelle ainsi construite
peut rendre des services importants à l'industrie.
L'article contient les modèles des échelles et une liste bibliogra
phique importante sur la question. B. N.
1620. — E. B. HURLOCK. — The psychology of incentives (La
psychologie des stimulants). — J. of Soc. Ps., II, 3, 1931, p. 261-
291.
L'influence des stimulants dans les expériences d'apprentissage
est étudiée d'après les résultats obtenus par de nombreux cher
cheurs, et dont l'A« indique une bibliographie importante (150 ou
vrages).
L*effet de stimulants agréables ou désagréables est observé sur
des animaux et sur des humains ; on constate que tous les sujets Psychotechnique, étalonnage, critique des tests 891
ont un rendement habituel inférieur à leurs possibilités et la diffé
rence entre la réussite effective et la capacité est d'autant plus im
portante que les sujets sont plus intelligents. Pour les animaux, on
emploie comme stimulants : la satisfaction sexuelle, la nourriture
ou une punition (généralement une secousse électrique), leur valeur
est inégale, la nourriture et la sexuelle sont les plus
efficaces et les plus souvent étudiés au point de vue de l'intensité.
Pour les humains, on emploie : la connaissance des résultats, félic
itations, reprochés, récompenses, la présence de spectateurs, la rival
ité, des distractions, la musique.
Si tous ces stimulants augmentent le rendement, en raisort de leur
intensité, il est difficile de les classer au point de vue de leur efficacité,
car leur action est très variable suivant les sujets et les conditions
d'expérience. J. M.
1621. - F. S. FREEMAN. - The factors of speed and power in
tests of intelligence (Les facteurs de vitesse et de puissance dans les d'intelligence). — J. of exp. Ps., XIV, 1931, p. 83-90.
Dans la plupart des tâches de la vie quotidienne il est douteux que
la vitesse soit en rapport avec la puissance de l'intelligence. Quand il
s'agit de l'intelligence mesurée par les tests, quel rôle y joue la
vitesse ? Pour le déterminer, F. compare les principaux tests d'intell
igence usuels en faisant varier du simple au double le temps dont
dispose le sujet pour résoudre les problèmes ; il admet qu'une corréla
tion élevée entre les résultats de ces deux épreuves prouVe que le
test mesure surtout la puissance intellectuelle, tandis qu'une corré
lation faible indique le rôle prépondérant de la Vitesse. Il semble que
la plupart des tests mesurent surtout le premier aspect. P. G.
1622. - M. A. TINKER. — The significance of speed in test res
ponse (La signification de la vitesse dans les réponses aux tests). — Ps.
Rev., XXXVIII, 5, 1931, p. 450-454.
De très nombreuses recherches ont été effectuées dans l'espace des
trente dernières années visant à trouver une relation entre la Vitesse
de la réponse et l'intelligence. La conclusion qui s'en dégage, c'est
qu'il n'y a pas de facteur commun à la base des réponses aux tests
de motricité et aux tests d'intelligence. Par contre, on est autorisé
à admettre qu'il existe dans les réponses motrices des facteurs de
groupes (group factors) qui accusent des degrés variables de spéci
ficité et que, d'autre part, il y a une relation entre la vitesse et l'apt
itude (ability) se révélant dans les réponses aux tests mentaux et
scolaires, lorsque la vitesse et l'aptitude sont mesurées par des
épreuves du même genre. — Dans le cas où le test est exécuté avec
une exactitude pratiquement constante, deux méthodes équivalentes
peuvent être appliquées : 1) la méthode de limite du temps et 2) la
méthode de limite du travail effectué (le temps nécessaire pour
effectuer la tâche égale la vitesse). L'examen auquel l'auteur a
soumis les résultats des diverses recherches récentes semble
indiquer, en effet, que ces deux méthodes sont pratiquement équi
valentes. Il semblerait, en outre, que tontes les fois que les méthodes
de temps et de travail fourni sont pratiquement équivalentes elles 892 ANALYSES BIBLIOGRAPHIQUES
peuvent servir toutes les deux à déterminer la présence ou l'absence
du facteur général dans l'exécution des tests. P. K.
1623. — G. C. WEIDMANN. — The « omissions » as a specific deter
miner in the true-false examination (Les omissions en tant que
déterminants spécifiques dans les tests par vrai ou faux). — J. of ed.
Ps., XXII, 6, 1931, p. 435-439.
Pour 331 étudiants ayant subi 7 tests à réponses par vrai ou faux,
les réponses omises ont porté plus fréquemment sur des jugements
« vrais » (56 %) que sur des faux (44 %) ; la différence est statist
iquement significative. A. B.-F.
1624. - N. F. STUMPF. - Listening versus Reading Method in the
True-False Examination [La méthode d'audition et la méthode de
lecture dans les tests de forme exact-inexact). — J. of appl. Ps., XV,
6, 1931, p. 555-562.
Un test comportant des questions auxquelles il fallait répondre
par « exact » ou « inexact » a été appliqué d'abord sous une forme
orale, les affirmations étant lues chacune deux fois et le sujet marquant
sur une feuille en face des numéros des questions une lettre indiquant
sa réponse ; puis, après 8 jours, sous forme miméographiée, chaque
sujet pouvant lire lui-même les questions. La plupart des sujets
interrogés (84 %) ont déclaré cette dernière méthode beaucoup plus
satisfaisante. D'ailleurs, les corrélations entre les deux applications
ont varié, dans les différents groupes, de 0,37 à 0,70 avec une moyenne
de 0,51 ; — et les corrélations avec le Q. I. ont été plus élevées pour
la première application. D. W.
1625. - J. P. GUILFORD. - Some empirical tests of the method of
paired comparisons (Quelques tests empiriques de la méthode des
comparaisons deux à deux). — J. of gen. Ps., V, 1, 1931, p. 64-77.
Comparaison, d'après une série d'appréciations de poids, de la
méthode habituelle d'échelonnage (supposant une fonction normale)
et d'une méthode abrégée proposée par l'auteur, qui possède sur la
précédente de légers avantages si l'on ne tient pas à une unité définie
une fois pour toutes, telle que l'écart étalon. A. F.
1626. - E. BROOM, J. DOUGLAS et M. RUDD. - On the
validity of Silent Reading Tests (Sur la validité des tests de lecture
silencieuse). — J. of appl. Ps., XV, 1, 1931, p. 35-38.
Etude des intercorrélations entre plusieurs tests de lecture utilisés
aux Etats-Unis. Les coefficients sont en général assez élevés et os
cillent le plus souvent aux environs de 0,75. D. W.
1627.- A. ROSENBLUM. - « Kontrolltest » als Prüfungsmethode der
Testhomogeneität (Le « test de contrôle » comme méthode servant à
déterminer l'homogénéité du test). — Z. für ang. Ps., XL, 5-6, 1931,
p. 493-502.
Nous avions déjà signalé ce travail, lors de sa parution en russe,
dans un recueil des travaux de l'Institut du Travail de Kharkow.
L'idée est ingénieuse et pourrait être utilisée avec avantage dans
l'analyse et la construction des tests. PSYCHOTECHNIQUE. ÉTALONNAGE, CRITIQUE DES TESTS 893
11 s'agit de ceci. Dans certains tests on peut supposer parfois qu'à
la tâche imposée, le sujet en substitue une autre, plus facile. Lorsque
celle-ci peut, elle aussi, conduire à des solutions correctes, les résultats
"deviennent équivoques. Pour obtenir, d'une façon objective, des
renseignements sur la méthode employée par la masse des sujets, il
convient d'appliquer un test de contrôle dans lequel on donnera
justement pour consigne la tâche dont on suppose qu'elle a été em
ployée illégalement, si l'on peut dire, dans le test principal.
Ce contrôle a été effectué par l'A. sur un test d'analogies sous
forme de choix multiple (chasseur-fusil ; pêcheur-rivière, poisson,
canot, gibier, filet). On peut se demander si, à la tâche imposée (r
echerche de la relation analogique) le sujet ne substitue pas parfois
une autre, toute différente, celle de l'association. Le sujet qui sou
ligne poisson n'a-t-il pas purement abandonné la consigne et considéré
simplement le lien entre le 3e et le 4e mot, sans se préoccuper de la
relation qui existe les deux premiers mots de la série ?
L'A. a effectué le contrôle en appliquant dans un autre groupe de
sujets aussi semblable que possible aux premiers, un test d'asso
ciations qui comprenait le même matériel que son test d'analogie,
sauf que les deux premiers mots de chaque série étaient omis.
Et il a trouvé effectivement que le mot poisson était maintenant
souligné dans 61 % de cas, ce qui semble bien indiquer qu'il peut
correspondre à la tâche « association ».
Les mots qui constituent la bonne réponse dans le test d'analogies
et se sont encore trouvés soulignés dans la majorité des cas dans le
test d'associations, doivent être éliminés du test d'analogies car ils
constituent des épreuves dont le résultat est équivoque.
La méthode permet encore une analyse des erreurs. Celles qui sont
plus fréquentes dans le test d'analogies que dans le test de contrôle
et commises, dans le premier, par des sujets dont le résultat moyen
dans les tests d'intelligence est. plus élevé que celui des sujets qui ont
donné la même réponse dans le test de contrôle, peuvent être considé
rées comme erreurs de raisonnement. Les erreurs pour lesquelles ces
relations sont renversées peuvent être considérées comme erreurs
mécaniques. Ainsi, dans l'exemple cité, le mot canot a été souligné,
dans le test d'analogies par 36,8 % de sujets, dans le test de contrôle
par 13 % ; les premiers ont eu un Q. I. moyen de 102, les autres de 96.
On peut supposer qu'il s'agit d'une erreur logique. Pour le mot
poisson, les chiffres ont été de 19,9 % et 61 % et les Q. I. de 86 et 97.
Ce serait une erreur mécanique. D. W.
1628. — H. EASLEY. — An attempt to isolate the factor of attention
(Essai pour isoler le facteur <V attention) . — Am. J. of Ps., XLIII,
2, 1931, p. 202-215.
Ce travail est une intéressante application du calcul des tétrades,
utilisé ici pour essayer de mettre en évidence un facteur central d'atten
tions parmi les tests les plus typiques imaginés pour mesurer cette
fonction. Cinq ont été choisis : barrage de lettres (Whipple),
recherche des groupements significatifs dans une suite ininterrompue
de lettres (Münsterberg), temps de réaction simples et leur variation
moyenne, accroissement du temps de dans certaines conrli- 894 ANALYSES BIBLIOGRAPHIQUES
tioos défavorables d'attente (Woodrow). Les 68 sujets examinés ont
encore subi différents tests d'intelligence. La cohérence des résultats
est bonne, les intercorrélations faibles, voire légèrement négatives.
Le médian empirique de la distribution des tétrades est inférieur à
l'erreur probable escomptée. Il est donc impossible de parler d'un
facteur d'attention qui serait commun à ceux des tests considérés*
comme propres aie mesurer. Même entre deux activités apparemment
très voisines, la réaction simple et le test de Woodrow, la corrélation
est nulle (— 0,03). En introduisant dans les calculs les résultats des
tests d'intelligence, on trouve l'indication d'un très léger facteur de
groupe : en admettant qu'il mérite le nom d'« Attention », ces tests
sont encore, pour mesurer celle-ci, les moins mauvais ! A. F.
1629. - M. P. PORTER et J. G. LEUDERBACH. - On the Cons
tancy of the I. Q. {A propos de la Constance du Q. I.). — S. and
S., N° 855, 16 mai 1931, p. 675-676.
Un test d'intelligence ayant été organisé dans un certain nombre
de jardins d'enfants et de petites classes on le refit au bout de plusieurs
mois ; ce sont les résultats comparés de ces deux épreuves que nous
communiquent les auteurs, en les commentant et en faisant la critique
de la méthode. L. B.
1630. - S. C. GARRISON. - Retests of Adults at an interval of
ten years (Adultes retestés au bout de dix ans). — Ps. Bul. (Southern
Soc. for Ph. and Ps.), XXVIII, 5, 1931, p. 330.
Dix ans après avoir été testés avec l'échelle de Yerkes-Bridge-
Hardwick, comme étudiants, 73 personnes (32 femmes et 41hommes)
ont pu être examinés à nouveau.
A la 2e épreuve, la variabilité s'est montrée plus grande.
Entre les deux épreuves, les coefficients de corrélation, à 10 ans
d'intervalle, ont été de 0,58 pour les hommes, et de 0,76 pour les
femmes, qui ont montré le plus de stabilité (le coefficient étant de
0,81 pour un intervalle de 2 semaines). H. P.
1631. — A. H. TURNEY. — Intelligence, motivation and achieve*
ment {Intelligence, mobiles et résultats). ' — J. of ed. Ps., XXII, 6,
1931, p. 426-434.
Les coefficients de corrélation entre quelques traits de caractères,
tels que la persévérance, la confiance en soi, l'ambition, l'esprit d'entre
prise, appréciés par les maîtres, se sont trouvés liés avec les notes
scolaires par des coefficients plus élevés que l'intelligence, le Q. I. et
l'âge chronologique. L'auteur suggère que ces résultats, loin d'infirmer
la valeur des tests d'intelligence, montrent seulement l'importance
des mobiles dans l'attitude de l'écolier, et pense qu'il devrait être
fait plus de cas de ces facteurs par les éducateurs qu'on ne le fait
actuellement. A. B.-F.
1632. - A. JANKOWSKA. - La valeur des tests collectifs de
Terman, comparés avec les tests individuels Binet-Simon-Terman. —
Pols. Ar. Ps., IV, 4, 1931, p. 274-295.
Se servant de sa propre traduction légèrement adaptée, des « Ter- PSYCHOTECHNIQUE. ÉTALONNAGE, CRITIQUE DES TESTS 895
man Group Tests et Mental Ability » (reproduite intégralement dans
l'article), J. les a appliqués sur 194 élèves des Ecoles Communales de
Filles de Vilna. 74 de ces résultats ont pu être confrontés avec ceux
des tests individuels B.-S.-T. (la comparaison des âges intellectuels).
L'accord des deux examens a été satisfaisant (70 % de cas). Dans
5,5 % de cas l'examen collectif a donné lieu à une sous-estimation,
dans 24,5 % à une surestimation par rapport aux tests individuels.
L'A. conclut que les tests collectifs, plus pratiques, peuvent bien
remplacer l'examen individuel, auquel on n'aura recours que dans
le cas d'une divergence entre les résultats des tests collectifs et
l'opinion des maîtres. A. R.
1633. - E. A. LINCOLN. - The Reliability of the Lincoln Hollow
Square Form Board and a Comparison of Hollow Square Scores
With Stanford Binet Mental Ages {La fidélité du test de la planchette
à trous carrés de Lincoln et comparaison de ses résultats avec ceux de
Stanford- Binet). - J. of appl. Ps., XV, 1, 1931, p. 79-81.
Sur 139 sujets d'âges chronologiques différents, le test de l'auteur
donne un coefficient d'homogénéité (corrigé pour mesurer l'homo
généité du test entier) de 0,952 ± 0,007. La corrélation avec les tests
verbaux (Binet dans la revision de Stanford) semble être de l'ordre
de 0,50. D. W.
1634. - J. E. SEGERS. - Essai d'application du test B. D. collectif.
- J. de N. et de Ps., XXXI, 3, 1931, p. 168-174.
Comparés aux normes indiquées parles auteurs du B. D., les sujets de
l'A. âgés de six ans se sont montrés inférieurs, obtenant en moyenne
64 points au lieu de 88 à 90, comme l'indique l'étalonnage. Mais il
faut remarquer que dans ces applications des créateurs du test, si
les. résultats sont assez comparables pour les garçons dans les deux
Ecoles où ils ont opéré (116 et 118 sujets avec moyenne de 88,48
et 90,10 points) pour les filles (40 et 47 sujets) les deux écoles ont
donné comme moyenne 78,80 et 89,50. Il semble donc qu'il s'agisse de
groupes ou trop peu nombreux ou trop hétérogènes, pour que l'on
puisse parler de normes. Il y a une première expérience faite à laquelle
S. en compare une deuxième et voilà tout, mais il n'y a, semble-t-il,
aucune conclusion à en tirer, sinon la nécessité de mesures plus
nombreuses. En tout cas, dans l'expérience de S. la corrélation entre
les rangs de ses élèves, dans le B. D. et leur rang au test Binet-Simon
est de 0,84 (e. p. 0,03), ce qui est très encourageant. M. F.
1635. — J. M. LAHY. — Etalonnage du "test d'habileté mécanique
de Stenquist. - B. I. N. O. P., III, 5, 1931, p. 121-134.
Important travail d'étalonnage qui permettra de comparer désor
mais les résultats obtenus avec cette intéressante épreuve à des
normes françaises au lieu de se contenter des moyennes américaines.
Les mesures ont porté sur plus de 500 sujets de 12 ans à l'âge adulte.
Tout au long de l'échelle, les sujets français se sont montrés nettement
supérieurs aux sujets américains. Le médian français de 12 ans et demi
est supérieur au médian américain de 15 ans et demi. Plusieurs raisons
(différences légères de technique d'application, échantillonnage diffé-

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.