Étalonnage et Critique des Tests. Technique psychométrique. - compte-rendu ; n°1 ; vol.29, pg 883-902

Étalonnage et Critique des Tests. Technique psychométrique. - compte-rendu ; n°1 ; vol.29, pg 883-902

-

Documents
21 pages
Lire
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

L'année psychologique - Année 1928 - Volume 29 - Numéro 1 - Pages 883-902
20 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.

Sujets

Informations

Publié par
Ajouté le 01 janvier 1928
Nombre de lectures 34
Langue Français
Signaler un abus

3° Étalonnage et Critique des Tests. Technique psychométrique.
In: L'année psychologique. 1928 vol. 29. pp. 883-902.
Citer ce document / Cite this document :
3° Étalonnage et Critique des Tests. Technique psychométrique. In: L'année psychologique. 1928 vol. 29. pp. 883-902.
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1928_num_29_1_4904ÉTALONNAGE ET TECHNIQUE PSYCHOMÉTRIQUE 883
chaque épreuve donne ou enlève un certain nombre de points (va
riable selon la série) : le total exprime donc le retard ou l'avance de
l'enfant par rapport à la moyenne. Pour représenter ce retard au
point de vue qualitatif, on construit un profil où, en regard des diffé
rentes fonctions, on porte l'âge psychologique que les épreuves cor
respondantes attribuent au sujet. — Comme premier résultat de
ces tests expérimentés à, Vienne sur des enfants des classes pauvres
et des classes aisées, on a trouvé une avance d'un mois chez les se
conds, à partir du cinquième mois : elle se localise surtout dans la
fonction de maîtrise des mouvements et secondairement dans le jeu
constructs et l'intelligence des gestes. P. G.
1312. — B. T. BALDWIN et B. L. WELLMAN. — The peg-board
as a means of analyzing form perception and motor control in
young children (Le peg-board comme moyen d'analyser la perception
des formes et le contrôle moteur chez les jeunes enfants).. — J. of genet.
Ps., XXXV, 3, 1928, p. 389-414.
Quatre des peg-boards (planche percée de trous dans lesquels on
introduit des fiches de formes variées) de Wallin ont été utilisés pour
l'étude de la perception des formes et de la coordination motrice
chez les tout jeunes enfants. On s'est moins préoccupé d'établir des
normes que de procéder à une analyse des processus psychologiques
mis en jeu dans l'exécution des tâches imposées. Les expériences
ont iporté sur 269 enfants dont uncertain nombre ont étéexaminé&à
2 reprises, d'autres à 3, 4, 5 et même 6 reprises. Les résultats (notes,
erreurs, durée) et leur distribution sont exposés dans un certain
nombre de tableaux. D'une manière générale on voit croître les notes
avec l'âge, tandis que le nombre d'erreurs et la durée diminuent. On
n'a pas observé de différences entre sexes. Contrairement à ce qui
avait été avancé par d'autres auteurs, on n'a pas. trouvé, chez les
nombreux sujets ayant fait preuve d'inertie (persévération), de
tendance plus marquée à l'introversion que sur les sujets considérés
dans leur ensemble. La tendance à suivre un ordre diminue à mesure
que croît la difficulté du test ; l'intérêt se concentre sur les éléments
difficiles. La répétition du test abrège sa durée d'exécution, la dimi
nution étant surtout sensible pour la deuxième épreuve ; les corré
lations entre la première et la deuxième application des tests, à
deux semaines d'intervalle sont insignifiantes. Par contre l'ordre
dans lequel les « pegs » sont utilisés ne change guère d'une épreuve
à l'autre. A. B.-F.
3° Étalonnage et critique des tests
Technique Psychométrique1
131S. — H. ANTIPOFF. — L'Evolution et la variabilité des fonc
tions psychomotrices. — ■ Ar. de Ps., XXI, 81, 1928, p. 1-54.
L'A. a utilisé comme matériel de recherche, les tests moteurs sui
vants : Po in tillage — Tapping — Enfilage de perles — Découpage —
1. Voir aussi le n° 387. 884 ANALYSES BIBLIOGRAPHIQUES
Disques de Walther — Cible-brodeur (Claparède) — Dynamomètre.
Après étalonnage sur un nombre assez élevé de sujets (750) et cons
truction de barèmes centilés normaux (publiés en détail, ce qui
donne au travail d'A. une première valeur utile incontestable), l'au
teur a repris, complété, ses chiffres, les évaluant de différents points
de vue, les « travaillant » en tous sens pour en tirer le maximum
possible, au sujet des très nombreux et importants problèmes qu'elle
s'était proposée d'aborder. Une première série de recherches est des
tinée à montrer l'influence du milieu social sur les résultats des tests.
Elle est considérable dans certains cas. Les normes étalonnées ne
peuvent donc être valables que si elles sont très partielles (et défi
nissent très exactement sur quel milieu exact elles ont été établies)
ou alors franchement universelles. L'une et l'autre méthode me
paraissent hélas aussi difficiles à réaliser exactement dans la pratique
courante, un milieu réellement homogène au point de vue social
étant peut-être encore plus difficile à composer qu'un milieu uni
versel. — L'idée d'A. ingénieuse a priori, en fait peu facilement réali
sable, est que l'on pourrait déterminer des « coefficients sociaux »
grâce auxquels on pourrait, avec un seul barème corriger les résultats
obtenus, en fonction des différents milieux.
Pour les différents tests étudiés, l'indice discriminatif de dévelop
pement calculé par la méthode de Claparède, se trouve être de -f- 0,55,
entre 12 ans et l'âge adulte. Pour l'indice d'aptitude, il s'élève envi
ron à 0,11, autrement dit le semi-interquartile est environ le dixième
du médian, ce qui semble assez satisfaisant.
Reprenant ses résultats et superposant les ogives de tous le âges
pour un même test, A. constate que le graphique ainsi obtenu a un
aspect particulier, différant suivant l'évolution de l'aptitude avec
l'âge, et aussi la dispersion individuelle. Elle distingue de la sorte
les graphiques globaux d'aspect échelonné, ou massé, monotypique ou
bitypique.
Même quand il s'agit d'un test aussi satisfaisant que possible
comme mesure d'aptitude, le rendement augmente cependant avec
l'âge. C'est ce que l'on peut appeler la dispersion verticale. L'âge
adulte d'une aptitude sera le moment où cessera de se manifester
cette dispersion verticale. Pour certaines aptitudes, l'âge adulte
exis e déjà vers 12-14 ans, même avant dans quelques cas assez
rares, pour d'autres au contraire ce n'est que vers 21-23 ans qu'on
peut considérer qu'il est atteint. — ■ La variabilité d'une aptitude (ou
dispersion horizontale), ne croît pas nécessairement avec l'âge.
L'ampleur des variations individuelles reste sensiblement constante
pour certains tests, pour le tapping ou le découpage, elle a même
tendance à diminuer quelques autres comme les disques, les
perles, le pointillage. Ce n'est guère que pour l'épreuve du dynamo
mètre que la dispersion s'accroît effectivement avec l'âge. Et encore
dans ce cas, faut-il remarquer que l'auteur a employé simplement
l'épreuve du dynamomètre ordinaire à ressort, passible de tant de
critiques justifiées, assez classiques pour ne pas les reproduire ici
une fois de plus.
Le développement moteur ne consiste pas seulement en une aug
mentation1 quantitative, c'est-à-dire, augmentation de force, de vi- ÉTALONNAGE ET TECHNIQUE PSYCHOMETRIQUE 885
tesse, il y a une véritable évolution qualitative du mouvement. Les
mouvements des jeunes enfants par exemple sont différents de nature
de ceux d'enfants plus âgés ou d'adultes. Les cyclogrammes que l'A.
reproduit sont très nets à cet égard. — La question des sexes se pose
dans une étude des fonctions motrices. Si au dynamomètre et au
tapping, mettant en jeu un effort intense et momentané, les hommes
sont supérieurs, pour les autres tests au contraire, tantôt les filles,
tantôt les garçons prédominent en fonction de l'âge. C'est vers
quinze ans que la prédominance de la fillette est presque générale.
Le calcul des coeff cients de corrélation entre les résultats des
différents tests montre une positive, mais d'indice assez
faible, la plupart du temps. Il semble donc bien que l'on puisse consi
dérer les fonctions motrices comme relativement indépendantes les
unes des autres, et qu'on ne puisse pas se contenter d'un seul test
pour en donner une évaluation générale de quelque valeur prédictive.
Enfin en ce qui concerne la corrélation entre l'ensemble des tests
moteurs et l'intelligence, les coefficients sont généralement négatifs
chez les sujets normaux. Ce n'est que chez les arriérés franchement
déficients que l'on note une décroissance parallèle de l'intelligence et
des fonctions motrices.
Cet assez long travail, bourré de chiffres, de tableaux, de gra
phiques, dont quelques-uns fort intéressants, rendra certainement
bien des services. Certaines des conclusions déduites par l'auteur de
ses expériences, en particulier la notion d'âge adulte des aptitudes,
sont importantes pour la psychotechnique dans les problèmes de
l'orientation et de la sélection professionnelle. On aura avantage
également à utiliser les barèmes normaux publiés par l'auteur con
cernant ses cinq principaux tests, sous réserve de les modifier peut-
être par des recherches statistiques plus étendues. M. F.
1314. — M. COLLINS. — British norms for the Pressey cross out
test (Normes anglaises du test de ray age de Pressey). — Br. J. of
Ps., XVIII, 2, 1927, p. 121-133.
Chaque test renferme une série de 25 groupes de cinq mots. Le
sujet doit souligner dans chaque groupe le mot qui correspond à ce
qui l'intéresse, à ce qui est mauvais, à ce qui a déjà provoqué chez
lui de l'anxiété ou du tracas, II doit en relisant son texte à la fin de
l'épreuve, entourer d'un cercle les mots qui présentent au plus haut
degré les caractères indiqués. Ce test est américain et Pressey a
publié les normes américaines. C. a appliqué le même test à 1.500 en
fants de 11 à 15 ans d'Ecosse et d'Angleterre. Les normes trouvées
sont tout à fait différentes et il y a là des indications assez curieuses
sur la différence de mentalité entre les deux pays. C. pense que le
test ne donne pas de renseignement sûr en ce qui concerne la vie
émotionnelle du sujet. En répétant le test sur 100 sujets à un an d'in
tervalle, on trouve des résultats tout à fait différents. Au bout d'un
intervalle de huit jours, il y a déjà des différences, moins grandes sans
doute, mais tout de même assez considérables pour que l'on puisse
mettre en doute la valeur du test comme révélateur du caractère.
En revanche la comparaison des résultats obtenus avec des en
fants normaux et des délinquants montre que chez ces derniers 886 ANALYSES BIBLIOGRAPHIQUES
l'écart moyen par rapport à la norme est nettement plus élevé. Il y
aurait donc là un moyen de diagnostic utile. G. P.
1315. — J. C. FLÜGEL et E. J. D. RADCLYFFE. — The Pressey
cross out test compared with a questionnaire {Comparaison du test
de Pressey et d'un questionnaire). — Br. J. of Med. Ps., VIII, 2,
1928, p. 112-131.
Les auteurs ont visé à comparer les résultats obtenus par l'appl
ication des tests de caractère X. O. de Pressey (N° 1 et 4, J. of Appl.
Ps., 1919, III, 138) et d'un questionnaire (précédemment employé
par Allen : Br. J. of Med. Ps., VII, 1928, 391) comprenant 161 ques
tions classées sous 15 rubriques : instinct d'affirmation et d'abaissMe" ement de soi au sens de Dougall, instincts d'acquisition et de
travail (positifs et négatifs), Instinct A (analo-érotique) de Jones,
W. de Spearman,. instincts hypocondriaques, de soupçon et de dé
goût. Le test de Pressey a été appliqué collectivement, le question
naire a été rempli individuellement à domicile par le sujet qui devait
traduire sa réponse par un chiffre (de 0 à 5) allant de la négation
absolue à l'affirmation absolue.
Les auteurs qui se proposaient de découvrir l'évidence que les tests
de Pressey mesuraient réellement le trait de caractère proposé, ont
dû constater que les corrélations entre les tests de Pressey et les
articles du questionnaire relatifs aux mêmes traits, étaient en ma
jeure partie insignifiantes ou inverses. Jusqu'à un certain point,
quelques-uns (dégoût, amour-propre, mélancolie) peuvent indiquer
vaguement la présence d'un tel trait, mais d'autres (peur, méfiance),
représenteraient presque une mesure négative de ce trait.
Une critique qualitative du travail récapitule avec intelligence
les difficultés que rencontre l'établissement de tests de tempérament.
M. L.
1316. — L. A. THOMPSON et H. H. REMMERS. — Some Ob
servations concerning the Reliability of the Pressey X-0 Test.
{Quelques observations sur la cohérence du test X-0 de Pressey). • —
J. of appl. Ps., XII, 5, 1928, p. 477-494.
Les tests de Pressey (qui consistent à barrer les mots qui signifient
quelque chose de désagréable, d'encercler les qui de mauvais, etc. et qui visent la détermination de
l'équilibre affectif) ont été appliqués à des étudiants ingénieurs,
hommes et femmes. Les auteurs fournissent des résultats détaillés
par sexe et diverses corrélations calculées sur les tests. Retenons que
les coefficients de stabilité fournis par deux applications à 3 mois
•d'intervalle sont insuffisants ; ils varient entre 0,152 et 0,58 pour les
divers tests partiels et les divers aspects du test. D. W.
1317. — O. ARTHUR. — The Re- Standardization oî a Point Per
formance Scale (Le réétalonnage d'une échelle en points de tests
d'exécution). — J. of appl. Ps., XII, 3, 1928, p. 278-303.
Huit tests muets (Knox Cube, cinq tests de jeux de patience
connus, complètement d'image de Healy, cubes de Kohs), ont été
appliqués à 1.100 écoliers de 5 à 15 ans. Ces tests, dont la technique ÉTALONNAGE ET TECHNIQUE PSYCHOMÉTRIQUE 887
est rapportée en détail, ont été choisis en raison de leurs valeurs dis-
criminatives élevées (bonne différenciation entre les âges successifs).
Les résultats exprimés en unités des erreurs probables ont permis,
par l'interpolation de la courbe, de fournir un étalonnage par mois
pour l'ensemble de l'échelle. Ces normes varient de 0,64 points à
5 ans 7 mois à 45,31 points à 15 ans 6 mois. D. W.
1318. — DELIA LOUISE LARSON. — An experimental critique
of the Seashore consonance test [Critique expérimentale du test de
consonance de Seashore). — Ps. Mon., XXXVIII, 4 (176), 1928,
p. 49-81.
Recherche pour vérifier la cohérence des résultats fournis par le
test de consonance de Seashore (comparaison de couples d'intervalles)
quand les instructions sont suivies à la lettre et que le contrôle des
conditions est rigoureux, en s'adressant collectivement à 132 étu
diants en psychologie d'Iowa, puis à 1.5.0 autres étudiants, avec
utilisation du gramophone, et en répétant l'épreuve deux fois de suite,
puis une troisième fois après un intervalle de six mois. Un examen
individuel a été fait en outre sur 35 musiciens et 35 autres personnes
de contrôle.
La corrélation entre les résultats d'une première épreuve collec
tive et d'une seconde au bout de plusieurs mois a été de -f- 0,65
± 0,024 et -f- 0,63 ± 0,022 pour les deux groupes d'étudiants (les
indices de cohérence tirés de ces corrélations atteignant 0,77 et 0,79).
En déterminant, pour chaque couple d'intervalles comparés la
proportion pour 100 de jugements identiques, dans les épreuves indi
viduelles, on trouve, en moyenne 83,3 avec les musiciens et 45 avec
les autres, ce qui indique plus de cohérence chez les premiers.
En moyenne la note des sujets musicalement entraînés (proportion
de jugements corrects) est de 77,32 contre 62,14 pour les autres, la
différence n'étant pas suffisante polir attribuer au test de consonance
isolé une valeur d'appréciation de l'aptitude musicale, le test devant
être inséré dans tout un groupe d'épreuves.
L'auteur note que, dans deux cas, il y a discussion sur la validité
de la hiérarchie de consonance admise par Seashore (par exemple
dans la comparaison de la tierce majeure et de la quarte parfaite).
H. P.
1319. — C. P. HEINLEIN. — A brief discussion on the nature and
function of melodic configuration in tonal memory with critical
reference to the Seashores tonal memory test [Une brève discussion
sur la nature et sur la fonction de la configuration mélodique dans
la mémoire tonale avec un aperçu critique du test de mémoire tonale
de Seashore). — J. of Gen. Ps., XXXV, 1, 1928, p. 45-61.
L'auteur soumet à une critique très poussée le test de mémoire
musicale de Seashore, qui est en principe un test d'identification. Il
consiste notamment à présenter aux sujets une série de sons diffé
rents et à leur demander de les reconnaître après qu'un des sons
constitutifs de cet ensemble a été changé. En faisant varier, d'autre
part, le nombre des sons de la série de 2 à 6, ce test peut rentrer aussi
dans la catégorie de tests d'étendue « mnémonique » servant à 888 ANALYSES BIBLIOGRAPHIQUES
l'étude de la mémoire immédiate. Or suivant Heinlein, l'épreuve de
Seashore n'a pas beaucoup d'utilité pour dépister l'aptitude musi
cale pour la simple raison que les personnes douées pour la musique,,
perçoivent même une très simple série tonale comme une configura
tion « mélodique », comme une forme définie. Les sons constituant
une telle série ne sauraient, par conséquent, être changés sans que ce
changement entraîne l'apparition d'une nouvelle configuration
mélodique (« melodic pattern »). Aussi l'auteur est-il amené à exa
miner tous les principaux facteurs intervenant dans la perception
d'une mélodie élémentaire. Ces sont : la direction ascendante,
horizontale, et descendante des « hauteurs », le rythme et la tonalité
ou référence harmonique. Heinlein montre que ce dernier facteur peut
jouer même quand il s'agit de séquences mélodiques aussi brèves
que celles utilisées dans le test de Seashore. Il s'ensuit que les séries
mélodiques employées par Seashore même celles qui comprennent
le même nombre de sons ne sont pas du tout équivalentes en tant
que stimuli et que leur reconnaissance rie présente pas les degrés de
difficulté que Seashore a cherché à établir. Ceci serait confirmé,
d'ailleurs, par la courbe de distribution des erreurs, fondée sur la base
des centiles et obtenue par Seashore lui-même.
L'auteur résume son intéressante étude sous trois chefs : 1° le test
de Seashore pour la mémoire tonale comporte plus de cinq degrés de
difficulté ; 2° la méthode de graduation du test n'est pas adéquate ;
3° la mémoire tonale considérée au point de vue de l'identification a
peu de valeur pour le diagnostic du talent musical. P. K.
1320. — B. KUNZE. — Die menschliche Wahrnehmung von Ges
chwindigkeitsänderungen bei horizontaler Progressivbewegung
(La perception de variations de vitesse dans le mouvement horizontal
en avant, chez l'homme). — Ind. Psychot., V, 3, 1928, p. 65-86.
Pour dégager les facteurs qui interviennent dans l'appréciation
du mouvement chez l'homme dans un véhicule, K. essaie d'étudier
successivement : le facteur visuel par un test d'appréciation de vi
tesse de mouvement des images projetées sur un écran ; le facteur
auditif par la discrimination des bruits d'un moteur; le
vibratoire par un test de discrimination des trépidations d'un moteur,
fixé par l'intermédiaire de ressorts au siège du sujet ; il applique en
outre le test de la balançoire adapté d'après Delage ; un test de temps
de réactions au choc mécanique mettant la balançoire en mouvement
et aux excitations auditives ; un test de contrôle de l'équilibre pen
dant la marche sur planche en équilibre instable ; un test d'appré
ciation des distances pendant la marche ; un test de discrimination
des rythmes. Enfin, les sujets ont été soumis à un test complexe
d'appréciation de vitesse telle qu'elle S3 produit en réalité dans une
automobile en mouvement. En calculant les corrélations sur un
groupe de 16 sujets des divers tests analytiques avec le test com
plexe, K. conclut à l'importance prédominante du facteur auditif, le
test auditif ayant donné avec le test de l'auto une corrélation p = 0,89
le test de la marche vient ensuite avec une de 0,39. Mais
cette conclusion générale semble un peu péremptoire et du moins-
insuffisamment fondée. D. W. ETALONNAGE ET TECHNIQUE PSYCHOM ETRIQUE 889
1321. — A. NETSCHAJEFF. — Zur Frage der Ermüdungsmes-
sungen (Contribution à la question d la mesure de la fatigue). — ■
A. f. ges. Ps., LXIII, 1-2, 1928, p. 237-248.
Le défaut des tests habituels de fatigue, c'est de nécessiter une
détermination préalable de la capacité du sujet dans des conditions
normales ; le psychologue devrait pouvoir diagnostiquer la fatigue,
comme le médecin diagnostique la maladie sans étudier au préalable
l'état antérieur et normal du malade. La fatigue produit, selon la
conception de N., une rupture d'équilibre entre les fonctions sensor
ielles et motrices du cortex, et c'est cette rupture qu'il importe de
déceler.
Un test de mémoire de nombres doit servir à déterminer les fonc
tions du territoire sensoriel, — mémoire et attention, — et un test
de vitesse d'écriture doit mesurer la capacité motrice. Dans le
de mémoire, une série de 12 nombres de deux chiffres est lue en
raison d'un nombre par 5 secondes et reproduite par le sujet cinq
secondes après la fin de la lecture (temps d'écriture : 1 minute). Le
nombre de nombres correctement reproduits mesure la mémoire, et
le maximum de nombres à la suite dans l'ordre
correct serait un indicateur de l'attention. Le test est appliqué deux
fois, avec deux séries différentes et les moyennes des deux expériences
sont traduites en « degrés de niveau mental » d'après un étalonnage
reproduit plus loin.
Le test d'écriture, intercalé entre les deux tests de mémoire,
consiste à écrire le plus rapidement possible, pendant 30 secondes,
en partant d'un nombre annoncé par l'opérateur (et qui est choisi
parmi les nombres qui se trouvent entre 20 et 30), les nombres sui
vants en série progressive.
N. distingue d'après des recherches exposées dans son livre récent
sur « l'Intelligence et le Travail », 6 degrés de niveau intellectuel :
1. Développement du langage suffisant pour la désignation des objets
usuels et des activités ordinaires. 2. Capacité d'apprentissage él
émentaire. 3. Acquisition de connaissances concrètes coordonnées.
4. Acquisition de connaissances abstraites. 5. Compréhension des
méthodes de la pensée scientifique. 6. Idem dans des formes plus
compliquées.
Voici l'étalonnage des tests :
Degrés 4 5 1 2 3 6
Mémoire 0-1,9 2-3,2 3,3-4,6 4,7-5,1 5,2-5,7 5,8 et au-dessus
0-1,4 1,5-1,7 1,8-2,4 2,5-2,7 2,8-3 3,1 et Attention .....
Vitesse d'écri
27-30 31 et au-dessus 0-9 10-14 15-21 22-26 ture
Les résultats exprimés en degrés de l'échelle, servent à calculer un .
ANALYSES BIBLIOGRAPHIQUES 890
coefficient d'harmonie (moyenne des degrés de mémoire et d'attention
divisés par le degré de vitesse d'écriture et multipliée par 100).
Quelques résultats d'expériences sont fournis sur des groupes d'ins
tituteurs tendant à montrer que les exercices physiques chez ces in
tellectuels ont pour conséquence d'améliorer l'équilibre sensori-mo-
teur en rapprochant les coefficients d'harmonie de 100.
On conçoit difficilement que deux tests aussi brefs, limités et fa
isant appel à des capacités très spécialisées puissent donner des ren
seignements d'une portée aussi générale. Il serait utile de reprendre
les expériences de N. qui semblent avoir, tout de même, à la base,
une idée intéressante. D. W
1322. — V. ERSCHOWITZ. — Zur Frage der Bewahrung von Handg
eschicklichkeitsproben {Sur la question de la validité des épreuves
d'habileté manuelle). — Psychot. Z., III, 1, 1928, p. 23-26.
Prenant parti dans le grand débat sur la valeur des tests moteurs,
E. étudie expérimentalement, sur 39 apprentis, la corrélation entre
le rendement à l'atelier et le résultat de trois tests moteurs : pliage
de fil de fer d'après un modèle ; dissociation des mouvements des
deux mains ; trémomètre de Mcede. Les corrélations sont élevées :
0,84, 0,80 et 0,81 pour les trois tests respectivement.
Sur 17 apprentis ayant subi les à deux reprises encore au cours
de l'apprentissage, on constate une amélioration notable dans le test
de dissociation des deux mains qui se rapproche du travail à l'usine,
alors que la moyenne de tous les tests reste sensiblement constante et
donne une corrélation de p = 0,8 entre le premier et le deuxième
examen ; 0,7 entre le premier et le troisième. D. W.
1323. — F. GIESE. — Schultypus und Leistungsbefund bei Intell
igen zprüfungen {Le type d'école et le rendement dans les tests d'intelli
gence). — Z. für päd..Ps., XXIX, 9, 1928, p. 417-434.
Les tests d'intelligence générale, d'intelligence technique, d'intell
igence commerciale et d'intelligence pratique, dont on trouvera la
description détaillée dans le travail de Lang analysé dans le présent
volume, ont été appliqués depuis 1923 à de nombreux écoliers de
Stuttgart. G. compare les résultats fournis par les écoliers de diffé
rents types d'écoles. Les différences, à âge constant, sont notables ;
à 14 ans la moyenne des élèves de l'école primaire est, dans les tests
«l'intelligence générale, <ie 1 57,5 ; au gymnase elle est de 259 ; d'autres
types d'école occupent une place intermédiaire. Des différences du
même ordre ^se manifestent dans les autres tests d'intelligence.
Des tableaux montrent les différences de développement pour le»
âges ultérieurs, les différences suivant les professions choisies, le*
différences régionales (assez notables).
De tout cela se dégage cette conclusion qu'il est nécessaire d'avoir
des étalonnages précis et séparément pour des groupes très homog
ènes. D.. W.
1824. — J. FRICKX. — Le Test oolleetif D. 1922. — B. Of. Or. Pr.t
VIII, 29, 1928, p. 23-31.
Essai d'étalonnage du Test Decroly de Bon Sens (série d'images à ÉTALONNAGE ET TECHNIQUE PSYCHOlttETRIQUE 891
coupler suivant la relation cause-effet). L'auteur emploie une tech
nique compliquée, et pouvant prêter à bien des erreurs, qui est du
reste celle de l'auteur. Il a expérimenté le test sur un certain nombre
d'enfants, et publie en particulier une norme des résultats de 8 à
13 ans. Mais une norme qui porte sur 28 sujets pour certains âges
«st un peu trop embryonnaire pour mériter la publication. De plus
quand on publie ses résultats sous formes de graphiques uniquement,
faut-il encore que ceux-ci permettent des lectures exactes, et puissent
être examinés sans l'aide d'une loupe de fort grossissement. M. F.
1*25. — G. M. RUCH et J. W. CHARLES. — A Comparison of
Five Types of Objective Tests in Elementary Psychology [Comparai
son de cinq types de tests objectifs de psychologie élémentaire). —
J. of appl. Ps., XII, 4, 1928. p. 398-404.
Les auteurs ont établi un test de connaissances élémentaires en
psychologie de cinq types différents : un de rappel ou de complète
ment, le sujet devant compléter les propositions inachevées ; trois
types où le sujet doit choisir la réponse correcte au milieu des autres
réponses indiquées qui sont au nombre de 5, de 3 ou de 2, suivant
le type du test, et, enfin, le type « exact-kiexact «, le sujet devant
indiquer si les différentes propositions sont exactes ou inexactes.
L'application à près de 700 étudiants qui ont tous subi le test de
rappel d'abord et, le lendemain, divisés en quatre groupes, ont subi
l'un des quatre autres types, a montré : 1° que la cohérence (mesurée
par l'accord entre deux moitiés du test), n'était pas, contrairement
aux résultats antérieurs, plus élevée pour le type de rappel mais
pour le test de 5 réponses » (0,68 pour la moitié du test, soit 0,809 le entier) ; 2° que le type « exact-inexact » demandait en
viron deux fois moins «de temps d'application que le type de rappel,
ce qui permet d'employer des tests plus longs. L'utilisation, au lieu
du nombre de bonnes réponses, d'une correction destinée à éliminer
l'influence possible des réponses données au hasard n'a pas augmenté
la cohérence.
Les corrélations avec les notes des instructeurs variaient de 0,213
à 0,408 pour les divers instructeurs. D. W.
1326. — H. M. ROBERTS et G. M. RUCH. — Minor studies on
objective examination methods [Petite étude sur des méthodes objec
tives d'examen). — J. of Ed. Res., XVIII, 2, 1928, p. 112-116.
Dans le but d'étudier l'effet de suggestion négative des tests mi-
faux mi-vrais (voir Remmers, Ibid., XVII, 1926, p. 52-56), l'auteur
soumet un groupe d'étudiants : 1° à un test de complètement ;
2° à un test mi-faux, mi-vrai, venant immédiatement après le test
de complètement et portant sur le même sujet ; 3° un mois plus tard
au même test de complètement. La différence entre les 2 tests de pouvait être attribuée au test intercalé : à titre de
contrôle on avait en effet fait se succéder 2 tests de complètement,
sans test intercalé. On a constaté qu'une réponse juste sur 20 était
changée et remplacée par une réponse fausse conforme aux sugges
tions du test intercalaire ; une sur 20 était changée