Etalonnage et Critique des Tests. Technique Pysghométrique - compte-rendu ; n°1 ; vol.31, pg 1055-1065

De
Publié par

L'année psychologique - Année 1930 - Volume 31 - Numéro 1 - Pages 1055-1065
11 pages
Source : Persée ; Ministère de la jeunesse, de l’éducation nationale et de la recherche, Direction de l’enseignement supérieur, Sous-direction des bibliothèques et de la documentation.
Publié le : mercredi 1 janvier 1930
Lecture(s) : 13
Nombre de pages : 12
Voir plus Voir moins

3° Etalonnage et Critique des Tests. Technique
Pysghométrique
In: L'année psychologique. 1930 vol. 31. pp. 1055-1065.
Citer ce document / Cite this document :
3° Etalonnage et Critique des Tests. Technique Pysghométrique. In: L'année psychologique. 1930 vol. 31. pp. 1055-1065.
http://www.persee.fr/web/revues/home/prescript/article/psy_0003-5033_1930_num_31_1_30105ÉTALONNAGE ET TECHNIQUE PSYCHOMÉTRIQUE 1055
3° Etalonnage et Critique des Tests. Technique
PSYCHOMÉTRIQUE x
1627. - HENRY F. ADAMS. - An Objectivity-Subjectivity ratio
for scales of measurement [Comparaison des échelles objectives et
subjectives de mesure). — J. of Soc. Psych., 1, 1930, p. 122-135.
A. essaie de déterminer les caractères d'objectivité ou de subject
ivité d'une échelle de mesures. Il expose les théories de divers au
teurs et ses propres expériences : 1° application de tests sensoriels,
appréciation de poids, longueurs, etc.. ; 2° épreuves où le sujet doit
évaluer une série d'œuvres artistiques, de personnes connues, r
épondre à des annonces... Dans chaque groupe, les tests sont répétés
à des intervalles variables ; la stabilité individuelle est exprimée par p,
la stabilité du groupe par la moyenne des p. A. établit ensuite le
rapport entre pe collectif et pi individuel.
Pour les tests de la première catégorie, il trouve le quotient —
égal ou très voisin de l'unité, pour les autres, ce rapport est inférieur
à un, les sujets se montrant alors plus semblables à eux-mêmes qu'à
l'ensemble du groupe. S'appuyant sur des exemples de distribution
de cartes, il démontre que dans le premier cas : échelle de mesures
objectives, les erreurs dues au hasard interviennent seules, tandis
que dans le deuxième, mesures subjectives, apparaissent en outre
les facteurs de variations individuelles. L'établissement du rapport
— permettrait de déterminer l'objectivité ou la subjectivité d'une
échelle, suivant qu'il serait égal ou inférieur à l'unité. J. M.
1628. — FURFEY. — A scale for measuring developmental age
(Une échelle pour déterminer l'âge de développement). — Ment. Hyg.,
XIV, 1930, p. 129-136.
L'auteur a fait par deux observateurs l'âge de déve
loppement de 75 enfants, dont l'âge chronologique était de 169,
5 mois en moyenne. Les déterminations faites d'après une échelle
décrite par l'auteur dans un travail antérieur, ont donné une corré
lation de 0,94 (formule de Spearman-Brown) entre les deux obser
vateurs.
Il a proposé en outre un test pour l'évaluation de l'âge de dévelop
pement, consistant en 4 questions sur les lectures et les activités
préférées des enfants. Appliqué à 450 enfants, ce test a montré une
cohérence de 0,76 et une corrélation de 0,70 avec l'évaluation d^ l'âge
de développement de l'enfant, d'après le premier procédé.
Pour déterminer le facteur important de l'âge de développement,
l'auteur a étudié la corrélation entre cet âge (déterminé d'après les
deux procédés décrits), l'âge mental et le poids et la taille chez
67 garçons. La corrélation avec l'âge mental a été négative ; par
contre elle était égale à 0,23 la taille et le poids.
'
1. Voir aussi les n°» 542 à 545, 1363, 1609,i 1056 ANALYSES BIBLIOGRAPHIQUES
r L'importance du facteur physiologique a été confirmée par l'étude
de l'os ification des os du poignet (au moyen des rayons X) faits sur
9 paires de garçons du même âge chronologique. L'ossification a été
plus avancée chez les garçons présentant une maturité plus grande.
L'auteur propose de déterminer le quotient de développement en
divisant l'âge chronologique par l'âge de développement, ce quotient
permettrait une évaluation quantitative de la maturité de l'enfant.
B. N.
1629. — J. 1ZARD. — La détermination du développement intellec
tuel, chez les enîants. Son importance clinique. — Thèse de Mé
decine, Paris, 1930, in-8 de 120 pages.
Dans la première partie, l'auteur traite de l'importance clinique
de la mesure du développement intellectuel chez les enfants ; dans
la deuxième partie, il compare les résultats obtenus avec les tests
Binet-Simon et ceux de Terman et de Kuhlmann.
L'auteur essaye d'établir une série de tests applicables aux enfants
du premier âge. De la comparaison faite sur 200 enfants, il ressort
que les chiffres fournis par la méthode de Terman donnent des ré
sultats en moyenne inférieurs de 3 mois à ceux de l'échelle Binet-
Simon, et qu'avec l'échelle de Kuhlmann, l'écart est de 4 mois.
M. H. P.
1630. - F. F. BRADSHAW. — The American Council on Educat
ion Rating Scale : its reliability, validity, and use {Verheile
d'évaluation du Conseil Américain de V Education : Sa cohérence,
sa validité, son emploi). — Ar. of Ps., XVIII, N° 119, 1930, 80 pages,
L'auteur pense que depuis Galton (1869) jusqu'en 1916, les échelles
d'évaluation des caractéristiques individuelles n'ont pas progressé.
Il en fait un historique (15 page ) suivi d'un résumé des principes
énoncés par les auteurs, concernant les traits de caractère, le> juges,
l'évaluation, la construction des échelles, eu égard à la cohérence, à
la validité et aux applications.
Un des comités créés en 1927 par le Conseil américain de l'Educat
ion, eut pour tâche la standardisation des traits de personnalité
non révélés spécialement par les tests. Ayant formulé 5 principes,
étudié les évaluations reçues de 38 collèges et concernant plus de
100 traits, il construisit une première échelle, de 7 traits. L'auteur
décrit les expériences d'application, la recherche, à partir des inter
corrélations, de traits indépendants et significatifs, et l'élimination
des traits les plus difficiles à évaluer. Six formes furent successiv
ement construites, les dernières limitées à 5 traits, avec sollicitation
de « behaviorgrams », rapports détaillés, relatant des faits précis
pour chaque trait du sujet — excellent moyen de développer le point
de vue « personnel » chez les éducateurs.
Les cohérences obtenues sont aussi élevées que dans les travaux
antérieurs les plus poussés ; il semble qu'elles seraient au moins aussi
bonnes pour des évaluations d'après les « behaviorgrams » seuls. La
validité (déjà indiquée par la cohérence entre les juges) fut plus diffi
cile à préciser, mais se montre encourageante, à condition qu'on
i ETALONNAGE ET TECHNIQUE PSYCHOMETRIQUE 1057
emploie des juges entraînés, dont on ait étudié la variabilité, et qu'on
contrôle la validité à chaque occasion.
L'auteur montre que les échelles établies par l'Am. C. on Ed.
réunissent les meilleures caractéristiques des essais antérieurs depuis
Galton. Il voit une condition de progrès dans la substitution, au juge
ment des facultés ou traits statiques, d'une évaluation des habitudes
et des actes de l'individu, avec nombreux « behaviorgrams ». Il espère
que les travaux statistiques sur ces évaluations aboutiront au trait
ement reconnu nécessaire pour les tests. G. D.
1631. - H. A. GAROLL et L. S. HOLLINGWORTH. - The
•systematic error of Herring-Binet in rating gifted children (L'erreur
systématique d'appréciation des enfants bien doués par l'échelle de
H. B.). - J. of ed. Ps., XXI, 1, 1930, p. 1-11.
L'application sur 80 enfants bien doués (IQ moyen = 150,4 ;
âge : 7 à 12 ans) des tests de Binet-Stanford et de Binet-Herring a
révélé entre les résultats des deux méthodes une différence cons
tante, pour le groupe, de 17,2 points. L'échelle de B.-H. donne des
notes constamment inférieures à celles de B.-S. ; pour 2 applications
successives des 2 échelles, les résultats moyens de chaque sujet n'ont,
pour aucun enfant, dépassé avec les tests B.-H. ceux des tests B.-S.
Une divergence du même ordre ayant été constatée entre les ré
sultats de B.-H. et les données d'un test de rendement (Stanford
achievement test, forme B) qui, par ailleurs, concordaient avec celles
de l'échelle B.-S., il y a tout lieu de penser que c'est l'échelle B.-H.
qui est en défaut.
Pour les 2 échelles, la cohérence a été trouvée également satisfai
sante, l'erreur moyenne étant cependant beaucoup plus élevée pour
l'échelle B.-H. A. B.-F.
1632. — J. WOJCIECHOWSKI. - Metody oceny wynikow testow
wobee dazen do ujednostajnienia [Les méthodes d'évaluation de
résultats de tests et les tentatives pour les rendre uniformes) . — B.BIE-
GELEISEN. — Jeszcze o ocenie wynikow testow (Encore à propos
de l'évaluation de résultats de tests). — J. WOJCIECHOWSKI. —
Odpowiedz p. Drowi B (Réponse à M. B.). — Psychotechnika, IV, 4,
1930, p. 166-181.
Polémique à propos de différentes méthodes employées par les
Instituts Psychotechniques en Pologne. W., partisan d'une méthode
unique, propose celle de Galton ou de Claparède, alors que B., pour
qui d'ailleurs l'uniformité de méthode ne semble pas tout à fait dési
rable, préconise l'emploi de la courbe d'Otis, qui n'est, d'après lui,
que la courbe même de Galton transposée sur des coordonnées diffé
rentes.
A la prochaine conférence psychotechnique polonaise de se pro
noncer, dit W., sur l'acceptation et le choix d'une méthode unique.
A. R.
1633. - A. J. BROWN. - An Inquiry into the Standardization of
the Kohs' Block-Design Test (Une recherche sur V étalonnage du
l'année psychologique, xxxi. 67 1058 ANALVSES ßlBHOGKAPHIQÜES
test des cubes colorés de Kohs). — J. of appl. Ps., XIV, 2, 1930,
p. 178-181.
En examinant une cinquantaine environ de sujets par âge, filles
et garçons mélangés, B. obtient les moyennes suivantes : 9 ans,
19 ± 18 ; 10 ans : 24 ±: 15 ■■; 11 ans : 34 ± 16, et il reproche au test
des cubes colorés de Kohs, de ne pas différencier assez nettement les
enfants d'âges successifs, en raison du chevauchement des réparti
tions pour les âges successifs. D. W.
1-634. - P. J. RÜLON et AïtDEN. - A Scoring Technique For
Tests Having Multiple Item Weightings {Technique de dépouillement
des tests ayant des points d'appréciations multiples). — Pers. J.,
IX, 1930, p. 235-241.
Cette méthode proposée pour le dépouillement des réponses du
test des intérêts professionnels de Strong, consiste dans remploi de
fiches spéciales pour chaque réponse de l'individu, au lieu d'une
fiche pour toutes les réponses du sujet, et dans une addition automat
ique des résultats par des machines à calculer de Hollerith.
Elle donne une économie du temps de 80 % pour le dépouillement
de ce test, en comparaison avec la méthode ordinairement em
ployée. ' B. N.
ll835. - CARLE G. BRIGHAM. — Intëlligèiice -teats Of immig&iht
Éfcôùpi '{-Lès tests d'iritéHigéhàè chez les groupes d'im'rhigrés) . — Ps.
Rev., XXXVII, 1930, p. 158-165.
Les nombreuses recherchés effectuées, ces temps dterhiérs, avec la
méthode dés tests sur l'intelligence dés immigrés au& Etats-Unis,
auxquelles il convient d'ajouter les analyses faites par divers auteurs
des tests Alpha de l'Armée, ont permis de constater que les notes
assignées pour diverses épreuves sont loin de représenter quelque
chose d'unitaire. Si l'on tient compte^ en outre, de ce fait, que l'armée
américaine de 1917 ne constituait point un groupe ethniquement
homogène on est amené à reconnaître qu'il n'eût pas fallu additionner
les notes des 8 tests de 1' « army-alpha » pour obtenir une note globale
et que, de toute façon, on n'aurait pas dû considérer les notes globales
analogues comme représentatives des degrés analogues dans l'exé
cution des tests. B. souligne, d'autre part, que Kelley a mis en lumière
l'indépendance de ce qu'il appelle intelligence verbale, intelligence
quantitative et intelligence spatiale. Or, ce résultat devra modifier
les procédés courants des tests dans lesquels le matériel verbal et
mathématique est combiné sans discernement. On sera également
obligé de tenir un compte rigoureux de la langue dans laquelle
donnent leurs réponses les individus appartenant à des groupes eth
niques différents, d'autant plus que les effets du bilinguisme ne sont
pas encore suffisamment élucidés. Bref, les tests actuellement en usage
ne se prêtent guère à une étude comparative des groupes nationaux '
et sociaux. P. K.
1636. — N. D. HIRSCH. — An experimental study upon three hun
dred school children over a six-year period {Elude expérimentale de et technique psychométrique 1059 étalonnage
six années, sur 300 écoliers.) — Genet. Ps. Mon., VII, 6, 1930,
p. 487-549.
Le principal but de cette étude, poursuivie pendant six années
consécutives, a été de tester la constance du quotient d'intelligence
chez les mêmes individus au cours de leur développement. 300 en
fants, appartenant à des milieux divers, ont été examinés à 6 reprises
et à une année d'intervalle, au moyen de test mentaux collectifs
(Otis primary mental test : 7, 8, 9 ans : Otis advanced test : 10,11,
12 ans). Les résultats des 'tests ont présenté d\in<e année à Vautra une
grande cohérence ; autrement dit, le QI d'un enfant déterawné à
un âge donné permettrait de prévoir assez exactement ce que ce
même sujet donnerait les années suivantes. Les variations entre les
moyennes de 2 années consécutives ont été de 5,26 'points, soit l-17e
seulement de la dispersion du groupe pour une seule année. Pour 5 %
des sujets, les fluctuations d'une année à l'autre on't été égales ;ou su
périeures à 10 points. La corrélation moyenne entre les six Q'I a été
de 4- 0,86. On a trouvé de plus que le'QI se trouvait lié positive
ment avec la stabilité émotionnelle mesurée par le test de Wood-
worth-Mathews (0,25 garçons ; 0,14 'filles) ; avec la situation rpécu-
niaire (0,49) et négativement avec le nombre d'enfants tians la fa
mille. A. B.--F.
1637. - S. G. GARRISON. - fcéteats on Adults at an Interval of
ten Years {Tests refaits stir des adultes après un intei-vtille de dO an
nées). — S. and S., 6 sept. '1930, p. 326-32«.
En 1916, une première expérience avait été faite sur un total de
241 adultes de 17 à 56 ans.
En 1926, l'auteur a eu l'idée de refaire l'expérience avec le mêmes
tests (Yerkes-Bridrges-Hardwick, Point Scale), sur 300 personnes
parmi lesquelles il a pu faire entrer 32 hommes (sur 72) et 41 femmes
(sur 169) ayant participé à la première expérience.
La comparaison des résultats obtenus lui a permis l'élaboration
de 4 tableaux statistiques d'où il ressort :
1° Que, dans l'ensemble, l'expérience a donné les mêmes moyennes,
pour les âges correspondants, en 1916 et en 1926.
2° Que parmi les personnes qui ont servi aux deux expériences,
celles qui avaient moins de 30 ans ont donné de meilleurs résultats
après 10 ans, tandis que celles qui avaient plus de 30 ans ont mani
festement baissé, et presque dans les mêmes proportions, perdant à
peu près ce que les autres gagnaient. L. B.
1638. - CH. DIETZ. - Etude d'un test de coup d'œil : le tes^
d'appréciation des longueurs. — R. Se. Tr., II, 3-4, 19B0, p. 427-
■443.
Nous avons; précédemment analysé la première partie de ce travail
consciencieux et précis (Cf. An. Ps., XXX, N° 1377). L'auteur ayant
Constaté que les sujets avaient tendance à conserver et à reproduire
indéfiniment l'erreur commise dans le premier essai, s'est efforcé
cette fois de déterminer si on pouvait remédier à cet inconvénient en
employant des appareils de couleurs au lieu de la règle ordinaire qu'il
avait employée dans ses premiers essais. Il a ainsi utilisé des règles 1060 ANALVSES BIBLIOGKAPHIQUES
grise, bleue, jaune, verte et rouge. Il a pu ainsi obtenir une cohérence
du test qui est égale à 0,89, pour la cohérence générale et 0,90
pour certaines parties, donc une valeur très satisfaisante. La cons
tance et la validité du test doivent être étudiées ultérieurement avec
cette patience qui caractérise les recherches de D. et en font des
modèles d'essais de critique psychotechnique. M. F.
1639. — MARCEL FRANÇOIS. — Quelques remarques sur le test
de barrage. - B. I. N. O. P., II, 9 et 10, 1930, p. 221-226 et 249-
255.
On préfère le test de barrage de signes a celui de barrage de lettres
pour éviter que les sujets habitués à la lecture ne soient avantagés
par rapport aux autres. Est-on certain que les sujets soient tous
égaux devant les signes à barrer, autrement dit que ces signes pré
sentent tous la même difficulté pour un sujet déterminé ? C'est la
question qu'étudie l'auteur en dépouillant un certain nombre de
tests exécutés par des enfants. Il montre ainsi que les différents
signes ont des valeurs différentes pour les sujets. Si on note dans un
test où le sujet doit barrer deux signes comment les omissions et
erreurs se répartissent entre les deux signes, on voit que si un cer
tain nombre de sujets commettent autant d'omissions pour un signe
que pour l'autre, il en est beaucoup d'autres qui n'omettent prat
iquement que l'un des signes. Le signe qui paraît ainsi le plus difficile
n'est pas le même pour tous les sujets. Il y a là selon l'A. une source
d'erreurs d'appréciation possible dans la comparaison des sujets
entre eux. M. F.
1640. — W. S. LARSON. — Measurement of musical talent for the
prediction of success in instrumental music {Mesure du music
al pour la prédiction du succès en musique instrumental'). — Ps.
Mon., XL, 1 (181), 1930. Univ. of Iowa Studies in Ps., XIII,
p. 33-73.
Le travail a consisté à appliquer les tests étalonnés de Seashore
chez des étudiants se spécialisant en musique instrumentale, un
groupe de débutants, et trois groupes de niveau croissant.
Il n'a pas été fait de calculs de corrélation, mais les distributions
des valeurs obtenues ont été comparées entre elles et avec les normes,
pour l'ensemble et pour chaque test.
Ce mode de présentation ne permet guère une condensation r
ésumée. Les données générales montrent que chez les débutants, il n'y
a aucune supériorité par rapport à un groupe indifférencié, comme si
le choix des apprentis musiciens s'était fait puremeRt au hasard.
La supériorité progressive des deux derniers groupes paraît à l'auteur
dépendre de la sélection qui se produit et entraîne l'élimination des
inaptes, en sorte que, dans leur ensemble, les tests fourniraient bien
une prédiction du succès définitif (la méthode, qui s'adresse à des
individus différents, ne permettant pas de faire la part respective de
l'aptitude et de l'entraînement éducatif, question que l'auteur dit
avoir étudiée d'autre part).
Les valeurs des quantités, très élevées par rapport aux normes de ETALONNAGE ET TECHNIQUE PSYCHOMETRIQUE 1061
Seashore, trouvées dans le groupe le plus avancé, sont les suivantes
pour les 6 épreuves qui seraient toutes significatives :
1™ quartile 3e quartile Médian
87,0 Hauteur 62,4 94,2
62,8 83,3 93,2 Intensité. ... ;
42,8 69,5 92,4 Durée
49,6 77,5 92,0 Consonance
62,0 Mémoire tonale 86,6 92,6
62,8 81,2 92,8 Rythme
L'auteur pense que la prédiction du talent musical pourra désor
mais se faire en envisageant la différenciation suivant les spécialisa
tions musicales. H. P.
1641. — J. T. NIELSEM. — A Study in the Seashore motor-rythm
test (Elude sur le test de rythme moteur de S.). ~ Ps. Mon., XL, 1
(181), 1930. Univ. of Iowa Studies in Ps., XIII, p. 74-84.
L'auteur a utilisé le chronographe phonographique de Seashore :
Le sujet entend un rythme de frappes au phonographe, transmis, à
un récepteur téléphonique, et il doit arriver à frapper sur une clef de
Morse en suivant les rythmes entendus de manière à faire synchron
iser sa frappe avec celle qu'il entend.
Les recherches ont été faites sur 20 étudiants pris au hasard et
20 élèves d'une école de musique, avec 6 épreuves quotidiennes pen
dant 10 jours consécutifs.
Le progrès par répétition a varié de 0,7 à 22,4 % suivant les sujets
(7,8 % en moyenne), la capacité de progrès se montrant indépendante
de l'aptitude à la rythmisation.
Les élèves de l'école de musique marquent une supériorité nette de
cette aptitude. H. P.
1442. - MILTON B. JENSEN-. — An Evaluation of three Methods
of Presenting true-false Examinations : Visual, Oral and Visual-
Oral [Une Evaluation de trois méthodes de présentation : visuelle,
orale, et visuelle-orale des examens par vrai ou faux). — S. and S.,
15nov. 1930, p. 675-677.
L'A. a expérimenté les trois méthodes de présentation : visuelle,
orale, ei visuelle-orale, sur un total de 225 étudiants pris dans
une classe de psychologie et deux classes d'anglais.
D'après les résultats statistiques, dans l'ensemble, du point de vue
de la confiance à accorder à chacune d'elles, la méthode orale (coeffi
cient : 79) l'emporte légèrement sur la méthode visuelle (77) et celle-ci
sur la méthode visuelle-orale (74).
85 % des étudiants préfèrent la visuelle aux deux autres et seul
ement 30 % préfèrent l'orale à la visuelle-orale. Aucun ne préfère
l'orale à la visuelle. Les différentes moyennes des 3 catégories de
tests sont : 25,7 pour \n v. o., 25,1 pour la v. ot 24,4 pour l'o. ANALYSES BIBLIOGRAPHIQUES 1062
D'autres investigations restent à faire dans cette voie pour la solu
tion de problèmes» divers touchant aux différences individuelles.
Jusque-là, la méthode orale peut être considérée comme aussi efficace
que la visuelle, et bien plus désirable, à cause de l'économie de temps
et d'argent qu'elle permet. L. B.
1§43. — J. ALPHONSE et P. BOVET. - L'échelle canadienne de
composition française. — Ar. de Ps., XXII, 87, 1930, p. 298-305.
Coirïparaison entre une échelle de notation ordinaire consistant
en l'appréciation subjective par les correcteurs d'une composition
française, la notation allant de 0 à 6 (avec demi-points), et l'échelle
canadienne consistant à comparer chaque composition à des « types »
de l'échelle, ceux-ci étant au nombre de 17. Quatre juges se sont
servis des deux échelles pour noter 32 compositions, utilisant l'échelle
canadienne pour la première fois. La corrélation est de 0,83 entre les
moyennes des quatre juges, pour les deux classements. Mais la varia
bilité s'est montrée sensiblement moins forte avec l'échelle cana
dienne, ce qui permet aux A. de conclure qu'elle pourrait rendre de
réels services d'autant que les correcteurs, l'employant cependant
pour la première fois l'ont trouvée très facile à appliquer. M. F.
1644. — G. IGHHEISER. — Ueber die Veränderung der Leistungs
bereitschaft durch das Bewusstsein, einen Zuschauer zu haben [Sur
la modification de la disposition au travail quand on se sait observé).
— Psychot. Z., V, 2, 1930, p. 52-53.
Dans les examens psychotechniques la présence de l'expérimenta
teur qui observe le sujet influe d'une façon différente sur les diffé
rents sujets : les uns sont stimulés, les autres inhibés. I. a voulu véri
fier la fréquence de ces deux types par voie expérimentale : il a fait
effectuer la même épreuve (cube de Blumenfeld) deux fois de suite,
la 2e épreuve étant faite tantôt en l'absence de l'opérateur, tantôt en
sa présence. Dans le premier cas, sur 200 sujets, 37 ont allongé leur
temps de travail, dans le 2e cas sur 200 54 l'ont allongé, ce
qui semblerait indiquer que les cas d'inhibition sont un peu plus
fréquents. D. W.
1645. - M. J. PAPURT. - A study of the Woodworth Psycho-
neurotic inventory with suggestion revision [Etude du questionnaire
de Woodworth avec suggestion de revision). — J. of Abn. Ps., XXV,
3, 1930, p. 334-352.
Le questionnaire de Woodworth fut appliqué dans un asile à
50 femmes et 50 hommes. L'étude des réponses a permis de déceler
5 vices : terminologie trop complexe ; trop de questions et de ques
tions « à côté » ; forme adaptée seulement aux hommes ; questions
faisant double emploi. L'auteur a procédé à une revision du ques
tionnaire, 75 questions seulement sont demeurées. Puis il a procédé
à une standardisation du test. Suit une bibliographie de la question.
M. L.
1646. — L. JAXA-BYKOWSKI — Kilka uwag o odpowiedziach
blednych przy badaniach pédologie znych [Quelques remarques sur Étalonnage ft technique psyciiométriqub 1063
les réponses fausses dans les recherches pédplogiques). — K\y. Ps.
II, 1,930, p. 49-57.
Il y a dans l'appréciation des résultats, et surtout des résultats
négatifs, des tests d'intelligence, un certain schématisme qui donne
lieu à des diagnostics et à des pronostics sommaires ou erronés.
C'est contre ce schématisme que l'auteur met en garde l'expériment
ateur. Il y a parmi les réponses fausses un grand nombre dont les
erreurs ne sont dues qu'à des causes accidentelles, provenant dç trois
sources qui sont : 1° l'aptitude de l'enfant (distraction momentanée.,
fatigue, indisposition, mauvaise volonté, méfiance, apathie, etc.) ;
2° la personnalité de l'expérimentateur (attitude mal appropriée,
quelque infirmité) ; 3° la façon même de rédiger ou de poser les quest
ions. Cette troisième source d'erreurs est de toute première import
ance. Les tests ne sont pas toujours adaptés au milieu social et
ethnique de l'enfant, ne tiennent pas suffisamment compte des réalités
de la vie (les tests de syllogismes). A ce troisième point se rattachent
les réponses qui ne sont fausses qu'en apparence. Il faut donc complét
er l'emploi des clés schématiques, de correction souvent trop formal
istes, fausses.' par une analyse approfondie des réponses taxées comme
D'une façon générale, les résultats des tests collectifs ne
sauront être utilisés pour le diagnostic que s'ils sont appuyés des exa
mens individuels, tenant compte de toutes les facultés de l'enfant.
A. R.
1847 — A. WOLLSTEIN. — Methoden der Grutachte.ngewinnung
aus den Ergebnissen psychologischer Eignungsuntersuchungen
(Les méthodes à employer pour formuler un avis à la suite d'un exa
men psychologique d'aptitudes). — Psychot. Z., V., 5, 1930, p. 109-
115.
W. met en garde contre l'utilisation trop mécanique des résultats des
tests et montre, à l'aide de deux descriptions de « cas » l'importance
qu'il y a à observer le sujet et à interpréter les résultats obtenus à la
lumière d'autres renseignements, de manière à dégager un conseil
utile d'orîentation professionnelle. D. W.
1648. - TH. VALENTINER. - AusserinteHektuelle Einflüsse bçi
der Intelligenzprüfung (Influences autres qu'influences intellec
tuelles dans l'examen de V intelligence) . — Ind. Psychot., VII, 7,
1930, p. 198-208;.
Pour serrer de plus près la question des influences d'ordre affectif
qui. interviennent dans le résultat des tests d'intelligence, V. s'est
attaché à comparer tes résultats des. aux appréciations de.s
maîtres. Sur un groupe de 132 écoHers qui ont subi un. test d'intell
igence du type des tests américains, V. a trouvé que, pour un tiers
environ, le test et les appréciations des maîtres ont donné le mêrne
résultat ; un autre tiers a fourni des désaccords ne dépassant pas un
demi-degré, sur une échelle de quatre degrés ; enfin, chez le dernier
tiers, les désaccords allaient jusqu'à atteindre un ou deux degrés,
c'est-à-dire jusqu'à 50 % de l'échelle.
Parmi les facteurs les plus fréquents qui inhibent le rendement dans
les tasts, V. note les défaillances de l'attention, le manque d'injtérêt

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.