Partition des centres mobiles pour données qualitatives
Maurice Roux
Faculté des Sciences et Techniques (Case 462) Université Paul Cézanne (Marseille 3) Avenue Normandie-Niemen 13397 Marseille Cedex 20, France
RÉSUMÉ. On présente un nouvel algorithme de partitionnement autour de centres mobiles (k-means) pour des données qualitatives, basé sur la métrique du Khi-carré. Cet algorithme est comparé à trois autres techniques similaires de partitionnement autour de centres mobiles en utilisant des jeux de données réelles et simulées. Les résultats sont évalués par le critère de l’inertie interclasse. MOTS-CLÉS : agrégations autour de centres mobiles, métrique du Khi-carré, inertie interclasse, partitions.
1 Introduction Un certain nombre de méthodes de classification ont été proposées pour traiter les données qualitatives [GOV 84, KAU 90, HUA 98]. Mais très peu ont utilisé la métrique du Khi-carré pourtant couramment utilisée avec succès, avec l’Analyse factorielle des Correspondances (AFC, [BEN 73]), bien adaptée à ce type de données. Reprenant une idée esquissée par Ralambondrainy [RAL 95] l’algorithme que nous exposons ici, applique le mécanisme usuel de réallocation-recentrage de la méthode des k-moyennes [FOR 65, MAC 67], sur les « profils » des objets, lesquels sont munis de poids, comme en AFC. Dans le paragraphe suivant on présente quelques algorithmes usuels pour traiter des variables qualitatives. Puis on décrit les ...