THESE

Publié par

INSTITUT NATIONAL POLYTECHNIQUE DE GRENOBLE

Laboratoire des Images et des Signaux

|_/_/_/_/_/_/_/_/_/_|

THESE

Pour obtenir le grade de

DOCTEUR DE L'INSTITUT NATIONAL POLYTECHNIQUE DE
GRENOBLE

Discipline : Signal, Image, Parole

Présentée et soutenue publiquement


par


Christian CROLL


le 6 mai 1998


Titre:

Synthèse d'un banc de filtres spatialement variants,
inspiré des colonnes d'orientations du système visuel


Directeurs de thèse : Denis Pellerin et Jeanny Hérault

JURY

Madame Annick MONTANVERT : Présidente,
Monsieur Simon THORPE : Rapporteur,
Monsieur Jean-Pierre COQUEREZ : Rapporteur,
Monsieur Denis PELLERIN : Examinateur,
Monsieur Jeanny HERAULT : Examinateur.

REMERCIEMENTS


Je tiens tout d'abord à remercier les membres de mon jury :
- Madame Annick MONTANVERT, du TIMC-INFODIS, professeur à l’université Pierre
Mendès-France, pour m'avoir fait l'honneur de présider mon jury ;

- Monsieur Jean-Pierre COQUEREZ, de l’Equipe Traitement des Images et du Signal,
professeur à l’ENSEA, et Monsieur Simon THORPE, du Centre de Recherche Cerveau et
Cognition, directeur de Recherche CNRS, pour avoir accepté d'être les rapporteurs de cette
thèse ;

-Monsieur Jeanny HERAULT, du LIS, Professeur à l’université Joseph-Fourier et directeur de
cette thèse, qui a su à la fois me guider et me conseiller au cours de ces trois années, tout en
me laissant à chaque fois libre de mes choix ;

- Monsieur Denis ...
Publié le : vendredi 6 mai 2011
Lecture(s) : 141
Nombre de pages : 130
Voir plus Voir moins
INSTITUT NATIONAL POLYTECHNIQUE DE GRENOBLE Laboratoire des Images et des Signaux |_/_/_/_/_/_/_/_/_/_| THESE Pour obtenir le grade de DOCTEUR DE L'INSTITUT NATIONAL POLYTECHNIQUE DE GRENOBLE Discipline : Signal, Image, Parole Présentée et soutenue publiquement par Christian CROLL le 6 mai 1998 Titre: Synthèse d'un banc de filtres spatialement variants, inspiré des colonnes d'orientations du système visuel Directeurs de thèse : Denis Pellerin et Jeanny Hérault JURY Madame Annick MONTANVERT : Présidente, Monsieur Simon THORPE : Rapporteur, Monsieur Jean-Pierre COQUEREZ : Rapporteur, Monsieur Denis PELLERIN : Examinateur, Monsieur Jeanny HERAULT : Examinateur. REMERCIEMENTS Je tiens tout d'abord à remercier les membres de mon jury : - Madame Annick MONTANVERT, du TIMC-INFODIS, professeur à l’université Pierre Mendès-France, pour m'avoir fait l'honneur de présider mon jury ; - Monsieur Jean-Pierre COQUEREZ, de l’Equipe Traitement des Images et du Signal, professeur à l’ENSEA, et Monsieur Simon THORPE, du Centre de Recherche Cerveau et Cognition, directeur de Recherche CNRS, pour avoir accepté d'être les rapporteurs de cette thèse ; -Monsieur Jeanny HERAULT, du LIS, Professeur à l’université Joseph-Fourier et directeur de cette thèse, qui a su à la fois me guider et me conseiller au cours de ces trois années, tout en me laissant à chaque fois libre de mes choix ; - Monsieur Denis PELLERIN, du LIS, Maître de conférence à l’université Joseph-Fourier, et codirecteur de la thèse, pour son encadrement dynamique et chaleureux, pour sa disponibilité et ses avis toujours éclairés ; Cette thèse s'étant déroulée au laboratoire de Traitement d'Images et de Reconnaissance de Formes, devenu maintenant Laboratoire des Images et des Signaux, je tiens à remercier tous ses membres pour la bonne ambiance qui y règne, et tout particulièrement la bande des corbeaux. Je remercie d'autre part, Patricia, Ali, Anne, Carlos, Nabil, Aude, Boubakar, David et bien d'autres, pour les discussions fructueuses que nous avons échangées. Je remercie également Océ Industries et ses employés qui m'ont soutenu lors de la rédaction de ce manuscrit. Enfin, je suis tout particulièrement reconnaissant envers Virginie pour son aide et ses longues relectures qui m'ont permis d'achever ce travail, et envers Louis, Carlos, Frédéric, et Sylvain pour les moments de détentes qu'ils ont sus me faire partager. TABLE DES MATIERES 1 NOTATIONS 5 2PERCEPTION FREQUENTIELLE DU SYSTEME VISUEL 10 2.1Une perception multidimensionnelle10 2.2Le système visuel11 2.2.1Cheminement et élaboration de l’information visuelle11 2.2.2 L’échantillonnage spatialement variable de la rétine14 2.2.3 Organisations géométrique et modulaire de l’aire visuelle primaire16 2.3 Modèles d’analyse fréquentielle19 2.3.1 Modélisation des champs récepteurs de l’aire visuelle primaire V1 20 2.3.2 Effet de la projection rétine-cortex sur le profil d’un champ récepteur22 2.3.3 Vers un modèle des champs récepteurs de V1 en hyper-colonnes26 2.4 Conclusion 28 3FILTRAGE SPATIALEMENT VARIANT PERIODIQUE29 3.1Introduction29 3.2Etat de l'art du filtrage spatialement variant30 3.3Réponse impulsionnelle d’un filtrage spatialement variant 32 3.4 Méthode de filtrage spatialement variant basée sur une projection34 3.4.1 Effet d’un changement d’échelle34 3.4.2 Influence de la projection sur la réponse impulsionnelle35 3.4.3 Exemple 1D 38 3.4.4Bande passante globale39 3.5L’étape de projection périodique41 3.5.1Synthèse d’une fonction de projection non linéaire et périodique41 3.5.2Périodicité de la projection43 3.5.3Taux d’agrandissements45 3.5.4Exemples de projections périodiques 1D46 3.5.5Exemples de projections périodiques 2D : orthogonale et hexagonale 47 3.5.6Analogie entre projection et modulation de fréquence50 3.6étape de filtrage spatialement invariant53 3.7 étape de projection réciproque55 3.8 Modélisation fréquentielle 56 3.8.1 Equations de linéarisations56 3.8.2 Exemple d’un filtre spatialement invariant 1D de Gabor58 3.8.3 Exemple d’un filtrage spatialement variant 2D de Gabor61 3.8.4 Limite de la linéarisation64 3.9 Conclusion67 4 SYNTHESE DU BANC DE FILTRES68 4.1 Représentation temps-fréquence et analyse par ondelettes 68 4.2 Principe d’un banc de filtres spatialement variant71 4.2.1 Couverture d’un secteur fréquentiel par un seul filtrage71 4.2.2 Couverture d’une bande fréquentielle partrois filtrages75 4.2.3 Amélioration de l’échantillonnage spatial77 4.2.4 Représentation spatiale du banc de filtres spatialement variant78 4.3 Les choix d’une implémentation numérique80 4.3.1 Projection d’un signal discret 80 4.3.2 Effet de ré-échantillonnage à pas variable de la projection84 4.3.3 Implémentation du filtrage spatialement invariant88 4.3.4 Choix des paramètres du banc de filtres90 4.3.5 Trois exemples du banc de filtres spatialement variant93 4.4 Qualité du banc de filtres95 4.4.1 Analogie entre le banc de filtres SV et les ondelettes95 4.4.2 Comparaison avec une famille d’ondelettes de Morlet 2D 97 4.5 Conclusion 100 5SEGMENTATION DE TEXTURES102 5.1Introduction102 5.2choix d’attributs discriminants103 5.3Extraction de caractéristiques fréquentielles103 5.3.1Critères d’homogénéité de la texture103 5.3.2Sélection du banc de filtres104 5.3.3Energie moyennée du banc de filtres104 5.4 Algorithme de segmentation par classification 107 5.4.1 Principe de l’algorithme de segmentation107 5.4.2 Etape de composition de la base d’apprentissage107 5.4.3 Etape de partitionnement de la base par quantification vectorielle108 5.4.4 Etape de catégorisation des vecteurs et des positions spatiales110 5.5 Vers un modèle de segmentation112 5.5.1 Les motivations de notre modèle112 5.5.2 Interpolation des vecteurs frontières112 5.5.3 Confiance attribuée à la catégorisation d’un vecteur113 5.5.4 Choix d’un regroupement spatial114 5.5.5 Catégorisation de chaque position spatiale 114 5.6 résultats de segmentations de textures naturelles115 5.6.1 Etude du critère d’homogénéité116 5.6.2 Comparaison de la sensibilité aux orientations120 6 CONCLUSION123 7 BIBLIOGRAPHIE 125 1 NOTATIONS n´ espace de réels de dimension n ( n = 1 ou n = 2 ) n Fsous espace de ´ , espace des fréquences x , y , u , f , a vecteurs de n composantes (notation en gras pour les vecteurs et matrices) i {x } ensemble de N échantillons i i=1..N w , Ppulsation et période n distribution spatiale de signaux, de ´ fi ´ s(x), p(x), q(x), e(x) , P(f ) réponses fréquentielles des signaux S(f ) s(x), p(x) ta transposé de la matrice a Ntaille de l’image source e(x) e PROJECTION : - 1 n n[ ] [ ]M , M opérateur continu et bijectif de projection de fi , et sa réciproque nS T, espace source et espace projeté, sous espace de ´ [ ]Jacobien de la projection M , matrice de (n,n) J M(x) n( )xdistribution spatiale de déformation, de fi ( )N matrice n,m de périodicité, avec m le nombre de vecteurs de périodicité Ppériode de la projection, si les vecteurs de périodicité ont le même module M ( )rvecteur m,1 d’entiers relatifs K , K taux d’agrandissement de surface et linéaires ( )M x M(x) coefficient réel et positif de déformation FILTRAGE SPATIALEMENT INVARIANT (SI) : [ ]Gopérateur de filtrage SI [ ]g(y) , G(f) , G(f) réponse impulsionnelle, fréquentielle, et d’amplitude du filtre SI G [ ]f , , fréquence centrale, orientation et écart-type du filtre SI de Gabor G g g g B(g )bande passante du filtre SI T taille du masque de convolution g q s q q g j ´ ´ F ´ ´ FILTRAGE SPATIALEMENT VARIANT (SV) : H [ ] G [ ] q opérateur de filtrage SV, associé au filtrage SI (absence de en 1D) , , réponse impulsionnelle, fréquentielle, et d’amplitude d’un filtre SV extrait de la h (y) H (f ) H ( )fx x x position spatiale x (Représentation unilatérale ) H (f) = 2 ˛ ( f )TF h (y)[ ]x x f ~ , ~ fréquence centrale, orientation du filtre SV de Gabor, d’enveloppe gaussienne h h orientée selon l’angle b ~ et d’écart-type ~ et ~ h h 1 h 2 ~ B hbande passante d’un seul filtre SV, extrait de la position spatiale x ( )x ~ bande passante globale d’un ensemble de N filtres SV B h( ){ x } i i=1 N EQM(H )erreur Quadratique Moyenne (EQM) d’un filtre SV extrait de la position spatiale x x ( )EQM H erreur maximale de EQM(H ) x ALGORITHME DE SEGMENTATION : V base de vecteurs de caractéristiques { }j Wdictionnaire de prototypes { }k Nnombre de partitions de la base W K V classe affectée au vecteur V ( )j jv K xclasse affectée à la position x ( )j jx C V confiance portée sur la décision d’affecter la classe K V au vecteur V ( ) ( )j j jv v C x ,kconfiance portée sur la décision d’affecter la classe k à la position x ( )x n n C x confiance portée sur la décision d’affecter la classe K x à la position x ( ) ( )j j jx x q q s s q q q q q q INTRODUCTION La vision est le système de perception du monde extérieur le plus complexe et le plus développé chez le vertébré. Entre le moment où un rayon lumineux frappe la rétine au fond de l'oeil et le moment où se forme une "image dans le cerveau", s'écoulent quelques millisecondes pendant lesquelles l'information lumineuse reçue par l'oeil subit des prétraitements successifs. La durée minimale d’exposition d’un objet en vue de sa reconnaissance n’est que de cent millisecondes. Cette image est captée par 130 millions de photorécepteurs, ce qui constitue 70% des récepteurs de notre corps. Le système visuel devance largement les systèmes vidéos qui comptent au mieux 50 fois moins de photorécepteurs. Environ 15% de la surface du cortex cérébral dévolue pour la vision, est mobilisée pour réaliser ce type de performance. Il s’agit du calculateur parallèle en temps réel le plus efficace que l’on connaisse. Le système visuel nous offre une représentation multidimensionnelle de notre environnement, celle-ci étant à la fois spatiale et dynamique. Notre système visuel nous apporte une précieuse invariance vis-à-vis de notre environnement qui est pourtant loin d'être stable (variations d’éclairements, déplacements...). Les performances inégalées de notre système visuel, en ont fait un grand sujet de recherche. Actuellement, le système visuel est l’un des systèmes sensoriels les mieux connus, car depuis les principales études de Hubel et Wiesel [HUBE77], les recherches dans ce domaine sont restées très actives et sont multidisciplinaires. Les données de l’imagerie optique couplées aux enregistrements physiologiques permettent de mieux comprendre les relations anatomiques et fonctionnelles existantes entre les différents modules constitutifs du système visuel. Parallèlement, les recherches psychophysiques et psychologiques effectuées chez l’homme par Julesz [JULE87] et Cavanagh [CAVA88] établissent le lien avec les données recueillies chez l’animal. De plus les cas de neuropsychologie, à travers les déficiences visuelles partielles [ZEKI90, ZEKI92] apportent des éléments d’informations sur les rôles fonctionnels attribués aux différentes aires visuelles chez l’homme. Les modèles mathématiques de la vision apportent également une meilleure compréhension du fonctionnement des différents modules de notre système visuel. Ces modélisations permettent soit de réorienter les neurophysiologistes ou les psychologues dans leurs recherches, soit de déboucher sur des applications industrielles. La souris de Logitec en est exemple, elle est équipée d’une rétine artificielle qui, focalisée sur une boule tachetée, permet de mesurer son propre mouvement. Nous allons retenir une propriété de notre système visuel, en l'occurence l'analyse fréquentielle de notre environnement. Nous étudierons les particularités de cette analyse afin d'une part d’en apporter une meilleure compréhension et d'autre part d'introduire un nouvel outil en traitement de signal exploitable dans le cadre d'application d'analyse d'images. Notre environnement forme un univers très complexe. Notre système visuel nous en apporte une compréhension en extrayant minutieusement, successivement et parallèlement des informations cohérentes entre-elles. Il s'agit par exemple d'informations de fréquences spatiales orientées, de mouvement, de profondeur, de couleur. Nous allons retenir l'une d'elles, à savoir les fréquences spatiales orientées. Celles-ci sont notamment très utiles dans des taches d'analyse de texture. Les textures sont des caractéristiques visuelles prépondérantes dans l’interprétation des scènes de la vie quotidienne. Pouvoir les discriminer, c’est savoir en extraire l’information pertinente. La distribution des niveaux de luminosité des textures présente des propriétés de périodicité locale plus ou moins régulières. Cette régularité est extraite à travers une analyse fréquentielle que notre système visuel effectue. Cette analyse a été mesurée physiologiquement en étudiant les champs récepteurs de l'aire visuelle primaire. Ces champs récepteurs présentent variablement une sensibilité à toutes les orientations et à toutes les bandes de fréquences. Ils ont une organisation spatiale très particulière en hyper- colonne. Plus précisément le système visuel a fait un choix restrictif en décidant de n’extraire qu’une seule information fréquentielle en chaque position spatiale de notre champ visuel [DEVA90] . Le travail de cette thèse a été d'interpréter l’organisation de ces champs récepteurs et d'en proposer un modèle fréquentiel. Ce modèle nous amènera à définir le rôle des projections rétine-cortex sur le profil des champs récepteurs, puis à synthétiser un banc de filtres Spatialement Variant (SV), reposant sur le principe d'unicité des champs récepteurs en chaque position. Nous justifierions le choix restrictif effectué par notre système visuel, en montrant que notre banc de filtres SV est tout à fait efficace pour une tache d'analyse de textures. La thèse est composée de quatre chapitres. Le premier chapitre présentera succinctement le cheminement de l’information visuelle, et montrera comment l’information visuelle est élaborée afin de préparer une reconnaissance ultérieure. Nous décrirons l'analyse fréquentielle de notre système visuel à travers le profil des champs récepteurs de l'aire visuelle primaire. Nous introduirons la notion de champs récepteur projeté dans le cortex, ces champs récepteurs projetés ne sont qu'une lecture différente dans un autre espace du champ récepteur classique. En nous appuyant sur ce concept, nous proposerons enfin un modèle d’organisation en hyper-colonne de ces champs récepteurs à l’aide d’une projection périodique. Au chapitre suivant nous fournissons une description détaillée de ce genre de projection périodique et modélisons, à l'aide d'une approximation, la réponse fréquentielle de ces champs récepteur dans un cadre de filtrage Spatialement Variant (SV). Ce filtrage SV repose sur la succession de projections et de filtrage spatialement invariant que nous expliciterons. Dans le cadre du troisième chapitre, nous exploitons les propriétés du filtrage SV afin de générer un ensemble de filtres SV qui forme un banc de filtres SV que nous décrirons. Au cours de ce chapitre, nous présenterons un état de l’art des bancs de filtres en accentuant notre présentation sur l’analyse par ondelettes, du fait de son analogie avec notre banc de filtres SV. Nous établirons les choix d’implémentation numérique de chacune des étapes du banc de filtres SV. Enfin, nous établirons une comparaison de notre banc de filtres SV avec une implémentation classique des ondelettes de Morlet 2D. Au quatrième chapitre, nous justifierons le choix d’un banc de filtres SV comme paramètre discriminant en analyse de textures. Nous spécifierons le domaine de textures auquel nous nous intéressons. L’étape de filtrage sera suivie d’un calcul d’énergie et de moyennage dont nous définirons les paramètres. Ensuite, nous présenterons l’étape de segmentation comme un problème de classification et proposerons un algorithme de segmentation adapté à la restriction d'un seul filtre en chaque position. Enfin, nous donnerons des résultats de segmentation sur deux ensembles de textures naturelles. CHAPITRE 2 PERCEPTION FREQUENTIELLE DU SYSTEME VISUEL 2.1 UNE PERCEPTION MULTIDIMENSIONNELLE Des études ont montré que les traitements de hauts niveaux réalisés par notre système visuel ne sont possibles qu’à travers un grand nombre de prétraitements permettants d’extraire les paramètres multidimensionnels de notre environnement. Ces paramètres sont par exemple, des informations de représentation spatiale de notre champ visuel, de profondeur, de luminosité, de fréquences spatiales et temporelles ou encore de couleur. Les études neurophysiologiques ont montré que dès l’aire visuelle primaire (V1), l’image faisait justement l’objet d’analyses multiples, de manière rétinotopique et en fonction des diverses caractéristiques précitées. On peut donc considérer l’image visuelle comme un assemblage d’un certain nombre d’attributs sur une même surface. Ces attributs sont exploités dans d’autres modules corticaux, à travers les autres aires visuelles. La façon dont ces différents modules interagissent entre eux pour construire une représentation des objets, n’est pas encore clairement établie et constitue l’une des grandes questions du futur. Dans le cadre de notre recherche, nous nous sommes intéressés à deux types d’informations particulières de V1, l’information de la représentation spatiale 2D de notre combinée avec l’information de . Des champ visuel fréquences spatiales et d’orientations auteurs ont mis en évidence que l’extraction de ces informations fréquentielles constitue un prétraitement très utile dans des tâches d’analyse de textures [PORA88, PORA89]. Beck [BECK66] a montré par exemple que la reconnaissance de textures se fait plus rapidement quand ces textures présentent des caractéristiques d’orientations différentes. Les travaux de Julesz [JULE71] indiquent que les propriétés de luminosité, de répétition de primitives élémentaires (textons), de granulosité et d’orientation, constituent des conditions de séparabilité. Cette analyse fréquentielle est caractérisée physiologiquement par le profil d’un champ récepteur ou encore en traitement de signal par la réponse impulsionnelle d’un filtre. Il a été montré que ces champs récepteurs possèdent des propriétés de sélectivité aux fréquences spatiales et aux orientations [DEVA90]. Ces champs récepteurs présentent une organisation spatiale très particulière. Cette organisation est cyclique et décrite sous le nom d’hyper- colonnes. Elle est basée sur deux règles, une règle d’homogénéité, et une règle de diversité, dont nous nous attacherons à montrer les avantages. Nous montrerons comment cette organisation spatiale des champs récepteurs peut être modélisée par une opération de projection, elle-même cyclique.
Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.