//img.uscri.be/pth/6334719be442211f8a9cba2175a8e4cea29b2341
La lecture en ligne est gratuite
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
Télécharger Lire

These

33 pages
Table des matiŁres1 Introduction 32 CaractØristiques visuelles 52.1 Quelques critŁres d’Øvaluation de caractØristiques visuelles . . . . . . . . . . . 62.2 à diffØrentes Øchelles . . . . . . . . . . . . . . . . . . . . . . 72.2.1 ReprØsentation multi-Øchelles . . . . . . . . . . . . . . . . . . . . . . 72.2.2 Etude de l’Øchelle des caractØristiques . . . . . . . . . . . . . . . . . . 82.3 CaractØristiques classiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102.3.1 Point d’intØrŒt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.3.2 Contour . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.3.3 Segment de droit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.3.4 RØgion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.4 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 DØtection de crŒtes 193.1 DØ nition de crŒte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193.2 CrŒte dans l’image . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213.3 MØthodes d’extraction de pic et crŒte existantes . . . . . . . . . . . . . . . . . 263.3.1 DØtecteurs de crŒtes . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.3.2 de pic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.4 Notre mØthode de dØtection de crŒte et pic . . . . . . . . . . . . . . . . . . . . 323.4.1 Etude de la suface local ...
Voir plus Voir moins

Vous aimerez aussi

Table des matières
1 Introduction 2 Caractéristiques visuelles 2.1 Quelques critères d’évaluation de caractéristiques visuelles . . . . . . . . . . . 2.2 Caractéristiques à différentes échelles . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Représentation multi-échelles . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Etude de l’échelle des caractéristiques . . . . . . . . . . . . . . . . . . 2.3 Caractéristiques classiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Point d’intérêt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Contour . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Segment de droit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.4 Région . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Détection de crêtes 3.1 Définition de crête . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Crête dans l’image . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Méthodes d’extraction de pic et crête existantes . . . . . . . . . . . . . . . . . 3.3.1 Détecteurs de crêtes . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.2 Détecteurs de pic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Notre méthode de détection de crête et pic . . . . . . . . . . . . . . . . . . . . 3.4.1 Etude de la suface local associée à un point caractéristique . . . . . . . 3.4.2 Choix du filtre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.3 Approche multi-échelle . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
3 5 6 7 7 8 10 11 14 15 16 17 19 19 21 26 26 32 32 32 32 32 32
Chapitre
1
Introduction
3
Chapitre 2
Caractéristiques visuelles
Les approches existantes de la reconnaissance dans la littérature se divisent en deux ca-tégories : les approches basées directement sur le signal d’image ; les approches utilisant des caractéristiques géométriques de l’objet. Les approches utilisent l’information de luminosité de l’image ne s’intéressent pas à ce qui doivent être vus dans l’image (un point, une ligne, un rectangle ...) mais plus tôt ce qui sont réellement vus dans l’image pour caractériser un objet. Les premières idées étaient d’uti-liser l’histogramme de couleur [?]. Pour rendre moins sensible au changement de luminosité, quelques auteurs ont proposé d’utiliser le descripteur de l’intensité []. Les descripteurs sont des filtres de Gabors [] ou des filtres “steerables” []. Avec ces descripteurs, la performance de la reconnaissance a été beaucoup augmentée par rapport à l’utilisation originale de l’histogramme de couleur. Autre idée est d’utiliser une collection d’images et ensuite les réduire dans un espace propre1proposées [] qui apprennent les caractéristiques décri-. Différentes réductions ont été vant le mieux l’image. Toutes les approches basées sur la luminance de l’image sont globales et par conséquent ont des difficultés quand l’objet est partiellement caché ou l’objet se contitue à partir de structures étranges2. Bien au contraire aux approches précédentes, les approches utilisant des caractéristiques géométriques [] montrent ce qui doivent être vus dans l’image : une ligne, un coin, un triable, etc. Ce type d’approches donne une représentation intituive et compacte de l’objet, ce qui est plus proche de la perception de l’être-humain de l’objet. Ces approches consistent généralement de 3 composantes : l’extraction de caractéristiques, la construction de modèle et la mise en correspondance des modèles. La sélection de caractéristiques à extraire depend fortement du type de l’objet à recon-naître, de la condition d’acquisition d’images et de l’objectif de la reconnaissance. Cette thèse se concentre sur l’utilisation des caractéristiques pour faire la reconnaissance générique des ob-jets où on a besoin d’une caractérisation abstraite de la forme. Les caractéristiques classiques sont : le point d’intérêt, le contour, le segment de droit, la région. Pourtant, ces caractéristiques 1eigenspace 2extraneous
5
ne sont pas applicables à représenter tous types d’objets de formes géométriques différentes, mais plus tôt des CAD-objets. Ce chapitre a pour but de rappeler brièvement quelques caractéristiques les plus utilisées dans la littérature. Nous allons analyser sous quelques critères proposés leurs avantages et sur-tout leurs inconvénients dans la représentation de l’objet d’ou la motivation d’introduire d’autres types de caractéristiques répondant mieux à un système de reconnaissance générique. L’organisation de ce chapitre est suivante : Dans la section 1, nous présentons quelques critères pour évaluer une caractéristique. Ces critères sont générales et donc utilisables pour évaluer des caractéristiques dans toutes les applications en vision par ordinateur. La section 2 introduit un cardre multi-échelles où l’image est étudiée à différentes résolutions, ce qui permet de faire apparaître des structures de tailles différentes dans l’image. Nous présentons et éavluons dans la section 3 quelques caractéristiques classiques utilisées pour la reconnaissance d’objets. La dernière section discute sur la motivation d’utiliser la caractéristique de type crête pour la représentation d’objet. à fin de faire la reconnaissance générique.
2.1 Quelques critères d’évaluation de caractéristiques visuelles La sélection de caractéristiques pour représenter des objets dépend de l’application. Une ca-ractéristique est efficace pour certaines applications, mais mauvaise pour d’autres. En général, on évalue une caractéristique (ou un ensemble de caractéristiques) en se basant sur le résultat final de l’application. Par exemple, dans une application de reconnaissance d’objets, les caracté-ristiquesutiliséessontévaluéesparletauxdereconnaissance,c-a-d,leratiodenombredobjets reconnus correctement sur le nombre d’objets au total à reconnaitre. Cependant, ceci n’exclus pas le fait d’avoir des critères générals en théorie que doit sa-tisfaireunecaratérisitique.Nousprésentonsci-dessoustelsquelscritères.Pourunespécique application, d’autres critères devraient s’ajouter. 1.Expressivité: L’expressivité d’une caractéristique est définie comme sa qualité expres-sive des objets dans l’image. Par exemple, avec un object manufacturé, le segment de droit est la plus expressive caractéristique. Pourtant, il est bien vu que le segment de droit n’est pas bon pour représenter des structures rondes. En fait, nous ne voulons pas des ca-ractéristiques spécifiques pour une application concrète dans lequels sont traités quelques types d’objets particuliers. Nous cherchons ce qui sont générals, capables de décrire fia-blement la plupart des images. Or le fait de trouver un tel type de caractéristique n’est pas évident parce que les objets dans la réalité varient fortement en colour, en forme et en texture. 2.Invarianceest définie comme le fait qu’un même point physique d’un: L’invariance objet visible dans deux images soit représenté par une mesure identique [?]. Quelques auteurs appelent larépétabilité. Si les caractéristiques représentant des objets invariantes aux transformations telles que le changement de luminosité, la translation, la rotation, le
changement d’échelle, etc la reconnaissance d’objets sera plus robuste aux telles quelles transformations. Une invariance n’existe que dans la théorie, pas en réalité à cause de bruit. Nous pouvons remplacer ce critère par par larobustesse aux transformations, ce qui demande moins de précision. 3.Robustesse au bruit: Une caractéristique dite robuste au bruit si elle est faiblement in-fluencée par le bruit. Le bruit est défini ici comme tous ce qui pertubent la scène que l’on veut capturer son image. Cette pertubation peut être causée matériellement ou logi-ciellement par une source “externe”, “interne”. Ces sources de bruit rendent mauvaise la qualité l’image, quelques structures d’objets sont floues ou cassés donc très difficiles à reconnaître même par l’oeil humain. 4.DiscriminalitéDeux structures de l’objet différentes devraient être représentées par: deux caractéristiques différentes et vice versa. Les caractéristiques discriminantes rendent plus discriminante la reconnaissance. En plus, il permet de réduire remarquablement l’es-pace de mémoire nécessaire pour stocker des caractéristiques pendant la phase d’appren-tissage et par conséquence réduire le temps de recherche pendant la reconnaissance. 5.Détectivité: La détectivité mesure si la caractéristique est facile à détecter. Il s’agit de la simplicité algorithmique de détection de caractéristique. La réalisation d’un système temps réel demande le calcul moins coûteux possible.
2.2 Caractéristiques à différentes échelles Dans le monde réel, un objet (une structure) n’existe qu’à une ou quelques échelles []. Un exemple classique est le cas d’un abre. Quand on est loin de l’abre, on voit sa forme globale. Si on s’approche, on voit les branches, les feuilles, et voire des celules si on est sous la loupe. Un problème fondamental de la vision par ordinateur est de décider à quelles échelles devrait on étudier l’image donnée. Dans la plupart des applications, l’information de l’échelle n’est pas disponible. La solution la plus simple est de considérer l’image à plusieurs échelles et établir les relations des structures au travers des échelles. Nous présentons brièvement dans la suite la construction de la repré-sentation multi-échelles et montrons comment étudier des caractéristiques à plusieurs échelles. Pourplusdedétails,voirdestravauxoriginauxsurlespace-échelle[].
2.2.1 Représentation multi-échelles La théorie de l’espace d’échelle [] fournit un cadre de travail mathématique pour l’analyse de l’image à multi-échelles. Une représentation dans l’espace d’échelle d’une image est en fait une pile des images générées en lissant l’image originale. Ce processus de lissage est décrite par l’équation de diffusion [].
FIG. 2.1 – (a) Image originale. (b,c,d,e,f) sont des images lissées par les Gaussiens avec= 1,2,22,4respectivement. Nous trouvons que l’image est de plus en plus floue. Les détails disparaissent. Cela est plus claire quand on voit la représentation 3D de ces images dans la figure ci-dessous.
(2.1)
(2.2) Dans [], on a démontré que la Gaussienne est la solution unique de??. La figure??montre un ensemble d’images lissées par des filtres Gaussiens. Plusest grand, plus l’image est floue. Les structures de taille petite disparaissent quand l’échelle augmente. Une représentation de l’objet devrait tenir compte des structures globales ainsi que détails, d’où la nécessité de tra-vailler à plusieurs échelles.
2.2.2 Etude de l’échelle des caractéristiques Une structure dans l’image n’apparaît significativement qu’à une ou quelques échelles in-trinsèques[]. L’échelle intrinsèque d’un point dans l’image est définie comme l’échelle à la quelle la réponse d’une certaine mesure admet un extremum local en ce point. La mesure utili-sée dépend de type de point que l’on veut détecter. Par exemple, le Laplacien est souvent utilisé
FIG. 1,2,
2.2 22,
– Représentation 3D 4,42,8,82,16,162,32,
de 322
l’image de gauche
2.1.a à droite,
aux échelles du haut vers le
 bas.
=
pour détecter des blobs, le Gradient pour des points de contour, la courbure pour les corners, etc. La figure??montre un exemple des échelles intrinsèques d’un point au centre de fleur. Deux extrema locaux du profil de Laplacien correspondent à deux structures présentes à cette position : le pistil de fleur présent à l’échelle petite (le circle rouge), l’entour de fleur est à l’échelle plus grande (le circle vert). Il est évident de garder ces deux informations. Comme on a vue, un point peut avoir une ou plusieurs échelles intrinsèques. La plupart des travaux ne considèrent qu’une seule échelle intrinsèque du point : l’échelle à la quelle la mesure en ce point atteint une valeur maximale ou la première échelle intrinsèque rencontré dans l’intervalle d’échelle considéré. En fait, quand un point a plus d’une échelle intrinseque, ce la correspond à l’évenement d’avoir plus d’une structure y se présentent. La façon la plus simple est de considérer toutes les échelles intrinsèques trouvées. Avec ça, on peut tenir compte tous les structures présentes dans l’image. Il convient à des approches numériques de reconnaissance représentant chaque pixel par un vecteur de champs réceptifs [?, 4,?]. De cette manière, un point ayant deux échelles intrinsèques pourra être représenté par deux vecteurs de champs réceptifs correspondant à deux structures y présentes. Ceci apparaît raisonable. Nous venons d’étudier des échelles d’un point dans l’image. Considérons maintenant une caractéristique qui n’est pas un point, mais un ensemble de points tels que un contour, un seg-ment de droit, une crête ou une région, existe encore la notion de l’échelle de ces types de caractéristique ? Dans la litérature, cette question n’a jamais été explicitement posé et très peu de travaux traitent sur ce sujet. Dans [], Lindeberg propose de détecter séparément des points à leurs échelles caractéristiques et ensuite regrouper des points pour obtenir des crêtes. Avec cette mé-thode, les échelles peuvent varier le long de la crête. Cette approche apparaît logique, mais son inconvénient n’a pas encore été étudié. Nous allons voir dans le chapitre suivant qu’à cause de la quantification de l’échelle ainsi que la discrétisation du signal image, les crêtes obtenues sont très discontinues. Or, quand on veut une caractéristiques de type “ligne”, on la veut vraiment une ligne, pas de trous au milieu. Avec cette raison, nous décidons de suivre l’approche multi-échelles. De cette mainière, nous ne devons pas de faire face aux difficultés de sélections des échelles ainsi que le “remplissage” des trous dans une ligne.
2.3 Caractéristiques classiques
Les sections??et??ont discuté sur différentes critères d’évaluation d’une caractéristique et la représentation de l’image à plusieurs échelles. Nous présentons dans cette section quelques types de caractéristiques les plus utilisées dans la littérature. Chaque type sera évalué selon des critères étudiés précédemment.
FIGImage originale. (b) Points d’intérêt détecté par détecteur de Harris, k usitlisé est. 2.3 – (a) 0.004. (c) Points d’intérêt superposent sur l’image originale.
2.3.1 Point d’intérêt Plusieurs taches en vision par ordinateur sont basées sur les points d’intérêt. Il s’agit de : Reconstruction 3D[], Suivi [], Recherche d’image basée sur la contenue [], Reconnaissance d’objet[], Localisation de robot mobile [], etc. Ils ont montré que l’utilisation de point d’intérêt améliore énormément la robustesse de l’algorithme, par exemple, par rapport à l’occultation. Il réduit le flux de données et par conséquence réduit le temps de calcul. Pour cette raison, plusieurs chercheurs ont consacré à la recherche des algorithmes pour détecter des points de facons plus fiable, plus stable et invariant sous quelques transformations []. Il existe plusieurs façon pour définir un point d’intérêt. Donc, plusieurs détecteurs de point d’intérêt ont été conçus par exemple, celui basé sur l’extremum local du niveau de gris dans l’image [], celui basé sur le maximum de la courbure le long du contour [], et celui basé sur la distribution du niveau de gris. Nous nous intéressons à trois types de point d’intérêt :
Corner Une variété de détecteurs de corner a été proposée et le plus connu est le détecteur d’Harris []. Harris sélectionne des points telle que la fonction d’auto-corrélation saute dans deux direc-tions principales de la surface locale associé à ce point. Considérons la matrice suivante :  M=((Ix)xI()2yI()Ix)x(yI) ( I)2(2.3) I(x, y)de l’image. La fonction qui mesure un corner est définieest une fonction d’intensité par : R=detM k(traceM)2(2.4) Ici,kest une constante. D’après la suggestion d’Harris,kest mis à0.04. Les corners sont indentifiés aux endroits ouRadmet un extremum local.