Graphes d attributs et reconnaissance d images, Visual feature graphs and image recognition
146 pages
English

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Graphes d'attributs et reconnaissance d'images, Visual feature graphs and image recognition

-

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
146 pages
English
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Sous la direction de Nikos Paragios, Véronique Prinet
Thèse soutenue le 15 septembre 2010: Ecole centrale Paris
La problèmatique dont nous nous occupons dans cette thèse est la classification automatique d'images bidimensionnelles, ainsi que la détection d'objets génériques dans des images. Les avancées de ce champ de recherche contribuent à l'élaboration de systèmes intelligents, tels que des robots autonomes et la création d'un web sémantique. Dans ce contexte, la conception de représentations d'images et de classificateurs appropriés constituent des problèmes ambitieux. Notre travail de recherche fournit des solutions à ces deux problèmes, que sont la représentation et la classification d'images. Afin de générer notre représentation d'image, nous extrayons des attributs visuels de l'image et construisons une structure de graphe basée sur les propriétés liées au relations de proximités entre les points d'intérêt associés. Nous montrons que certaines propriétés spectrales de ces graphes constituent de bons invariants aux classes de transformations géométriques rigides. Notre représentation d'image est basée sur ces propriétés. Les résultats expérimentaux démontrent que cette représentation constitue une amélioration par rapport à d'autres représentations similaires, mais qui n'intègrent pas les informations liées à l'organisation spatiale des points d'intérêt. Cependant, un inconvénient de cette méthode est qu'elle fait appel à une quantification (avec pertes) de l'espace des attributs visuels afin d'être combinée avec un classificateur Support Vecteur Machine (SVM) efficace. Nous résolvons ce problème en créant un nouveau classificateur, basé sur la distance au plus proche voisin, et qui permet la classification d'objets assimilés à des ensembles de points. La linéarité de ce classificateur nous permet également de faire de la détection d'objet, en plus de la classification d'images. Une autre propriété intéressante de ce classificateur est sa capacité à combiner différents types d'attributs visuels de manière optimale. Nous utilisons cette propriété pour formuler le problème de classification de graphes de manière différente. Les expériences, menées sur une grande variété de jeux de données, montrent les bénéfices quantitatifs de notre approche.
-Reconnaissance visuelle
-Classification d'images
-Théorie spectrale des graphes
We are concerned in this thesis by the problem of automated 2D image classification and general object detection. Advances in this field of research contribute to the elaboration of intelligent systems such as, but not limited to, autonomous robots and the semantic web. In this context, designing adequate image representations and classifiers for these representations constitute challenging issues. Our work provides innovative solutions to both these problems: image representation and classification. In order to generate our image representation, we extract visual features from the image and build a graphical structure based on properties of spatial proximity between the feature points. We show that certain spectral properties of this graph constitute good invariants to rigid geometric transforms. Our representation is based on these invariant properties. Experiments show that this representation constitutes an improvement over other similar representations that do not integrate the spatial layout of visual features. However, a drawback of this method is that it requires a lossy quantisation of the visual feature space in order to be combined with a state-of-the-art support vector machine (SVM) classifier. We address this issue by designing a new classifier. This generic classifier relies on a nearest-neighbour distance to classify objects that can be assimilated to feature sets, i.e: point clouds. The linearity of this classifier allows us to perform object detection, in addition to image classification. Another interesting property is its ability to combine different types of visual features in an optimal manner. We take advantage of this property to produce a new formulation for the classification of visual feature graphs. Experiments are conducted on a wide variety of publicly available datasets to justify the benefits of our approach.
-Visual recognition
-Image classification
-Spectral graph theory
Source: http://www.theses.fr/2010ECAP0026/document

Sujets

Informations

Publié par
Nombre de lectures 94
Langue English
Poids de l'ouvrage 4 Mo

Extrait

ECOLE CENTRALE PARIS
P H D T H E S I S
to obtain the title of
PhD of Science
of Ecole Centrale Paris
Specialty : Applied Mathematics
Defended by
R´egisBehmo
Visual Feature Graphs and
Image Recognition
Thesis prepared at Ecole Centrale Paris,
Laboratoire de Math´ematiques Appliqu´ees
Jury:
President Patrick Bouthemy - INRIA
Reviewers Mihai Datcu - DLR - T´el´ecom ParisTech
Edwin Hancock - University of York
Examinator Fr´ed´eric Jurie - Universit´e de Caen
Co-directors Nikos Paragios - Ecole Centrale Paris
V´eronique Prinet - Institute of Automation,
Chinese Academy of Sciences
tel-00545419, version 1 - 10 Dec 2010tel-00545419, version 1 - 10 Dec 2010Cette th`ese est d´edi´ee a` Gwilym Phillips, a` sa m´emoire,
`a son affection, et `a sa passion pour la Technique.
tel-00545419, version 1 - 10 Dec 2010tel-00545419, version 1 - 10 Dec 2010Acknowledgments
I like to think of thesis as the accomplishment of a four year long collabo-
ration across two continents. Bridging the continental gap between France
and China has not been an easy task, to say the least; for that, a few people
deserve my warm thanks. First and foremost, I would like to express my
deepest gratitude to Veronique Prinet whose careful eye and unwavering
support has been the driving force behind my work for the past four years.
I am also extremely grateful to Prof. Nikos Paragios, whose scientic exper-
tise and profound humanity will remain as an example that I shall remember
throughout my whole career.
The nancial support of this thesis was granted by INRIA (Institut Na-
tional pour la Recherche en Informatique et Automatique) and the Ecole
Centrale Paris, which are the two French institutions at the forefront of
scientic collaboration with China. The LIAMA (Laboratoire en Informa-
tique, Automatique et Mathematiques Appliquees), from the Institute of
Automation of the Chinese Academy of Sciences (-Ñbêv@), in
Beijing, provided me with a fantastic working environment for almost two
years, between 2006 and 2009.
The most fruitful results of my research work have been obtained in col-
laboration with a small handful of people, to whom I feel especially indebted.
In particular, I have greatly beneted from the sharp intellectual insights of
Jean-Baptiste Bordes, PhD; from the lively support of Cyril Cassisa, Yves
Piriou, YuanFei and He LiangLiang; from rewarding exchanges with Martin
de La Gorce, PhD, Ahmed Besbes and Radhouene Neji, PhD.
The second part of my thesis was mainly the result of a joint work
with Paul Marcombes, then a Master student at LIAMA, and Prof. Arnak
Dalalyan; I would like to thank them both for their level of commitment, as
their contribution was immensely benecial to me.
Research and wanderlust have this in common, that their raison d'^etre
is the discovery and understanding of what is yet unknown. I would like to
believe that what I have discovered and understood during these past four
years has made me a slightly richer person, somehow.
tel-00545419, version 1 - 10 Dec 2010

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents