Chapitre 1 Introduction Cette thèse est consacrée à la représentation de la géométrie des images. Pour obtenir une représentationefficaceilfautmodéliserl’informationgéométriqueetonconstruitdesoutils pourtraitercemodèle.Cesdeuxingrédientsvontdepaire,s’influençantmutuellementpour obtenir un résultat satisfaisant, c’est à dire un modèle pertinent et des algorithmes rapides et performants. On propose donc une modélisation géométrique des images, l’ambition étant de pouvoir extraire l’information contenue dans les images naturelles, c’est-à-dire les images qui nous entourent. Ce problème est bien sûr difficile car la géométrie des images est complexe et variable. (a) (b) (c) (d) (e) (f) Fig. 1.1 Exemples d’images et de textures. Textur es Image s2 Chapitre 1 Introduction 1.1 1.1 La géométrie des images La géométrie des images et des textures. La figure 1.1 (a–c) fournit des exemples d’images géométriques de complexité croissante. L’image 1.1 (a) montre une image géométrique simple. Il s’agit d’un objet géométrique de couleur uniforme sur un fond uniforme. Malgré la simplicité de cet exemple, la description de cette forme nécessite de nombreux détails : ce triangle possède des coins, ses côtés sont légèrement courbés et ces derniers sont un peu flous. En agrégeant de nombreux objets géométriques, on arrive à une image proche de celle des dessins animés, comme on peut le voir à la figure 1.1 (b). Les phénomènes d’occlusion entre les différents plans de la scène complexifient encore la ...
Chapitre 1
Introduction
Cette thèse est consacrée à la représentation de la géométrie des images. Pour obtenir une
représentationefficaceilfautmodéliserl’informationgéométriqueetonconstruitdesoutils
pourtraitercemodèle.Cesdeuxingrédientsvontdepaire,s’influençantmutuellementpour
obtenir un résultat satisfaisant, c’est à dire un modèle pertinent et des algorithmes rapides
et performants.
On propose donc une modélisation géométrique des images, l’ambition étant de pouvoir
extraire l’information contenue dans les images naturelles, c’est-à-dire les images qui nous
entourent. Ce problème est bien sûr difficile car la géométrie des images est complexe et
variable.
(a) (b) (c)
(d) (e) (f)
Fig. 1.1 Exemples d’images et de textures.
Textur
es
Image
s2 Chapitre 1 Introduction 1.1
1.1 La géométrie des images
La géométrie des images et des textures. La figure 1.1 (a–c) fournit des exemples
d’images géométriques de complexité croissante.
L’image 1.1 (a) montre une image géométrique simple. Il s’agit d’un objet géométrique de
couleur uniforme sur un fond uniforme. Malgré la simplicité de cet exemple, la description
de cette forme nécessite de nombreux détails : ce triangle possède des coins, ses côtés sont
légèrement courbés et ces derniers sont un peu flous.
En agrégeant de nombreux objets géométriques, on arrive à une image proche de celle des
dessins animés, comme on peut le voir à la figure 1.1 (b). Les phénomènes d’occlusion
entre les différents plans de la scène complexifient encore la structure de l’image. Ce type
d’images constitue le premier modèle qui sera abordé dans cette thèse.
La photographie 1.1 (c) est représentative des images que l’on souhaite pouvoir traiter
car le monde qui nous entoure n’est pas celui des dessins animés. Elle possède certes des
objets géométriques mais une grande part de l’information est contenue dans les textures
qui remplissent ces objets.
Les images (d-f) montrent des textures possédant une structure géométrique. Ce sont ces
textures géométriques qui font défaut au modèle d’images régulières par morceaux (images
(a–b)). Pourtant, ces textures sont présentes dans la plupart des photographies que l’on
souhaite comprimer. Une caractéristique commune de ces textures est qu’elles sont formées
par de longs filaments qui s’entrechoquent (couches sismiques (d), nervures du bois (e) et
fluide turbulent (f)). Le deuxième modèle abordé dans cette thèse est celui des textures
turbulentes, qui possèdent des structures géométriques longues.
Formationdelagéométrie. Cettemultitudedestructuresgéométriquespeutenpartie
s’expliquer par le principe de formation de ces images.
Une scène photographiée est composée d’objets se cachant les uns les autres et projetant
desombres. Le principed’occlusioncréedes contourset des jonctions,de plus la diffraction
de la lumière a tendance à lisser ces courbes. Ce type de phénomènes justifie en partie le
modèle de dessin animé représenté à l’image 1.1 (b).
De nombreux phénomènes naturels créent des textures géométriques, comme par exemple
des écoulements turbulents (image 1.1 (f)) ou bien des croissances régulières (images
1.1 (e)).
Enfin, les constructions humaines possèdent souvent des structures périodiques et symé-
triques, comme par exemple les stries et damiers des habits dans l’image 1.1 (c).
Traitement de la géométrie. La compréhension de la géométrie des images constitue
le point bloquant dans nombre d’applications. En traitement d’images, la compression, le
débruitage et l’inversion d’opérateurs sont bien sûr concernés et sont abordés dans cette
thèse. En vision par ordinateur, les problèmes de groupage et de segmentation mettent en
jeudesformesgéométriquesetlaquestiondelareconnaissancedeformessedoitd’exploiter
des a priori géométriques. Enfin, en graphisme 2D et 3D, la synthèse d’images et particu-
lièrement de textures demande un réalisme accru et donc une grande fidélité géométrique.1.1.1 La géométrie des images 3
Uneapprochecourantepouranalyseruneimageestdetrouverunereprésentationcompacte
de son contenu. Pour obtenir une représentation efficace, il faut exploiter les sources de
régularité qui existent dans l’image. Les outils classiques comme l’analyse de Fourier et
l’analyse en ondelettes doivent être dépassés pour analyser la régularité géométrique des
images naturelles.
La recherche de représentations non redondantes est à la base du développement de la
théorie de l’information fondée par Shannon [172] et de la physiologie de la vision, comme
postulé par Attneave [12]. La théorie de l’information a eu un impact considérable sur
l’analyse d’images, mais ce n’est qu’assez récemment que les outils numériques ont été
rapprochés des modèles physiologiques, voir par exemple les travaux de Olshausen et Field
[143]. La recherche d’outils mathématiques pour représenter la géométrie pourrait ainsi
avoir un impact sur la compréhension du fonctionnement du cortex visuel.
1.1.1 Modèle mathématique
Le premier type de structures géométriques étudié dans cette thèse est celui des images de
dessins animés, figure 1.1 (b). On peut les définir mathématiquement comme des fonctions
régulières à l’extérieur d’un ensemble de courbes régulières. Comme les images naturelles
ontrarementdesdiscontinuitésaussifranches,unlissagepeutaussiêtreappliquéàl’image,
avec un noyau a priori inconnu. Ce modèle a été introduit par Donoho dans [67] et il a
aussi été utilisé par Le Pennec et Mallat dans [114].
Fonctions uniformément régulières Dans cette thèse, on considère des exposants de
2 αrégularité α > 0 non nécessairement entiers. Si Ω ⊂ R est un ouvert, on note C (Ω)
l’espace des fonctions α-hölderiennes d’ordre α sur Ω. Ce sont les fonctions f : Ω→R
ayant des dérivées partielles jusqu’à l’ordre [α] vérifiant
a +a a +a1 2 1 2∂ f(x) ∂ f(y) [α]−αmax sup − x−ya a a a1 2 1 2∂x ∂x ∂x ∂xa +a =[α] 2 1 2 1 2def. 1 2 (x,y)∈Ω
+f α = max < ∞ C (Ω) a +a1 2∂ f(x)max sup a a1 2∂x ∂xa +a 6α1 2 1 2x∈Ω
avec
def. ⌊α⌋ si α∈/N,
[α] =
α−1 si α∈N.
2 2Fonctionsavecunerégularitégéométrique Unefonctionf ∈ L ([0,1] )possèdeune
αrégularité géométrique C si
α 2f = f ou f = f ∗h avec f ∈C (Λ) pour Λ=[0,1] −{γ } .i 16i6G
αLe noyau de lissage h est C et possède un support de taille s >0. On suppose de plus
−(2+α)
αqu’il vérifie h 6 s .C
αLes courbes de contours γ sont C et ne s’intersectent pas tangentiellement.i
Les courbes γ sont les contours des objets géométriques formant l’image à analyser. Lesi
discontinuités que définissent ces courbes sont dues aux phénomènes d’occlusion entre les
objets, qui de plus crée des jonctions en T et des croisements. Le lissage par un noyau h
modélise le phénomène de diffraction, qui génère un flou d’image a priori inconnu.4 Chapitre 1 Introduction 1.2.2
Cette classe de fonctions géométriques constitue le modèle mathématique qui permet d’ob-
tenir tous les résultats garantissant la qualité de la représentation à l’aide de bandelettes
orthogonales.
Pourtant, comme on l’a vu à la figure 1.1 (d-f), la plupart des images contiennent des
structures géométriques plus complexes. Dans un premier temps, il est donc important de
construire des algorithmes suffisamment robustes pour améliorer le traitement des images
même dans ces cas difficiles. Dans un deuxième temps, nous identifions les difficultés que
représentent ces parties texturées et présentons quelques pistes pour aller plus loin dans
l’analyse géométrique.
1.2 Succès et échecs des bases d’ondelettes
Lecadremathématiqueclassiquepourconstruireunereprésentationcompactedefonctions
estceluidel’approximationdansunebaseorthonormée.Danscettesection,nousprésentons
ce cadre et détaillons le cas des bases d’ondelettes, populaires en compression d’images.
1.2.1 Meilleure approximation orthogonale
2 2L’approximation d’une fonction f ∈ L ou d’un vecteur f ∈ ℓ se calcule de façon simple
2 2dès lors que l’on dispose d’une base orthonormée B = {g } de L ou ℓ . Il suffit en effetμ μ
d’imposer un seuil T > 0 et de rejeter les coefficients de la décomposition de f dans B
d’amplitude inférieure à T
def. def.
f = f, g g avec M = Card{ \| f, g | >T},M μ μ μ
| f,g |>Tμ
2 2où , est le produit scalaire canonique sur L ou ℓ .
Lafonctionf ainsiobtenueestlameilleureapproximationdef avecMcoefficientsdanslaM
baseB. Cette approximation est non linéaire puisque les coefficients f, g pris en compteμ
pour approcher f sont choisis en fonction de f. Pour obtenir une approximation efficace en
2norme L , il s’agit donc de trouver une base exploitant au mieux les propriétés de la classe
de fonctions considérée.
Pour les fonctions uniformément régulières, la base de Fourier est optimale pour effectuer
2de telles approximations. Pour les fonctions de L ([0,1]) ayant des discontinuités, les bases
d’ondelettes, décrites au prochain paragraphe, permettent de pallier au problème de l’ana-
lyse de Fourier en exploitant pleinement l’adaptivité qu’autorise le choix des coefficients à
garder.
1.2.2 Bases d’ondelettes 1D
LesondelettesontétéintroduitesdanslestravauxdeDaubechies[54],Mallat[127]etMeyer
[136].CestravauxgénéralisentlesprocéduresdecodagepyramidalescommecelledeBurtet1.2.2 Succès et échecs des bases d’ondelettes 5
Adelson [26] et le codage en sous-bandes utilisé par Vetterli [191] pour le codage d’images.
Les ouvrages de Daubechies [55], Mallat [128], Meyer [137] et Vetterli [192] constituent des
références sur l’approximation en ondelettes.
2 2Une base d’ondelettes B de L ([0,1] ) est obtenue en dilatant et translatant une fonction
ψ
def. def.−j −j/2 −jB = ψ j60, n=0...2 −1 avec ψ (x) = 2 ψ(2 x−n).jn jn
2Il est nécessaire de modifier les ondelettes dont le support intersecte le bord de [0,1] pour
obtenir une base orthonormée. Pour les développements théoriques du chapitre 2 il suffit
de considérer une extension périodique des fonctions de base à l’extérieur du carré.
La fonction ψ possède principalement deux propriétés :
Elle est oscillante. La fonction ψ a ainsi un nombre p suffisamment élevé de moments
nuls
1
k∀k6 p−1, ψ(x)x dx=0.
0
αSi une fonction f est régulière, par exemple de classe C sur un intervalle