//img.uscri.be/pth/013f97d5ba80f3c79d9359f2c3ae8694902b32ec
Cet ouvrage fait partie de la bibliothèque YouScribe
Obtenez un accès à la bibliothèque pour le lire en ligne
En savoir plus

Contributions à l’apprentissage automatique pour l’analyse d’images cérébrales anatomiques, Contributions to statistical learning for structural neuroimaging data

De
236 pages
Sous la direction de Olivier Colliot, Habib Benali
Thèse soutenue le 29 mars 2011: Paris 11
L'analyse automatique de différences anatomiques en neuroimagerie a de nombreuses applications pour la compréhension et l'aide au diagnostic de pathologies neurologiques. Récemment, il y a eu un intérêt croissant pour les méthodes de classification telles que les machines à vecteurs supports pour dépasser les limites des méthodes univariées traditionnelles. Cette thèse a pour thème l'apprentissage automatique pour l'analyse de populations et la classification de patients en neuroimagerie. Nous avons tout d'abord comparé les performances de différentes stratégies de classification, dans le cadre de la maladie d'Alzheimer à partir d'images IRM anatomiques de 509 sujets de la base de données ADNI. Ces différentes stratégies prennent insuffisamment en compte la distribution spatiale des \textit{features}. C'est pourquoi nous proposons un cadre original de régularisation spatiale et anatomique des machines à vecteurs supports pour des données de neuroimagerie volumiques ou surfaciques, dans le formalisme de la régularisation laplacienne. Cette méthode a été appliquée à deux problématiques cliniques: la maladie d'Alzheimer et les accidents vasculaires cérébraux. L'évaluation montre que la méthode permet d'obtenir des résultats cohérents anatomiquement et donc plus facilement interprétables, tout en maintenant des taux de classification élevés.
-Apprentissage statistique
-Machines à vecteurs supports (SVM)
-Imagerie par résonance magnétique (IRM)
-Maladie d'Alzheimer
-Accidents vasculaires cérébraux
-Régularisation spatiale
-Régularisation laplacienne
-Anatomie computationnelle
-Diagnostic assisté par ordinateur
Brain image analyses have widely relied on univariate voxel-wise methods. In such analyses, brain images are first spatially registered to a common stereotaxic space, and then mass univariate statistical tests are performed in each voxel to detect significant group differences. However, the sensitivity of theses approaches is limited when the differences involve a combination of different brain structures. Recently, there has been a growing interest in support vector machines methods to overcome the limits of these analyses.This thesis focuses on machine learning methods for population analysis and patient classification in neuroimaging. We first evaluated the performances of different classification strategies for the identification of patients with Alzheimer's disease based on T1-weighted MRI of 509 subjects from the ADNI database. However, these methods do not take full advantage of the spatial distribution of the features. As a consequence, the optimal margin hyperplane is often scattered and lacks spatial coherence, making its anatomical interpretation difficult. Therefore, we introduced a framework to spatially regularize support vector machines for brain image analysis based on Laplacian regularization operators. The proposed framework was then applied to the analysis of stroke and of Alzheimer's disease. The results demonstrated that the proposed classifier generates less-noisy and consequently more interpretable feature maps with no loss of classification performance.
-Statistical learning
-Support vector machines (SVM)
-Structural MRI
-Alzheimer's disease
-Strokes
-Spatial regularization
-Laplacian based regularization
-Computational anatomy
-Computer-aided diagnosis
Source: http://www.theses.fr/2011PA112033/document
Voir plus Voir moins

`THESE DE DOCTORAT
´ ´SPECIALITE: PHYSIQUE
´Ecole Doctorale ”Sciences et Technologies de l’Information des
T´el´ecommunications et des Syst`emes”
pr´esent´ee par
R´emi Cuingnet
Contributions `a l’apprentissage automatique pour l’analyse
d’images c´er´ebrales anatomiques
Membres du jury:
Pr´esident : Emmanuel DURAND
Rapporteurs : Xavier PENNEC
Jean-Philippe VERT
Examinateurs : Jean-Franc¸ois MANGIN
Pierre CELSIS
´Alain TROUVE
Directeurs de th`ese : Habib BENALI
Olivier COLLIOT
tel-00602032, version 1 - 21 Jun 2011tel-00602032, version 1 - 21 Jun 2011Remerciements
Si je fais le bilan de la formation académique que j’ai eu la chance de recevoir, le doctorat et la
«prépa» ont été indéniablement les années les plus exaltantes. Ces années n’auraient pu se
faire sans un cadre humain solide. Je remercie chaleureusement toutes les personnes qui m’ont
soutenu durant ces années.
Je remercie tout d’abord les membres du jury présidé par Emmanuel Durand. Je remercie
tout particulièrement Xavier Pennec et Jean-Philippe Vert de m’avoir fait l’honneur d’être
rapporteurs de ce travail. Je leur exprime toute ma reconnaissance pour le temps qu’ils ont
consacré à la lecture approfondie de ce manuscrit ainsi que pour les retours si constructifs
qu’ils m’ont adressés. Je remercie aussi chaleureusement Pierre Celsis, Jean-Francois Mangin
et Alain Trouvé d’avoir accepté de faire partie de mon jury de thèse.
Je remercie chaleureusement mes deux directeurs de thèse Habib Benali et Olivier Colliot.
Merci à toi Olivier de m’avoir proposé cette thèse. Merci d’avoir su m’épauler tout en me
laissant cette exaltante liberté propre à la recherche. Merci d’avoir cru en mes idées et de
m’avoir consacré tant de temps. Merci pour tes conseils avisés, ton écoute et ton sens des
rapports humains. Il en va aussi pour Marie Chupin, pierre angulaire du laboratoire malgré
elle. Sa connaissance, sa gentillesse, sa rigueur, sa disponibilité et son empathie ont joué un
rôle clé dans ma thèse.
Je remercie également Sylvain Baillet et Line Garnero d’avoir accueilli au LENA le néo-
phyte que j’étais en traitement d’images médicales.
Au sein de l’équipe CogImage, je remercie particulièrement Mario Chavez et Jacques
Martinerie pour leur enthousiasme, leur gentillesse et leur disponibilité. Je remercie l’ensemble
des masters, doctorants et postdoctorants du laboratoire pour la bonne ambiance qu’ils créent.
Je pense plus particulièrement à mes aînés : Julien Lefèvre que je n’ai croisé que durant mon
stage et avec qui j’aurai eu grand plaisir à travailler, Anaël Dossevi, à Benoit Cottereau et
son souci de «classitude» dans les présentations, les deux niçois Guillaume Auzias avec son
empathie sans limite etYohan Attal avec sa droiture,son courage et son optimisme exemplaire,
iii
tel-00602032, version 1 - 21 Jun 2011R￿￿￿￿￿￿￿￿￿￿￿￿
Manik Battacharjee (Je suis persuadé que l’on aurait fait un très bon duo),Florence Gombert la
con￿dente,MichelBesserveàquijesouhaited’intégrerrapidementleCNRSetSheraz.Jepense
également aux étudiants qui sont arrivés en même temps ou après moi : l’ingénieur-chercheur
Thomas Samaille et son esprit si pragmatique, la danseuse Émilie Gerardin, ma co-déléguée
Lucile Gamond et ses talents culinaires, Thibault Dumas si souriant, Guillaume Dumas (l’esprit
bouillonnant) et Claire Boutet. Sans oublier les anciens stagiaires du LENA dont Gaëtan Yvert
qui a dû passer presque plus de temps à résoudre mes énigmes qu’à son stage et surtout Sarah
MontagneetJérômeTessierasmaintenantdevenusdetrèsbonsamis.JeremercieégalementAli
et Chabha pour leur gentillesse kabyle. Au sein du LIF, je remercie particulièrement Mélanie,
Guillaume, Vincent, Caroline, David, Arnaud et Alexandre. Plus généralement je remercie tous
les membres de CogImage et du LIF pour leur accueil, leur disponibilité et la bonne ambiance
qu’ils créent.
J’exprime toute ma reconnaissance au brillant mathématicien Joan Glaunès, qui m’a tant
aidé dans les tous derniers mois de la thèse.
Parmi les chercheurs rencontrés au cours de ces trois ans et demi, je remercie Gaël
1Varoquaux, Alexandre Gramfort, Timothée Cour et Bertrand Thirion pour les discussions si
enrichissantes que nous avons eues.
Jeremercieégalementlesneuroradiologues,neurologuesetmédecinsnucléairesdugroupe
hospitalier de la Pitié-Salpêtrière sans qui nos travaux seraient dépourvus de sens. Je pense
plus particulièrement à Didier Dormont, Charlotte Rosso, Yves Samson, Stéphane Lehéricy,
Lionel Thivard, Marie-Odile Habert, Marie Sarazin et Dominique Hasboun qui malgré leurs
contraintes professionnelles restent toujours disponibles pour nous.
Je remercie chaleureusement Dominique Martin de l’École Doctorale STITS qui s’est tant
dévouée pour aider les doctorants.
Je remercie mes amis très proches. Merci Elyès Jaillet non seulement d’avoir relu une
partie du manuscrit mais d’avoir toujours était présent dès que j’avais besoin d’aide. Il en
va aussi pour Thomas Guillet et Thierry. Thomas, merci aussi d’avoir répondu à toutes mes
questions, quelque fussent le sujet et le niveau de di￿culté et à n’importe quel moment de la
journée. Tu m’impressionnes vraiment.
Un immense merci à ma famille pour leur soutien et leur amour inconditionnels. Je pense
plus particulièrement à Papa, Maman, Thomas, Clémence, à mes Grands-Parents (Bon Papa,
Papy et Many) et à Lily qui partage désormais ma vie et à qui je dois cette thèse.
Merci à toi Bonne Maman pour ta￿nesse, ta délicatesse, ta gentillesse, ta droiture et ton
courage. Tu as été et resteras un modèle à suivre. J’aurais été si￿er de te présenter ma thèse.
1et aussi pour m’avoir encadré à l’UPenn
iv
tel-00602032, version 1 - 21 Jun 2011Tabledesmatières
Remerciements iii
Tabledesmatières v
Tabledesnotationsetsymboles ix
Introduction 1
1 Problématique 3
1.1 L’apport de l’anatomie computationnelle à l’étude des pathologies cérébrales 3
1.1.1 L’anatomie...................... 3
1.1.2 Objectifs de l’anatomie computationnelle pour l’étude des patholo-
gies cérébrales.............................. 4
1.1.3 Les méthodes 6
1.1.4 Situation du problème . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2 Les méthodes d’apprentissage automatique . . . . . . . . . . . . . . . . . . . 10
1.2.1 L’apprentissage par machines à vecteurs supports . . . . . . . . . . 10
1.2.2 Les machines à vecteur supports . . . . . . . . . . . . . . . . . . . . 19
1.3 Classi￿cation d’images IRM anatomiques . . . . . . . . . . . . . . . . . . . . 24
1.3.1 Choix des caractéristiques utilisées pour la classi￿cation . . . . . . 25
1.3.2 Réduction de dimension . . . . . . . . . . . . . . . . . . . . . . . . 25
1.3.3 Choix du classi￿eur . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.3.4 Limites et améliorations possibles . . . . . . . . . . . . . . . . . . . 28
1.4 Objectifs de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2 Évaluationdestratégiesdeclassi￿cationsurunegrandebased’imagescérébrales 33
v
tel-00602032, version 1 - 21 Jun 2011T￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿
2.1 Contexte : aide au diagnostic de la maladie d’Alzheimer . . . . . . . . . . . . 34
2.1.1 La maladie d’Alzheimer . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.1.2 Le diagnostic de la maladie d’Alzheimer . . . . . . . . . . . . . . . . 40
2.1.3 L’apport de l’imagerie anatomique . . . . . . . . . . . . . . . . . . . 41
2.2 La base de données ADNI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.2.1 Participants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.2.2 Acquisitions IRM . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.3 Les méthodes évaluées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.3.1 Méthodes voxelliques . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.3.2 Méthodes utilisant l’épaisseur corticale . . . . . . . . . . . . . . . . 50
2.3.3 Méthodes l’hippocampe . . . . . . . . . . . . . . . . . . . . 52
2.4 Classi￿cations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.4.1 Les expériences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.4.2 Les classi￿eurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.4.3 Évaluation des performances de classi￿cation . . . . . . . . . . . . 55
2.5 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.5.1 Performance des méthodes . . . . . . . . . . . . . . . . . . . . . . . 59
2.5.2 Complémentarité des méthodes . . . . . . . . . . . . . . . . . . . . 61
2.5.3 In￿uence des prétraitements . . . . . . . . . . . . . . . . . . . . . . 66
2.5.4 In￿uence de l’âge et du genre sur la classi￿cation . . . . . . . . . . 66
2.5.5 Temps de calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.5.6 Description des hyperplans séparateurs . . . . . . . . . . . . . . . . 68
2.5.7 Hyperparamètres optimaux . . . . . . . . . . . . . . . . . . . . . . 72
2.6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.6.1 Classi￿cation AD vs CN . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.6.2 Prédiction de la conversion des patients MCI . . . . . . . . . . . . . 78
2.6.3 Hippocampe ou cerveau entier? . . . . . . . . . . . . . . . . . . . . 79
2.6.4 Le recalage : un modèle complètement déformable est-il avantageux? 80
2.6.5 Utilité des cartes de substance blanche et de CSF dans la classi￿cation 80
2.6.6 Faut-il faire de la sélection de variables? . . . . . . . . . . . . . . . 81
2.6.7 In￿uence de l’âge sur le taux de classi￿cation . . . . . . . . . . . . . 82
2.6.8 Les hyperplans séparateurs . . . . . . . . . . . . . . . . . . . . . . . 82
2.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3 Régularisationspatialeetanatomiquedesmachinesàvecteurssupports 85
3.1 Introduction d’a priori dans les SVM . . . . . . . . . . . . . . . . . . . . . . . 86
3.1.1 Rappels sur le SVM linéaire . . . . . . . . . . . . . . . . . . . . . . . 86
3.1.2 A priori et SVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
vi
tel-00602032, version 1 - 21 Jun 2011Table des matières
3.1.3 Les opérateurs de régularisation . . . . . . . . . . . . . . . . . . . . 90
3.2 Cadre de la régularisation laplacienne . . . . . . . . . . . . . . . . . . . . . . 91
3.2.1 Graphes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
3.2.2 Variétés riemanniennes . . . . . . . . . . . . . . . . . . . . . . . . . 95
3.2.3 Lien avec les approches à noyau de di￿usion . . . . . . . . . . . . . 96
3.3 Régularisation spatiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
3.3.1 Cas volumique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
3.3.2 Cas surfacique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
3.4 Régularisation anatomique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
3.4.1 Graphe de régularisation . . . . . . . . . . . . . . . . . . . . . . . . 99
3.4.2 Calcul de la matrice de Gram . . . . . . . . . . . . . . . . . . . . . . 100
3.4.3 Choix du paramètre de di￿usion . . . . . . . . . . . . . . . . . . . . 103
3.5 Combiner les régularisations spatiales et anatomiques . . . . . . . . . . . . . 104
3.5.1 Somme des termes de régularisation . . . . . . . . . . . . . . . . . . 104
3.5.2 Modi￿cation du graphe de r . . . . . . . . . . . . . . . 109
3.5.3 Variétés riemanniennes . . . . . . . . . . . . . . . . . . . . . . . . . 110
3.6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.6.1 Autres régularisations spectrales . . . . . . . . . . . . . . . . . . . . 117
3.6.2 Gestion de la grande dimension . . . . . . . . . . . . . . . . . . . . 123
3.6.3 Di￿érents modèles de proximité . . . . . . . . . . . . . . . . . . . . 126
3.6.4 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
3.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
4 Applicationsàlamaladied’Alzheimeretauxaccidentsvasculairescérébraux 131
4.1 Application à la maladie d’Alzheimer . . . . . . . . . . . . . . . . . . . . . . 131
4.1.1 Données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4.1.2 Régularisations utilisées . . . . . . . . . . . . . . . . . . . . . . . . 134
4.1.3 Hyperplans séparateurs optimaux . . . . . . . . . . . . . . . . . . . 135
4.1.4 Performances de classi￿cation . . . . . . . . . . . . . . . . . . . . . 136
4.1.5 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
4.2 Application aux accidents vasculaires cérébraux . . . . . . . . . . . . . . . . 142
4.2.1 Les AVC ischémiques . . . . . . . . . . . . . . . . . . . . . . . . . . 143
4.2.2 Analyse statistique de l’hyperplan séparateur . . . . . . . . . . . . 147
4.2.3 Exemple synthétique . . . . . . . . . . . . . . . . . . . . . . . . . . 149
4.2.4 Détection des régions associées au devenir des patients . . . . . . . 151
4.2.5 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
Conclusion 157
vii
tel-00602032, version 1 - 21 Jun 2011T￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿
Listedespublications 161
A Uneborned’apprentissagesimple 165
A.1 Énoncé du problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
A.2 Quelques outils . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
A.2.1 La complexité de Rademacher . . . . . . . . . . . . . . . . . . . . . 166
A.2.2 Inégalités de concentration . . . . . . . . . . . . . . . . . . . . . . . 166
A.3 Démonstration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
A.3.1 Di￿érence entre le risque et le risque empirique . . . . . . . . . . . 167
A.3.2 Di￿erence entre le risque et l’erreur de Bayes . . . . . . . . . . . . 168
B Retoursurcertainesapproximations 169
B.1 Approximation par un lissage gaussien . . . . . . . . . . . . . . . . . . . . . 169
B.1.1 Sur un intervalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
C ListedessujetsdelabaseADNIutilisésdansnosétudes 175
Références 185
Tabledes￿gures 211
Listedestableaux 215
Index 217
viii
tel-00602032, version 1 - 21 Jun 2011Tabledesnotationsetsymboles
Notationsgénérales:
espace de Hilbert..................................................16H
·|· produit scalaire ...................................................16￿ ￿
L ensemble des applications linéaires .................................91
∗ espace dual deH .................................................17H
∗h dual d’un vecteurh∈H..........................................91
†M opérateur adjoint de l’opérateur M .................................90
TM transposée de la matrice M ........................................88
Sp(M)spectre d’un opérateur M .........................................107
conditionnement relatif à la norme spectrale ....................... 102κ2
I matrice identité de tailled×d ....................................100d
1 vecteur colonne de tailled constitué que de 1 .......................101d
symbole de Kronecker ............................................111δij
δ distribution de Dirac ............................................. 121x
P{ω} probabilité d’un événementω ......................................11
espérance de la variable aléatoireX ...............................166E[X]
P opérateur de régularisation ........................................ 90
G op de Green ............................................... 90
NotationspourlesSVM:
ensemble des observations ou input space ...........................10X
x observation (élément deX)........................................10
Y ensemble des classes .............................................. 10
y classe d’une observationx .........................................10
S ensemble des sujets ............................................... 86
ix
tel-00602032, version 1 - 21 Jun 2011T￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿
s indice d’un sujet ..................................................86
N nombre de sujets de la population d’étude ...........................11
f fonction de classi￿cation ...........................................11
F ensemble d’hypothèses ............................................13
￿ fonction de perte ..................................................12
￿ de perte binaire ...........................................120−1
￿ fonction de perte «hinge loss».....................................20hinge
R [f] fonctionnelle de risque associée à la fonction de perte ￿ ..............12￿
∗R risque de Bayes ...................................................11
NR [f] risque empirique pour un échantillon de taille N ....................13￿
∗ classi￿eur de Bayes ............................................... 11f
ˆf estimateur ERM ...................................................13N
K noyau (positif semi-dé￿ni) .........................................15
φ fonction qui envoie les observations dans l’espace des features ........16
R complexité de Rademacher .........................................18N,X
optw vecteur de pondérations optimal dans l’espace des features ........... 20
optα vecteur de p du problème dual ...................22
b biais ou seuil ..................................................... 20
paramètre de régularisation du SVM ................................21C
λ pe de r ........................................19
ξ slack variable ou variable ressort ................................... 21
marge du SVM ...................................................148m
V domaines des images ou surfaces corticales ..........................87
voxel ou nœud du maillage cortical .................................87v
d dimension de l’espace des données (ex : nombre de voxels) ............86
Notationspourlesgraphes
A matrice d’adjacence d’un graphe ................................... 99
L Laplacien d’un graphe .............................................91
˜ normalisé d’un graphe .................................. 100L
A régionr d’un atlas probabiliste .....................................99r
nombre de régionsr d’un atlas probabiliste ..........................99R
(r)d nombre de voxels de la régionr d’un atlas ..........................101
Notationspourlesvariétésriemanniennes
M variété di￿érentielle ..............................................111
g tenseur métrique .................................................111
inverse du tenseur métriqueg ......................................96h
x
tel-00602032, version 1 - 21 Jun 2011