Data-driven quantification and classification of diffusion and perfusion magnetic resonance data [Elektronische Ressource] / vorgelegt von Susanne Schnell

De
Data-driven Quantification and Classification of Diffusion and Perfusion Magnetic Resonance Data Dissertation zur Erlangung des Doktorgrades der Fakultät für Angewandte Wissenschaften der Albert-Ludwigs-Universität Freiburg im Breisgau Vorgelegt von Susanne Schnell aus Greifswald 20. Mai 2010 Dekan: Prof. Dr. B. Nebel Prüfungskommission: Prof. Dr. Hannelore Bast (Vorsitz) JunProf. Dr. Olaf Ronneberger (Beisitz) Prof. Dr. H. Burkhardt (Betreuer) PD. Dr. Michael Markl (Prüfer) Datum der Disputation: 26.11.2010 Contents DEUTSCHE ZUSAMMENFASSUNG: DATEN-GETRIEBENDE QUANTIFIZIERUNG UND KLASSIFIZIERUNG VON DIFFUSIONS- UND PERFUSIONS-MAGNETRESONANZDATEN.............1 KLASSIFIZIERUNG VON HARDI-DATEN IN GEWEBEARTEN MIT HILFE EINER SVM ................................................. 1 Einleitung............................................................................................................................................................ 1 Material und Methoden....................................................................................................................................... 2 Ergebnisse...................................... 3 Diskussion und Ausblick ........................................................................................................
Publié le : vendredi 1 janvier 2010
Lecture(s) : 10
Tags :
Source : D-NB.INFO/1010686801/34
Nombre de pages : 134
Voir plus Voir moins






Data-driven Quantification and Classification of Diffusion and
Perfusion Magnetic Resonance Data




Dissertation

zur

Erlangung des Doktorgrades
der Fakultät für Angewandte Wissenschaften
der Albert-Ludwigs-Universität
Freiburg im Breisgau


















Vorgelegt von

Susanne Schnell
aus Greifswald
20. Mai 2010










































Dekan: Prof. Dr. B. Nebel
Prüfungskommission: Prof. Dr. Hannelore Bast (Vorsitz)
JunProf. Dr. Olaf Ronneberger (Beisitz)
Prof. Dr. H. Burkhardt (Betreuer)
PD. Dr. Michael Markl (Prüfer)
Datum der Disputation: 26.11.2010

Contents

DEUTSCHE ZUSAMMENFASSUNG: DATEN-GETRIEBENDE QUANTIFIZIERUNG UND
KLASSIFIZIERUNG VON DIFFUSIONS- UND PERFUSIONS-MAGNETRESONANZDATEN.............1
KLASSIFIZIERUNG VON HARDI-DATEN IN GEWEBEARTEN MIT HILFE EINER SVM ................................................. 1
Einleitung............................................................................................................................................................ 1
Material und Methoden....................................................................................................................................... 2
Ergebnisse...................................... 3
Diskussion und Ausblick ........................................................................................................ 3
VORHERSAGE DER CHRONISCHEN SCHLAGANFALL-FOLGEN UNTER NUTZUNG MULTI-MODALER MRT-DATEN ...... 4
Einleitung....................................... 4
Material und Methoden............................. 5
Ergebnisse und Diskussion.................................................................................................................................. 5
DISKUSSION UND AUSBLICK..................................................................................................................................... 6
INTRODUCTION ............................................................................................8
1 FUNDAMENTALS OF MAGNETIC RESONANCE IMAGING AND PHYSIOLOGICAL
BACKGROUND..........................................................................................10
1.1. ANATOMY AND FUNCTIONS OF THE HUMAN BRAIN................................................................................... 10
1.2. MRI IN GENERAL....... 13
1.3. FUNCTIONAL APPLICATIONS OF MR IMAGING 13
1.3.1. Diffusion and its properties ................................................................................................................ 14
1.3.2. Diffusion weighted MR imaging ......................................................................................................... 16
1.3.3. Dw-MRI of the human brain............................................................................................................... 19
1.3.4. Perfusion Weighted Imaging............................................................................................................... 24
1.3.5. Diffusion and perfusion MR imaging in acute stroke ......................................................................... 29
1.3.6. State of the art of prediction algorithms for stroke outcome .............................................................. 33
2 BACKGROUND TO PATTERN RECOGNITION AND SUPERVISED LEARNING......................35
2.1 SUPERVISED LEARNING............................................................................................................................ 35
2.2 THE SUPPORT VECTOR MACHINE .............................................................................................................. 37
2.3 IMPACT ON SVM CLASSIFICATION USING IMBALANCED DATA ................................................................. 42
2.4 LOGISTIC REGRESSION AS CLASSIFIER 44
2.5 DATA SCALING AND NORMALISATION 45
3 CLASSIFICATION OF HARDI DATA INTO TISSUE TYPES USING A SVM ...............................48
3.1 INTRODUCTION......................................................................................................................................... 48
3.2 OUTLINE OF THE CLASSIFICATION TASK................................................................................................... 51
3.3 SIMULATED DATA SETS ........................................................................................................................... 51
IN VIVO HARDI MEASUREMENTS AND PRE-PROCESSING........................................................................................ 53
3.4 FEATURES AND PROCESSING OF HARDI DATA 54
3.5 CLASSIFICATION RESULTS AND COMPARISON WITH OTHER METHODS ..................................................... 57
3.6.1. Simulations ......................................................................................................................................... 57
3.6.2. In vivo results...................................................................................................................................... 59
3.6 DISCUSSION AND OUTLOOK ..................................................................................................................... 65
4 PREDICTION OF STROKE OUTCOME USING MULTI-MODAL ACUTE STROKE MRI DATA
..........................................................................................70
4.1 INTRODUCTION......................................................................................................................................... 70
4.2 MATERIALS AND METHODS...................................................................................................................... 70
4.2.1. MRI data acquisition .......................................................................................................................... 70
4.2.2. Processing of the acute stroke data .................................................................................................... 72
4.2.3. Training and testing data sets for the Classifiers ............................................................................... 73
4.2.4. Adjustment and usage of classifiers........ 78
4.3 RESULTS.................... 79
4.3.1. Statistical Analysis of the performance of the stroke outcome prediction algorithms......................... 79
4.3.2. Data and feature analysis of the nine patients .................................................................................... 82
4.3.3. Evaluation of the developed stroke lesion outcome prediction algorithms......................................... 90
4.4 DISCUSSION AND OUTLOOK.................................................................................................................... 104
5 SUMMARY.......................................................................................111
6 DISCUSSION AND OUTLOOK 113
INDEX ............................................................................................I
ABBREVIATIONS ........................................................................................................................................................ I
LIST OF FIGURES....................... III
LIST OF TABLES........................VI
CITED LITERATURE..................VII
OWN PUBLICATIONS .........................................................................................XI
JOURNAL PAPERS......................XI
CONFERENCE ABSTRACTS........XII
ACKNOWLEDGEMENTS ........................................................................................XV
Deutsche Zusammenfassung 1
_____________________________________________________________________________
Deutsche Zusammenfassung: Daten-getriebende
Quantifizierung und Klassifizierung von Diffusions- und
Perfusions-Magnetresonanzdaten

Die vorgestellte Arbeit ist in zwei Hauptteile strukturiert, die als Gemeinsamkeit die
funktionelle Anwendung der MR-Bildgebung und ihre neurologische Signifikanz haben. Die
Teile werden im Folgenden separat behandelt. Beide Teile bearbeiten ein Klassifikationsproblem
auf der Basis eines modellfreien oder daten-getriebenen Ansatzes, da die Hypothese lautet: die
zurzeit aktuellen abgeleiteten Modelle vereinfachen so stark, dass wichtige Informationen
verloren gehen.
Im ersten Teil wurde eine Lösung zum Klassifizieren von hochwinkelaufgelösten
diffusions-gewichteten MRT-Daten in alle Bildkomponenten auf mikroskopischer Ebene ohne
zusätzlich eine anatomische Messung zu benötigen. Im Speziellen heißt das, dass weiße
Hirnsubstanz in zwei mikroskopische Unterklassen aufgeteilt wird (kreuzende und parallele
Faserbündel). Diese Information könnte zum Beispiel für das sogenannte „Fibretracking“, wenn
man es in zwei Schritten durchführen würde, von Nutzen sein: die Regionen, die parallele Fasern
enthalten, könnten mit einem einfachen und schnellen "Streamline"-Algorithmus rekonstruiert
werden, wohingegen man sich auf Regionen, die Kreuzungen enthalten konzentrieren könnte
und diese separat mit einem teureren, aber akkurateren Algorithmus rekonstruieren könnte.
Der zweite Teil der Arbeit ist ein Projekt von großer Bedeutung für die klinische Routine,
um die schnelle Entscheidung über die Behandlungsmethode bei ischämischen Schlaganfall zu
unterstützen und gibt einen tiefen Einblick in aktuelle Methoden und Möglichkeiten bei der
Vorhersage der finalen Schlaganfall-Läsion.
Klassifizierung von HARDI-Daten in Gewebearten mit Hilfe einer
SVM
Einleitung
Hochwinkelaufgelöste diffusions-gewichtete Bildgebungsdaten (HARDI) können für die
Klassifizierung in Gewebearten des Gehirns auf mikroskopischer Ebene mit Hilfe des Support-
Vektor Klassifikators genutzt werden (Schnell et al. 2009). Bei diesem Ansatz können die Deutsche Zusammenfassung 2
_____________________________________________________________________________

Bildkomponenten auf sechs Klassen bezogen werden: graue Substanz (GM), die
mikroskopischen Unterstrukturen der weißen Substanz: parallele Faserbündel (PF) und
kreuzende Faserbündel (CF), das Partialvolumen zwischen weißer und grauer Substanz (PV),
Hintergrundrauschen einschließlich Artefaktregionen (BN), sowie das Liquor (CSF). In
Diffusionstensor-Anwendungen werden typischerweise anatomische T -gewichtete MPRAGE 1
(Magnetization Prepared Rapid Gradient Echo) Bilder mit den HARDI-Bildern koregistriert. Der
Nutzer segmentiert die koregistrierten Daten in nur drei Klassen: GM, weiße Substanz (WM)
und CSF, um Masken für die weitere Prozessierung zu erhalten. Dieser Ansatz ist jedoch anfällig
für viele Fehler, da die Koregistrierung von zwei verschieden Bildmodalitäten (HARDI und T 1
MPRAGE) schwierig ist: der HARDI-Scan wird mit einer schnellen "single-shot echo planar
imaging" Pulssequenz aufgenommen und zeigt sehr spezielle Bildartefakte, die im T MPRAGE 1
nicht auftreten. Deswegen wird eine Lösung für die Segmentierung des diffusions-gewichteten
MRT-Bildes benötigt und konnte auf sechs anstelle von typischerweise drei Klassen erweitert
werden, wenn man die Features mit einer daten-getriebenen Methode aus den HARDI-Daten
extrahiert.
Material und Methoden
Eine Multi-Klassen-Segmentierung der Mikrostrukturen auf Basis von HARDI-Bildern
wurde mit Hilfe einer Support-Vektor-Maschine (SVM) erreicht, die aus dem Feld des
statistischen Lernens stammt. Die SVM benötigt von den Daten abgeleitete Eigenschaften als
Eingangsdaten (der sogenannte Featurevektor). In dieser Arbeit war das die rotationsinvariante
Repräsentation der Kugelflächenzerlegung des HARDI-Signals. Mit dieser Information wurde
die SVM trainiert, um die Funktion zu finden, die die Klassen separieren kann. Die SVM wurde
systematisch mit simulierten Daten getestet und dann in sechs in-vivo Datensätzen angewandt.
Da das Training der in-vivo Daten Wissen über die wahren Bildinhalte eines jeden
Volumenelementes (Voxel) benötigt, musste dies in zwei Schritten durchgeführt werden.
Zunächst wurden nur die Klassen PF und CF mit Hilfe der simulierten Daten (SNR = 10)
bestimmt und das Ergebnis wurde mit dem segmentierten WM maskiert (bekannt vom
koregistrierten T MPRAGE, Registrierung und Segmentierung in SPM5 (2005)). Durch die 1
gleichzeitige Segmentierung von GM und CSF des T MPRAGE waren auch für diese Klassen 1
die wahren Voxelinhalte bekannt. Mit Hilfe dieses gelabelten Trainingsdatensatzes wurden
verschiedene variierende Parametersätze der SVM getestet. Mit Hilfe eines korrespondierenden Deutsche Zusammenfassung 3
_____________________________________________________________________________

unabhängigen Testdatensatzes konnten die Klassifikationsergebnisse evaluiert, aber auch mit
dem Modellansatz, unter Nutzung des linearen, planaren und sphärischen Westin-Koeffizienten
(Westin et al. 1997), verglichen werden.
Ergebnisse
Die Klassifizierung der simulierten Daten mit verschiedenen Rauschniveaus zeigte sogar
bei einem niedrigen SNR von fünf, das der gewählte SVM-Algorithmus eine hohe Sensitivität
und Spezifität, sowie eine hohe Robustheit aufweist. Dies stand im Gegensatz zu dem
Modellansatz, der die Westin-Koeffizienten als Basis nutzte. Das Verarbeiten der in-vivo Daten
zeigte, dass auch hier, im Gegensatz zum Schwellwertverfahren mit den Westin-Koeffizienten,
die daten-getriebene Methode für die Differenzierung zwischen den WM-Strukturen PF und CF
geeignet ist und dass diese Methode auch sensitiv genug ist, um zusätzlich die Separierung der
Klassen CF von GM zu ermöglichen (siehe Figure 3.3, Figure 3.4 und Figure 3.5).
Mit dem Schwellwertverfahren der Westin-Koeffizienten wurden niedrigere Sensitivitäten
und Spezifitäten für die Differenzierung zwischen allen Klassen erreicht. Außerdem wurden die
SVM Segmentierungsergebnisse mit den Ergebnissen aus der Segmentierung des T -Bildes mit 1
SPM verglichen und eine gute Übereinstimmung gefunden (siehe Table 6). Die in-vivo
Ergebnisse zeigten außerdem eine Abhängigkeit von den akquirierten diffusions-enkodierenden
(DE) Richtungen, vor allem für das Detektieren der beiden WM-Klassen. Um die Machbarkeit
zu zeigen, wurde die Methode an sechs unabhängigen Probanden getestet, was sehr ähnliche
Ergebnisse für alle sechs Klassen zeigte.

Diskussion und Ausblick
Dieser neue daten-getriebene Ansatz ermöglicht eine vollautomatische Segmentierung auf
Basis von HARDI-Daten ohne zusätzlich ein T MPRAGE zu benötigen und ohne subjektiver 1
Intervention eines Experten. Das heißt, ist der Trainingsdatensatz einmal aufgesetzt und
optimiert worden, kann jedes zukünftige HARDI-Bild, gemessen mit den gleichen Parametern,
in die sechs Bildklassen segmentiert werden und das sogar in Substrukturen auf mikroskopischer
Ebene unterhalb der Bildauflösung, wie es für die WM-Unterklassen parallele und kreuzende
Faserbündel getan werden muss. Das wurde in sechs in-vivo Testdatensätzen mit robusten
Ergebnissen gezeigt. Deutsche Zusammenfassung 4
_____________________________________________________________________________

Die Segmentationsergebnisse könnten als Apriori-Wissen für “Fibretracking”-Algorithmen
genutzt werden und so die Performance verbessern. Aber auch für andere klinische oder
diagnostische Anwendungen der diffusions-gewichteten MRT wäre diese zusätzlich gewonnene
Information aus den Daten von großem Nutzen. Mit dieser Anwendung konnte gezeigt werden,
dass in Daten versteckte Informationen, die oft durch angenommene Modelle zu stark reduziert
werden, mit einem daten-getriebenen Ansatz gewonnen werden können, natürlich mit dem
Nachteil der hohen Dimensionalität auswirkend auf Rechenzeiten.

Vorhersage der chronischen Schlaganfall-Folgen unter Nutzung
multi-modaler MRT-Daten
Einleitung
Die Entscheidung über die Behandlung bei akutem nicht-hämorrhagischem Schlaganfall
hängt kritisch von der Abwägung zwischen dem Risiko des Infarktwachstums im Gegensatz zum
Risiko der Blutung ab (Garcia 1984) und muss schnell getroffen werden. Um die Entscheidung
des Arztes zu unterstützen, wurden Vorhersage-Algorithmen zur Bestimmung von den zwei
Voxelinhalten gesund und chronisch betroffen entwickelt. Diese Algorithmen nutzen zurzeit den
Ansatz der logistischen Regression mit überwachtem Lernen (Wu et al. 2001). Diese
Vorhersage-Algorithmen sind auf akut gemessene MRT-Daten angewiesen, im Speziellen
diffusions- und perfusions-gewichtete MRT-Daten (dw-MRT, pw-MRT). Von den pw-Daten
werden Perfusionswerte mit Hilfe von Modellen abgeschätzt. Jedoch sind diese abgeleiteten
Werte oft inakkurat, was die Frage aufwarf, ob die existierenden Probleme vermieden werden
können, wenn diese fehlerbehafteten Versuche der Quantifizierung weggelassen werden und ein
rein daten-getriebener Ansatz stattdessen für diese medizinische Fragestellung genommen wird
In dieser Arbeit wird eine daten-getriebene Lösung für die Aufgabenstellung der
Vorhersage der chronischen Schlaganfall-Läsionsgröße vorgestellt, um herauszufinden, ob die
existierenden Methoden genug Informationen für diese Aufgabenstellung enthalten. Ein daten-
getriebener Ansatz für die Selektion der Features aus den Perfusionsdaten wird vorgestellt (im
Folgenden auch modellfreier Ansatz genannt) und sowohl für die Standardvorhersagemethode
mit der logistischen Regression, als auch mit dem hier eingeführten Klassifikation der SVM
angewandt.
Deutsche Zusammenfassung 5
_____________________________________________________________________________

Material und Methoden
Es wurden neun akute Schlaganfalldatensätze für die Vorhersage der finalen Schlaganfall-
Läsion genutzt. Für diese Aufgabe waren zwei Zeitpunkte von Interesse. Die multi-modalen
akuten Schlaganfall-Daten (dw-, pw-MRI, T2-FLAIR, T2*) wurden sobald wie möglich nach
Ausbruch des Schlaganfalls (Zeitpunkt 1, 1 – 6 Stunden nach Erstausbruch) gemessen und
bildeten den Datenkorpus für den Vorhersagealgorithmus. Die T -FLAIR Messung wurde 2
zwischen zwei Wochen und einem Monat nach Schlaganfall (Zeitpunkt 2) akquiriert und bildete
die Basis für die Definition der chronischen Läsion.
Sämtliche akquirierten und koregistrierten Daten wurden weiter verarbeitet, um eine
bessere Repräsentation der Features zu erreichen. Zwei verschiedene Ansätze wurde untersucht
für dieses binäre Klassifikationsproblem: der Modell- und der modellfreie Ansatz. Dies war der
Grund für die Erstellung von zwei verschiedenen Datensätzen jeweils zum Trainieren und
Testen.
Für den Modell-Ansatz wurden die Daten wie in der Literatur vorgeschlagen aufgebaut: der
cerebrale Blutfluss (CBF), das cerebrale Blutvolumen (CBV), die mittlere Transitzeit (MTT), der
“apparent diffusion coefficient” (ADC), das jeweilige diffusions-gewichtete Bild der drei
Hauptrichtungen (DWI), die Messung ohne Diffusionsgewichtung während der DWI-Messung
(b0-image), das T -FLAIR und das T2* Bild waren Grundlage. Diese Zusammensetzung der 2
Daten resultiert zu 8 Features (Wu et al. 2001).
Für den modellfreien Ansatz wurde die Perfusionszeitserie in eine Feature-Repräsentation
prozessiert. Eine automatische Methode wurde entwickelt, die den Teil des Perfusionssignals
extrahiert, der die Boluspassage des Kontrastmittels bis zur Signalerholung enthält.

Ergebnisse und Diskussion
Nach der Erstellung der zwei verschiedenen Featuresätze wurde die Prädiktion mit der
logistischen Regression und der SVM durchgeführt. Der modellfreie Ansatz konnte keine
verbesserten Ergebnisse im Vergleich mit dem Modellansatz erzeugen (siehe Figure 4.19 und
Figure 4.20). Obwohl die Ergebnisse sehr ähnlich aussahen, brauchte die der modellfreie Ansatz
aufgrund der hohen Datenlast wesentlich länger für den wesentlich höheren Rechenaufwand. Die
logistische Regression konnte die Datenmenge des modellfreien Ansatzes gar nicht bearbeiten.
Dennoch war keiner der getesteten Klassifikatoren dem anderen überlegen, jedoch präferierte die
a b c d Deutsche Zusammenfassung 6
_____________________________________________________________________________

eine oder andere Feature-Repräsentation (verschiedene Skalierungen oder mit oder ohne
Histogramm-Anpassung). Nur die bereits erwähnte lange Rechenzeit des modellfreien Ansatzes
macht den Modellansatz, mit der logistischen Regression, die bessere Methode für diese
Prädiktionsaufgabe. Zusätzlich konnte gezeigt werden, dass einfachste
Bildnachverarbeitungsmethoden die Vorhersageergebnisse dramatisch verbessern können.
Nichtsdestotrotz deckte der daten-getriebene Ansatz auf, dass der Datenkorpus an sich die
nötige Information nicht beinhalten könnte, um diese Aufgabe robust und verlässlich
durchführen zu können. Weitere Arbeit muss in Zukunft in die Ableitung des Modells gesteckt
werden, um die Perfusionsparameter zu bestimmen, aber die wichtigste Verbesserung muss bei
den Messmethoden der Gehirndurchblutung passieren.
Für Kliniker ist es wichtig zu wissen, dass sowohl das pw- als auch das dw-MRT wichtige
Werkzeuge für die frühe Diagnose des ischämischen Schlaganfalls sind. Aber wenn diese Daten
im Zusammenhang mit der Prädiktion des Schlaganfallausganges genutzt werden, sind diese
Messungen inakkurat entweder aufgrund zu niedriger Bildauflösung (für die pw-MRI beträgt die
Schichtdicke ca. 5 mm, was zu großen Problemen mit dem Partialvolumen führt) oder der
indirekten Messung der gewünschten Parameter. Für eine größere Genauigkeit müsste man
länger messen, doch auch neue Methoden für die Messung der Hirndurchblutung wären von
großem Nutzen.

Diskussion und Ausblick
Zwei daten-getriebene Evaluationen mit dem Hintergrund der Mustererkennung wurden im
Rahmen dieser Doktorarbeit exploriert. In der ersten Anwendung, der Klassifikation von
HARDI-Daten in sechs Bildklassen, konnte eine hohe Klassifikationsgenauigkeit erzielt werden.
Der Hauptgrund für diese gute Leistung waren die räumlich gut aufgelösten, aber auch die gut
aufgelösten Daten bezüglich der hohen Anzahl an gemessenen Diffusionsrichtungen der
HARDI-Messung. Außerdem waren alle Klassen gut balanciert, was eine leichtere
Differenzierung zwischen den Klassen mit der SVM ermöglichte. Aufgrund der Fähigkeit dieses
Ansatzes die Strukturen der weißen Substanz zu differenzieren, wäre eine vielversprechende
Erweiterung dieser Anwendung die Klassifizierung von verschiedenen Stadien der Läsionen bei
Mutiple Sklerose (MS) mit Hilfe HARDI-Daten und anderen Modalitäten. Auch die Vorhersage
des Verlaufs bestimmter Läsionen wäre eine denkbare Anwendung.

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.