169 pages
ADVANCED METHODSFOR ANALYSING AND MODELLINGMULTIVARIATE PALAEOCLIMATICTIME SERIESDISSERTATIONZUR ERLANGUNG DES AKADEMISCHEN GRADESDOKTOR DER NATURWISSENSCHAFTEN (DR. RER. NAT.)IN DER WISSENSCHAFTSDISZIPLINTHEORETISCHE PHYSIK / NICHTLINEARE DYNAMIKvorgelegt vonDIPL.-PHYS. REIK DONNERARBEITSGRUPPE NICHTLINEARE DYNAMIK¨INSTITUT FUR PHYSIK¨MATHEMATISCH-NATURWISSENSCHAFTLICHE FAKULTAT¨UNIVERSITAT POTSDAMJuni 2006KurzzusammenfassungDie Separation natur¨ licher und anthropogen verursachter Klima¨anderungen ist eine bedeutendeAufgabe der heutigen Klimaforschung. Hierzu ist eine detaillierte Kenntnis der natu¨rlichen Kli-mavariabilit¨at w¨ahrend Warmzeiten unerl¨asslich. Neben Modellsimulationen und historischenAufzeichnungen spielt hierfur¨ die Analyse von sogenannten Klima-Stellvertreterdaten einebesondere Rolle, die anhand von Archiven wie Baumringen oder Sediment- und Eisbohrkernenerhoben werden. Um solche Quellen pal¨aoklimatischer Informationen vernun¨ ftig interpretierenzu konnen,¨ werden geeignete statistische Modellierungsans¨atze sowie Methoden der Zeitreihen-analyse ben¨otigt, die insbesondere auf kurze, verrauschte und instationare¨ uni- und multivariateDatens¨atze anwendbar sind.Korrelationen zwischen verschiedenen Stellvertreterdaten eines oder mehrerer klimatologischerArchive enthalten wesentliche Informationen ber den Klimawandel auf großen Zeitskalen.


vorgelegt von
Juni 2006Kurzzusammenfassung
Die Separation natur¨ licher und anthropogen verursachter Klima¨anderungen ist eine bedeutende
Aufgabe der heutigen Klimaforschung. Hierzu ist eine detaillierte Kenntnis der natu¨rlichen Kli-
mavariabilit¨at w¨ahrend Warmzeiten unerl¨asslich. Neben Modellsimulationen und historischen
Aufzeichnungen spielt hierfur¨ die Analyse von sogenannten Klima-Stellvertreterdaten eine
besondere Rolle, die anhand von Archiven wie Baumringen oder Sediment- und Eisbohrkernen
erhoben werden. Um solche Quellen pal¨aoklimatischer Informationen vernun¨ ftig interpretieren
zu k¨onnen, werden geeignete statistische Modellierungsans¨atze sowie Methoden der Zeitreihen-
analyse ben¨otigt, die insbesondere auf kurze, verrauschte und instationare¨ uni- und multivariate
Datens¨atze anwendbar sind.
Korrelationen zwischen verschiedenen Stellvertreterdaten eines oder mehrerer klimatologischer
Archive enthalten wesentliche Informationen ber den Klimawandel auf großen Zeitskalen. Auf
der Basis einer geeigneten Zerlegung solcher multivariater Zeitreihen lassen sich Dimensionen
sch¨atzen als die Zahl der signifikanten, linear unabhangigen¨ Komponenten des Datensatzes.
Ein entsprechender Ansatz wird in der vorliegenden Arbeit vorgestellt, kritisch diskutiert und
im Hinblick auf die Analyse von pal¨aoklimatischen Zeitreihen weiterentwickelt. Zeitliche Vari-
ationen der entsprechenden Maße erlauben Ruc¨ kschlu¨sse auf klimatische Ver¨anderungen. Am
Beispiel von Elementh¨aufigkeiten und Korngr¨oßenverteilungen des Cape-Roberts-Gebietes in
der Ostantarktis wird gezeigt, dass die Variabilit¨at der Dimension der untersuchten Datens¨atze
¨klar mit dem Ubergang vom Oligoz¨an zum Miozan¨ vor etwa 24 Millionen Jahren sowie
regionalen Abschmelzereignissen korreliert.
Korngr¨oßenverteilungen in Sedimenten erlauben Ruc¨ kschlu¨sse auf die Dominanz verschiedener
Transport- und Ablagerungsmechanismen. Mit Hilfe von Finite-Mixture-Modellen lassen sich
gemessene Verteilungsfunktionen geeignet approximieren. Um die statistische Unsicherheit der
Parametersch¨atzung in solchen Modellen umfassend zu beschreiben, wird das Konzept der
¨asymptotischen Unsicherheitsverteilungen eingefu¨hrt. Der Zusammenhang mit dem Uberlapp
der einzelnen Komponenten sowie der aufgrund des Abschneidens und Binnens der gemesse-
wendung von Finite-Mixture-Modellen bestimmte Probleme auftreten, die eine umfassende kli-
matische Interpretation der Ergebnisse verhindern. Statt dessen wird eine lineare Hauptkompo-
nentenanalyse verwendet, um den Datensatz in geeignete Fraktionen zu zerlegen, deren zeitliche
Variabilit¨at stark mit den Schwankungen der mittleren Sonneneinstrahlung auf der Zeitskala
vonJahrtausendenbisJahrzehntausendenkorreliert. DieH¨aufigkeitvongrobk¨ornigemMaterial
h¨angt offenbar mit der j¨ahrlichen Schneebedeckung zusammen, w¨ahrend feinko¨rniges Material
m¨oglicherweise zu einem bestimmten Anteil durch Fruh¨ jahrsstu¨rme aus der Taklamakan-Wu¨ste
herantransportiert wird.Abstract
contemporary climate research. For this purpose, a detailed knowledge of the natural variability
of the climate during warm stages is a necessary prerequisite. Beside model simulations and
historical documents, this knowledge is mostly derived from analyses of so-called climatic proxy
data like tree rings or sediment as well as ice cores. In order to be able to appropriately
interpretsuchsourcesofpalaeoclimaticinformation, suitable approachesofstatisticalmodelling
as well as methods of time series analysis are necessary, which are applicable to short, noisy,
and non-stationary uni- and multivariate data sets.
Correlations between different climatic proxy data within one or more climatological archives
contain significant information about the climatic change on longer time scales. Based on an
appropriate statistical decomposition of such multivariate time series, one may estimate dimen-
sions in terms of the number of significant, linear independent components of the considered
data set. In the presented work, a corresponding approach is introduced, critically discussed,
and extended with respect to the analysis of palaeoclimatic time series. Temporal variations of
the resulting measures allow to derive information about climatic changes. For an example of
trace element abundances and grain-size distributions obtained near the Cape Roberts (Eastern
Antarctica), it is shown that the variability of the dimensions of the investigated data sets
clearly correlates with the Oligocene/Miocene transition about 24 million years before present
as well as regional deglaciation events.
Grain-size distributions in sediments give information about the predominance of different
transportation as well as deposition mechanisms. Finite mixture models may be used to
approximate the corresponding distribution functions appropriately. In order to give a complete
description of the statistical uncertainty of the parameter estimates in such models, the concept
of asymptotic uncertainty distributions is introduced. The relationship with the mutual
component overlap as well as with the information missing due to grouping and truncation of
the measured data is discussed for a particular geological example.
An analysis of a sequence of grain-size distributions obtained in Lake Baikal reveals that there
are certain problems accompanying the application of finite mixture models, which cause an
extended climatological interpretation of the results to fail. As an appropriate alternative, a
linear principal component analysis is used to decompose the data set into suitable fractions
whose temporal variability correlates well with the variations of the average solar insolation on
millenial to multi-millenial time scales. The abundance of coarse-grained material is obviously
relatedtotheannualsnowcover, whereasasignificantfractionoffine-grainedsedimentsislikely
transported from the Taklamakan desert via dust storms in the spring season.Contents
Introduction 1
1 Time Series Analysis in Palaeoclimatology 3
1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Linear Time Series Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Nonlinear Time Series Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4 Typical Problems in Palaeoclimatic Data Analysis . . . . . . . . . . . . . . . . . 8
1.5 Wavelet Analysis in Palaeoclimatology: A Univariate Example . . . . . . . . . . 10
1.6 Correlations in and between Palaeoclimate Records . . . . . . . . . . . . . . . . . 13
1.7 Climate Records: Correlation or Synchronisation ? . . . . . . . . . . . . . . . . . 17
2 Statistical Modelling of Finite Mixture Distributions 21
2.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2 The Expectation-Maximisation (EM) Algorithm . . . . . . . . . . . . . . . . . . 22
2.2.1 Likelihood Functions and Maximum Likelihood Principle . . . . . . . . . 23
2.2.2 Expectation-Maximisation Algorithm: The Basic Idea . . . . . . . . . . . 24
2.2.3 Parameter Estimation in Finite Mixture Models . . . . . . . . . . . . . . 24
2.3 Parameter Estimation for Grouped and Truncated Data . . . . . . . . . . . . . . 26
2.3.1 The Problem of Truncation . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.2 Likelihood Functions for Grouped Non-Truncated Data . . . . . . . . . . 28
2.3.3 Likelihood Functions for Grouped Truncated Data . . . . . . . . . . . . . 30
2.3.4 The EM Algorithm for Grouped Truncated Data . . . . . . . . . . . . . . 32
2.3.5 Parameter Estimation in Finite Mixture Models . . . . . . . . . . . . . . 33
2.3.6 Related and Concurring Approaches . . . . . . . . . . . . . . . . . . . . . 35
2.4 Estimation of Parameter Uncertainty . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4.1 Information-based Standard Errors . . . . . . . . . . . . . . . . . . . . . . 35
2.4.2 Resampling-based Standard Errors . . . . . . . . . . . . . . . . . . . . . . 37
2.4.3 A Numerical Example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.4.4 Uncertainty Distributions and their Asymptotic Behaviour . . . . . . . . 40
2.4.5 Application: Grain-Size Distributions from Lake Baikal Sediments . . . . 43
2.5 Open Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.5.1 Uniqueness and Convergence . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.5.2 Model Validation . . . . . . . . . . . . . . . . .

