A finite-state approach to shallow parsing and grammatical functions annotation of German [Elektronische Ressource] / von Frank Henrik Müller

A Finite-State Approach to Shallow ParsingandGrammatical Functions Annotation of GermanvonFrank Henrik Mu¨llerPhilosophische Dissertationangenommen von der Neuphilologischen Fakult¨atder Universit¨at Tu¨bingenam 16. Februar 2005Berlin2007Hauptberichterstatter: Prof. Dr. Erhard W. HinrichsMitberichterstatterin: PD Dr. Anette FrankDekan: Prof. Dr. Joachim KnapeDanksagungIch danke allen, ohnedie diese Arbeit nicht m¨oglich gewesen w¨are. Daistzun¨achst mal mein Betreuer Erhard Hinrichs, der mich mit einem komfort-ablen Stipendium ausgestattet hat und dann sp¨ater im SFB 441 eingestellthat. Bei meiner Arbeit hat er mir zur rechten Zeit Freiheit gelassen und zurrechten ZeitDruck gemacht. Vorallem hater sich die Zeit genommen, Kapi-tel fu¨r Kapitel meiner Arbeit mit mir durchzugehen, sonst h¨atte sie nicht soeine gute Struktur. Und was dann noch durch die Lappen gegangen ist, hatdie Zweitgutachterin Anette Frank akribisch angemerkt. Tats¨achlich h¨atteich mit ihren Anregungen genug Themen fu¨r eine Habilitation gehabt, aberdas steht auf einem anderen Blatt. Mit dabei beim Promotionskolloquiumwaren dann noch Frank Richter und Irene Rapp als Mitberichterstatter undKlaus-Peter Philippi als Vorsitzender des Promotionsausschusses. Auch ih-nen gebu¨hrt ein Dank fu¨r ihre Mu¨he.UnddannsinddajanochdieliebenKollegen,diemirimmerbeigestandenhaben und manchmal sicher auch ganz sch¨on was ertragen haben.
Publié le : lundi 1 janvier 2007
Lecture(s) : 30
Tags :
Source : TOBIAS-LIB.UB.UNI-TUEBINGEN.DE/VOLLTEXTE/2007/2758/PDF/DISS.PDF
Nombre de pages : 423
Voir plus Voir moins

A Finite-State Approach to Shallow Parsing
and
Grammatical Functions Annotation of German
von
Frank Henrik Mu¨ller
Philosophische Dissertation
angenommen von der Neuphilologischen Fakult¨at
der Universit¨at Tu¨bingen
am 16. Februar 2005
Berlin
2007Hauptberichterstatter: Prof. Dr. Erhard W. Hinrichs
Mitberichterstatterin: PD Dr. Anette Frank
Dekan: Prof. Dr. Joachim KnapeDanksagung
Ich danke allen, ohnedie diese Arbeit nicht m¨oglich gewesen w¨are. Daist
zun¨achst mal mein Betreuer Erhard Hinrichs, der mich mit einem komfort-
ablen Stipendium ausgestattet hat und dann sp¨ater im SFB 441 eingestellt
hat. Bei meiner Arbeit hat er mir zur rechten Zeit Freiheit gelassen und zur
rechten ZeitDruck gemacht. Vorallem hater sich die Zeit genommen, Kapi-
tel fu¨r Kapitel meiner Arbeit mit mir durchzugehen, sonst h¨atte sie nicht so
eine gute Struktur. Und was dann noch durch die Lappen gegangen ist, hat
die Zweitgutachterin Anette Frank akribisch angemerkt. Tats¨achlich h¨atte
ich mit ihren Anregungen genug Themen fu¨r eine Habilitation gehabt, aber
das steht auf einem anderen Blatt. Mit dabei beim Promotionskolloquium
waren dann noch Frank Richter und Irene Rapp als Mitberichterstatter und
Klaus-Peter Philippi als Vorsitzender des Promotionsausschusses. Auch ih-
nen gebu¨hrt ein Dank fu¨r ihre Mu¨he.
UnddannsinddajanochdieliebenKollegen,diemirimmerbeigestanden
haben und manchmal sicher auch ganz sch¨on was ertragen haben. Allen
voranistTylmanUlezunennen, beidessen Hilfeichambestengarnichterst
anfange aufzuz¨ahlen, da es kein Ende nehmen wu¨rde. Nur die mindestens
2500 Cappuccino, die er mir gemacht hat, will ich hier nicht unerw¨ahnt
lassen. Fu¨nfJahrejedenTagzehnbiszw¨olfStundenineinemBu¨rozusitzen,
pr¨agen sicher. Immer um Rat fragen durfte ich auch Sandra Ku¨bler, was ich
auch gerne in Anspruch genommen habe. Herzlich gedankt sei auch Heike
Telljohann, wo immer sie grad ist, fu¨r die interessanten Diskussionen u¨ber
die deutsche Syntax. Und nicht vergessen will ich meine beiden Kollegen
Holger Wunsch und Piklu Gupta, die dann sp¨ater noch dazukamen.
Aber angestoßen hat das Ganze natu¨rlich die liebe Familie, ohne die ich
ja nicht w¨are, was ich bin. W¨are ich nicht in einem so anregenden Um-
feld groß geworden, h¨atte ich sicher nicht studiert und promoviert. Und so
bedanke ich mich bei meinen Eltern fu¨r die jahrelange moralische und fi-
nanzielle Unterstu¨tzung und fu¨r ihr Verst¨andnis dafu¨r, dass ich selten den
langen Weg nach Mu¨nster nehmen konnte. Meiner Schwester Stefanie danke
ich stellvertrend fu¨r alle Steuerzahler, die mein Studium finanziert haben,
ohne selbst je studiert zu haben. Und nicht zuletzt danke ich auch meinen
Großmu¨ttern Gertrud Mu¨ller, Anna Hakenes und Mia Robering fu¨r ihre
ideelle und finanzielle Unterstu¨tzung meines Studiums.Und so ganz nebenbei habe ich mich im wundersch¨onen Tu¨bingen auch
sehr wohl gefu¨hlt und denke gerne daran zuru¨ck. Daran haben natu¨rlich
auch die vielen Freundschaften Anteil, die ich dort geknu¨pft habe. Neben
meinen lieben Kollegen w¨are hier im Bu¨ndel insbesondere meine englische
Theatergruppe, dieProvisional Players, zu nennen. Danke. Those were
the best days of my life.Contents
1 Introduction 1
1.1 Initial Problem . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Parsing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Main Issues of this Thesis . . . . . . . . . . . . . . . . . . . . 3
1.4 Reader’s Guide and Overview of the Parser . . . . . . . . . . . 5
2 A Rule-Based Finite-State Parser for German 9
2.1 FSAs as a Parsing Model . . . . . . . . . . . . . . . . . . . . . 9
2.2 Parsing German with Hand-crafted Rules . . . . . . . . . . . . 17
2.3 Basic Principles of the Parser . . . . . . . . . . . . . . . . . . 21
2.3.1 Robustness . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.2 Modularity of Annotation Components . . . . . . . . . 26
2.3.3 Underspecification . . . . . . . . . . . . . . . . . . . . 31
2.4 The fsgmatch Annotation Tool . . . . . . . . . . . . . . . . . . 37
3 Related Work 49
3.1 General Remarks . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.2 Shallow Parsing . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.2.1 Finite-State Approaches and Shallow Parsing . . . . . 50
3.2.2 Braun (1999); Neumann, Braun, and Piskorski (2000);
Neumann and Piskorski (2002) . . . . . . . . . . . . . 52
3.2.3 Wauschkuhn (1996) . . . . . . . . . . . . . . . . . . . . 53
3.2.4 Schiehlen (2002, 2003a,b) . . . . . . . . . . . . . . . . 54
3.2.5 Kermes and Evert (2002, 2003) . . . . . . . . . . . . . 55
3.2.6 Trushkina (2004) . . . . . . . . . . . . . . . . . . . . . 56
3.2.7 Schmid and Schulte im Walde (2000) . . . . . . . . . . 57
3.2.8 Becker and Frank (2002) . . . . . . . . . . . . . . . . . 59
3.2.9 Klatt (2004a,b) . . . . . . . . . . . . . . . . . . . . . . 60
I3.2.10 Brants (1999) . . . . . . . . . . . . . . . . . . . . . . . 61
3.2.11 Summary . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.3 Grammatical Functions Annotation . . . . . . . . . . . . . . . 62
3.3.1 Finite-State Approaches and GF Annotation . . . . . . 62
3.3.2 Schiehlen (2003a,b) . . . . . . . . . . . . . . . . . . . . 63
3.3.3 Trushkina (2004) . . . . . . . . . . . . . . . . . . . . . 64
3.3.4 Schmid and Schulte im Walde (2000) . . . . . . . . . . 65
3.3.5 Ku¨bler (2004a,b) . . . . . . . . . . . . . . . . . . . . . 66
3.3.6 Summary . . . . . . . . . . . . . . . . . . . . . . . . . 67
I Annotating Shallow Structures 71
4 Shallow Annotation Structures 73
4.1 The Nature and Right-of-Existence of Shallow Parsing . . . . 73
4.2 Definition of Shallow Structures . . . . . . . . . . . . . . . . . 93
4.2.1 Chunks . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.2.2 Topological Fields . . . . . . . . . . . . . . . . . . . . . 108
4.2.3 Clauses . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5 Annotating Shallow Structures with FSAs 123
5.1 Outline of the Task Description . . . . . . . . . . . . . . . . . 123
5.2 Easy-First-Parsing and a Divide-and-Conquer Strategy . . . . 125
5.3 Correcting Tags by Using Topological Field Information. . . . 133
5.4 Handling Recursion by Iterating FSAs . . . . . . . . . . . . . 140
5.5 Annotating Chunks Top-down . . . . . . . . . . . . . . . . . . 147
6 Annotating Complex Chunks 159
6.1 Task Description and Motivation . . . . . . . . . . . . . . . . 159
6.2 Appositions and Named Entities . . . . . . . . . . . . . . . . . 161
6.3 Annotation of Appositional Constructions . . . . . . . . . . . 163
6.4 Annotation of Named Entities . . . . . . . . . . . . . . . . . . 168
6.5 Annotation of Other Complex Chunks . . . . . . . . . . . . . 169
II Annotating Grammatical Functions 173
7 Annotating Deeper Structures – Grammatical Functions 175
7.1 Outline of the Task Description . . . . . . . . . . . . . . . . . 175
II

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.