Université Michel de Montaigne Bordeaux 3 Unité Mixte de Recherche 5263 CLLE-ERSSAB
SÉMINAIRE DE LINGUISTIQUE « Approche statistique des phénomènes d’ordre en français : la position de l’adjectif épithète et l’ordre des compléments ...
Université Michel de Montaigne Bordeaux 3
Unité Mixte de Recherche 5263 CLLE-ERSSAB
SÉMINAIRE DE LINGUISTIQUE
« Approche statistique des phénomènes d’ordre en français :
la position de l’adjectif épithète et l’ordre des compléments verbaux »
LUNDI 4 AVRIL 2011, 15 h
Maison des Sciences de l’Homme d’Aquitaine, salle 3
Nous présenterons une analyse statistique de données syntaxiques qui a pour but de mieux
comprendre certains phénomènes d’ordre des mots en français. Il s’agit de reprendre des
généralisations linguistiques que l’on trouve dans la littérature et de les confronter à des
données de corpus à l’aide d’outils statistiques.
Dans un premier temps, nous exposerons un travail sur la position de l’adjectif épithète par
rapport au nom. Il s’agit d’un travail sur des données extraites des corpus du French Tree
Bank (FTB) et de l’Est-Républicain, pour lesquelles nous disposons d’informations sur les
principaux facteurs syntaxiques et lexicaux que l’on trouve dans la littérature (Abeillé et
Godard, 1999). À partir de ces données annotées, nous présenterons une modélisation du
phénomène qui s’appuie sur une méthode statistique utilisée notamment par Bresnan et al.
(2007) pour la modélisation de l’alternance dative en anglais. Cette méthode permet
notamment de caractériser formellement l’importance relative de contraintes qui interviennent
dans le phénomène.
Dans un deuxième temps, nous présenterons un travail en cours qui porte sur l’ordre des
compléments verbaux dans la zone postverbale (Abeillé et Godard 2000, Wasow 2002,
Bresnan et al. 2007). Ce travail repose sur des données extraites de corpus (FTB, Est-
Républicain et ESTER) qui sont annotées ou en cours d’annotation pour des facteurs tels que
la longueur relative des compléments, la classe sémantique du verbe selon le dictionnaire LVF
(Dubois et Dubois-Charlier 1997), la caractère donné ou nouveau de l’information portée par
un constituant... Nous exposerons les données dont nous disposons ainsi que les premiers
éléments d’analyse.
Ce séminaire sera présenté par Juliette Thuilier et Benoît Crabbé (Alpage/INRIA et
université Paris 7).
Il est le troisième du cycle de séminaire de linguistique 2011 (organisé par l’équipe de
recherche « Cognition, langues, langages, ergonomie et recherche en syntaxe et sémantique à
Bordeaux » - CLLE-ERSSAB) qui a pour thème cette année « règles, régularité,
régularisation, régulation ».
Contact : Frédéric Lambert (frederic.lambert@u-bordeaux3.fr)