Acquisition du tchèque par les francophones : analyse ...
356 pages
Français

Acquisition du tchèque par les francophones : analyse ...

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
356 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

Institut National des Langues et Civilisations Orientales
LALIC–CERTAL
Laboratoire Langages, Logiques, Informatique, Cognition
Centre d’Études et de Recherche en Traitement Automatique des Langues
&
Univerzita Karlova v Praze
Filozofická fakulta
ˇÚstav teoretické a komputacní lingvistiky
IVAN ŠMILAUER
Acquisition du tchèque par les francophones : analyse
automatique des erreurs de déclinaison
Thèse de doctorat
études tchèques, option traitement automatique des langues
filologie, matematická lingvistika
Directeurs :
Prof. PhDr. Eva Hajicoˇ vá, DrSc. Prof. PhDr. Patrice Pognan, DrSc.
2008 Cette thèse a été réalisée dans le cadre d’une co-tutelle de doctorat entre l’Institut Natio-
nal des Langues et Civilisations Orientales, Paris (France) et l’Université Charles de Prague
(République tchèque).
La thèse a été soutenue le 29 novembre 2008 avec la mention : très honorable avec les
félicitations du jury.
Jury
Thomas Szende, INALCO, Paris (président du jury)
ˇMilan Hrdlicka, Filozofická fakulta, Univerzita Karlova, Praha (rapporteur)
Sylviane Cardey-Greenfield, Faculté des Lettres et Sciences Humaines, Université de Franche
Comté, Besançon (rapporteur)
Jarmila Panevová, Matematicko-fyzikální fakulta, Univerzita Karlova, Praha (membre du
jury)
Patrice Pognan, INALCO, Paris (directeur de recherche)
Eva Hajicoˇ vá, Filozofická fakulta, Univerzita Karlova, Praha (directeur de recherche)
Remerciements
Je voudrais remercier très chaleureusement les deux directeurs de ma thèse, Eva ...

Sujets

Informations

Publié par
Nombre de lectures 261
Langue Français
Poids de l'ouvrage 4 Mo

Exrait

Institut National des Langues et Civilisations Orientales LALIC–CERTAL Laboratoire Langages, Logiques, Informatique, Cognition Centre d’Études et de Recherche en Traitement Automatique des Langues & Univerzita Karlova v Praze Filozofická fakulta ˇÚstav teoretické a komputacní lingvistiky IVAN ŠMILAUER Acquisition du tchèque par les francophones : analyse automatique des erreurs de déclinaison Thèse de doctorat études tchèques, option traitement automatique des langues filologie, matematická lingvistika Directeurs : Prof. PhDr. Eva Hajicoˇ vá, DrSc. Prof. PhDr. Patrice Pognan, DrSc. 2008 Cette thèse a été réalisée dans le cadre d’une co-tutelle de doctorat entre l’Institut Natio- nal des Langues et Civilisations Orientales, Paris (France) et l’Université Charles de Prague (République tchèque). La thèse a été soutenue le 29 novembre 2008 avec la mention : très honorable avec les félicitations du jury. Jury Thomas Szende, INALCO, Paris (président du jury) ˇMilan Hrdlicka, Filozofická fakulta, Univerzita Karlova, Praha (rapporteur) Sylviane Cardey-Greenfield, Faculté des Lettres et Sciences Humaines, Université de Franche Comté, Besançon (rapporteur) Jarmila Panevová, Matematicko-fyzikální fakulta, Univerzita Karlova, Praha (membre du jury) Patrice Pognan, INALCO, Paris (directeur de recherche) Eva Hajicoˇ vá, Filozofická fakulta, Univerzita Karlova, Praha (directeur de recherche) Remerciements Je voudrais remercier très chaleureusement les deux directeurs de ma thèse, Eva Ha- jicoˇ vá et Patrice Pognan, pour leur accueil, leurs conseils, leur soutien, le temps qu’ils m’ont consacré et leur confiance en mon travail. Je remercie Mme Sylviane Cardey et M. Milan Hrdlickaˇ d’avoir accepté d’être rappor- teur de ma thèse. Je suis reconnaissant à Marie-Anne Moreaux et Serge Fleury pour leur enseignement en traitement automatique des langues et pour leur aide. Je voudrais également remercier ˇFrantišek Cermák, Jarmila Panevová et Vladimír Petkevic,ˇ avec qui j’ai eu l’occasion de parler de mon travail. Merci à Colette et Francis Vandevelde ainsi qu’à Philippe Gontier pour leur accueil pendant la rédaction de ce travail. Enfin, merci à Nicolas Aubry, Olivier Bondeelle, Harold Friedman, Paul Grundy et Martin Svášek. Merci à Marlène pour tout. Dekujiˇ svým rodicˇum˚ za jejich lásku a podporu. Table des matières 1 Introduction 1 2 Cadre méthodologique 5 2.1 Tchèque langue étrangère . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.1.1 Besoin d’une méthodologie du TLE . . . . . . . . . . . . . . . . . 6 2.1.2 Recherche sur le TLE - des cas concrets . . . . . . . . . . . . . . . 7 2.1.3 Présentation didactique de la déclinaison du tchèque . . . . . . . . 9 2.2 Acquisition d’une langue étrangère . . . . . . . . . . . . . . . . . . . . . . 11 2.2.1 Revue de la discipline . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.2.2 Sources de données . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.3 Enseignement des langues assisté par ordinateur . . . . . . . . . . . . . . . 19 2.3.1 Traitement automatique des langues dans ELAO . . . . . . . . . . . 20 2.3.2 Correction et diagnostic des erreurs . . . . . . . . . . . . . . . . . 21 2.4 Plateforme CETLEF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.4.1 Présentation générale de CETLEF . . . . . . . . . . . . . . . . . . 23 2.4.2 des notions et des termes employés . . . . . . . . . . . 24 3 Annotation morphologique 31 3.1 Préliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.1.1 Introduction à la déclinaison du tchèque . . . . . . . . . . . . . . . 31 3.1.2 Utilité de l’annotation linguistique . . . . . . . . . . . . . . . . . . 34 3.1.3 Couverture de l’annotation . . . . . . . . . . . . . . . . . . . . . . 36 3.1.4 Morphologie automatique . . . . . . . . . . . . . . . . . . . . . . 43 3.1.5 Modèle de la déclinaison dans CETLEF . . . . . . . . . . . . . . . 46 3.2 Catégories lexicales et types morphologiques . . . . . . . . . . . . . . . . 47 3.3 morphologiques . . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.3.1 Catégorie de cas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.3.2 de nombre . . . . . . . . . . . . . . . . . . . . . . . . . 53 3.3.3 Catégorie de genre . . . . . . . . . . . . . . . . . . . . . . . . . . 53 3.4 Paradigmes de déclinaison . . . . . . . . . . . . . . . . . . . . . . . . . . 56 i 3.4.1 Définition des paradigmes . . . . . . . . . . . . . . . . . . . . . . 56 3.4.2 Fichier pdgm.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3.4.3 Déclinaison nominale . . . . . . . . . . . . . . . . . . . . . . . . . 69 3.4.4 adjectivale . . . . . . . . . . . . . . . . . . . . . . . . 78 3.4.5 Déclinaison mixte . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 3.4.6 pronominale . . . . . . . . . . . . . . . . . . . . . . . 79 3.4.7 Déclinaison numérale . . . . . . . . . . . . . . . . . . . . . . . . . 80 3.4.8 Fréquence des types paradigmatiques . . . . . . . . . . . . . . . . 80 3.5 Alternances . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 3.5.1 Sens de l’alternance . . . . . . . . . . . . . . . . . . . . . . . . . . 83 3.5.2 Vérification de la réalisation des alternances . . . . . . . . . . . . . 83 3.5.3 Alternances consonantiques . . . . . . . . . . . . . . . . . . . . . 85 3.5.4 vocaliques . . . . . . . . . . . . . . . . . . . . . . . . 88 3.5.5 Fichier alt.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 3.6 Procédure AlterneRadical . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 3.6.1 Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 3.6.2 Tests algorithmiques des alternances . . . . . . . . . . . . . . . . . 105 3.7 Procédure Annote . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 3.7.1 Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 3.7.2 Annotation des lemmes connus . . . . . . . . . . . . . . . . . . . . 113 3.7.3 des inconnus . . . . . . . . . . . . . . . . . . . 115 4 Diagnostic des erreurs 117 4.1 Hypothèses sur les erreurs de déclinaison . . . . . . . . . . . . . . . . . . . 117 4.2 Définition des types d’erreurs . . . . . . . . . . . . . . . . . . . . . . . . . 120 4.2.1 Définition de l’univers U . . . . . . . . . . . . . . . . . . . . . . . 120 4.2.2 Forme requise et production erronée dans U . . . . . . . . . . . . . 122 4.2.3 Interprétation morphologique . . . . . . . . . . . . . . . . . . . . . 122 4.2.4 Attributs de graphie . . . . . . . . . . . . . . . . . . . . . . . . . . 123 4.2.5 Exemple d’interprétations . . . . . . . . . . . . . . . . . . . . . . 124 4.2.6 Erreur d’après l’attribut atteint . . . . . . . . . . . . . . . . . . . . 126 4.2.7 Erreur par rapport au paradigme de la forme requise . . . . . . . . . 127 4.2.8 Diagnostic morphologique d’une production erronée . . . . . . . . 135 4.2.9 Plausibilité d’une interprétation morphologique . . . . . . . . . . . 138 4.3 Procédure Diagnostic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 4.3.1 Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 4.3.2 Structure de la procédure . . . . . . . . . . . . . . . . . . . . . . . 141 ii 4.4 Message d’erreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 4.4.1 Attributerreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 4.4.2 Attributs morphologiques . . . . . . . . . . . . . . . . . . . . . . . 143 4.4.3 Attributspec . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 4.4.4 Attributs concernant les alternances . . . . . . . . . . . . . . . . . 145 4.4.5 Attributdia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 4.4.6 Attributvar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 4.4.7 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 4.5 Traitement non morphologique . . . . . . . . . . . . . . . . . . . . . . . . 147 4.5.1 Tests sur les caractères . . . . . . . . . . . . . . . . . . . . . . . . 148 4.5.2 Tests sur les chaînes . . . . . . . . . . . . . . . . . . . . . . . . . . 148 4.6 Traitement morphologique . . . . . . . . . . . . . . . . . . . . . . . . . . 150 4.6.1 Lecture locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 4.6.2 verticale . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 4.6.3 Lecture horizontale interne . . . . . . . . . . . . . . . . . . . . . . 151 4.6.4 externe . . . . . . . . . . . . . . . . . . . . . . 151 4.6.5 Procédure AlterneHypothèse . . . . . . . . . . . . . . . . . . . . . 152 4.6.6 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 4.7 Filtrage des interprétations . . . . . . . . . . . . . . . . . . . . . . . . . . 156 4.7.1 Exemple du groupement des interprétations . . . . . . . . . . . . . 157 4.7.2 Filtrage des interprétations locales . . . . . . . . . . . . . . . . . . 157 4.7.3 des verticales . . . . . . . . . . . . . . . . . 158 4.7.4 Filtrage des interprétations horizontales internes . . . . . . . . . . . 161 4.7.5 des externes . . . . . . . . . . 161 4.7.6 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 4.8 Formatage du diagnostic . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 4.8.1 Composante 1 : Traduction des attributserreur etspec . . . . . . 164 4.8.2 2 : T des attributs concernant les alternances . 166 4.8.3 Composante 3 : Traduction des attributsdia etvar . . . . . . . . . 166 4.8.4 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 5 Évaluation 171 5.1 Enquête publique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 5.1.1 Présentation de l’enquête . . . . . . . . . . . . . . . . . . . . . . . 171 5.1.2 Caractéristique des apprenants et leurs scores . . . . . . . . . . . . 172 5.1.3 Présentation des erreurs recueillies . . . . . . . . . . . . . . . . . . 173 5.2 Enquête préliminaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186 iii 5.2.1 Présentation de l’enquête . . . . . . . . . . . . . . . . . . . . . . . 186 5.2.2 Caractéristique des apprenants et leurs scores . . . . . . . . . . . . 187 5.2.3 Présentation des erreurs recueillies . . . . . . . . . . . . . . . . . . 187 5.2.4 Comparaison avec l’enquête publique . . . . . . . . . . . . . . . . 189 5.2.5 Illustration d’une analyse d’erreurs par tâche . . . . . . . . . . . . 189 6 Implémentation 195 6.1 Application Web dynamique . . . . . . . . . . . . . . . . . . . . . . . . . 195 6.1.1 Techniques de programmation employées . . . . . . . . . . . . . . 196 6.1.2 Architecture de CETLEF . . . . . . . . . . . . . . . . . . . . . . . 197 6.2 Base de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 6.2.1 Rappels formels et définitions . . . . . . . . . . . . . . . . . . . . 198 6.2.2 Tables dans la base de donnéescetlef . . . . . . . . . . . . . . . 200 6.2.3 Tableapprenants . . . . . . . . . . . . . . . . . . . . . . . . . . 202 6.2.4 Tableexercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 6.2.5 Tabletaches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 6.2.6 Tablerequis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 6.2.7 Tablelexique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 6.2.8 Tableprod_exercices . . . . . . . . . . . . . . . . . . . . . . . 215 6.2.9 Tableprod_taches . . . . . . . . . . . . . . . . . . . . . . . . . . 217 6.2.10 Illustration des requêtes . . . . . . . . . . . . . . . . . . . . . . . . 220 6.3 Interface utilisateur CETLEF . . . . . . . . . . . . . . . . . . . . . . . . . 225 6.3.1 Plateforme auteur . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 6.3.2 apprenant . . . . . . . . . . . . . . . . . . . . . . . . . 228 7 Conclusion 237 A CETLEF Plateforme auteur 241 B CETLEF Plateforme apprenant 249 C Paradigmes 269 C.1 Flexion nominale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 C.2 Flexion adjectivale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 C.3 Flexion mixte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 C.4 Flexion pronominale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313 C.5 Flexion numérale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324 D Alternances 329 iv D.1 Alternances consonantiques . . . . . . . . . . . . . . . . . . . . . . . . . . 329 D.2 vocaliques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330 Bibliographie 335 v Chapitre 1 Introduction Objectif L’objectif de ce travail est d’effectuer une analyse des erreurs commises par les appre- nants francophones dans des exercices de déclinaison du tchèque. La description de ces er- reurs doit être formulée de manière à ce qu’elle puisse être utilisée dans un module de diag- nostic automatique travaillant par la comparaison d’une forme erronée avec la forme requise, au sein d’un exercice à trous. Ce diagnostic est implémenté sur une plateforme d’enseigne- ment de langue assisté par ordinateur et génère un message de retour aux apprenants sur leurs erreurs. Erreur de déclinaison La langue tchèque avec sa flexion nominale très riche – sept cas, quatre genres, un nombre important de types de déclinaison – offre un matériau intéressant du point de vue de l’acquisition de la morphologie. Une erreur de déclinaison se manifeste par un écart entre une ou plusieurs formes requises dans un certain contexte syntaxique et la forme erronée produite par l’apprenant. Pour exemple, voici trois erreurs de ce type produites par des ap- prenants au sein d’un exercice à trous : (1) *Anicceˇ bolí hlava. Anickuˇ acc.sg.f. Anne fait mal tête 1‘Anne a mal à la tête’ (1.175.24) 1Chaque production authentique citée dans ce travail sera accompagnée par son identifiant (en- quête.tâche.apprenant) dans la base de données contenant les erreurs, voir les détails dans le chapitre Implé- mentation, p. 195. 1
  • Accueil Accueil
  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • BD BD
  • Documents Documents