Le lexique-grammaire de M. Gross et le traitement automatique des ...
4 pages
Français

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Le lexique-grammaire de M. Gross et le traitement automatique des ...

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
4 pages
Français
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Le lexique-grammaire de M. Gross et le traitement automatique des ...

Informations

Publié par
Nombre de lectures 196
Langue Français

Extrait

Le lexiquegrammaire de M. Gross et le traitement automatique des langues
Claire Gardent, Bruno Guillaume, Ingrid Falk, Guy Perrier
LORIA & ATILF, Nancy {Claire.Gardent , Bruno.Guillaume, Ingrid.Falk, Guy.Perrier}@loria.fr R´esume´ Nousproposonslesgrandeslignesdunem´ethodedetraductiondulexiquegrammairedeMauriceGrossdansunformatappropri´eaux syst`emesdetraitementautomatiquedeslangues.
1. Lelexiquegrammaire de Maurice Gross Une large part des travaux en syntaxe se concentre surlidenticationetlaformalisationder`eglesg´ene´rales sappliquanta`uneclasse´etenduedemots.Typiquement, lesre`glesdetransformationdeChomskyd´ecriventdes relations syste´matiques entre les diverses structures syn taxiques. Mais, comme Chomsky luimeˆme le remar quait(Cho65),cesg´en´eralisationssontsujettes`adefortes ´ contraintes lexicales. Etant donne´ un mot particulier, la questionseposedesavoirsiunege´n´eralisationdonn´ee s’applique a` ce mot. En d’autres termes, la description compl`etedelasyntaxedunelangueimpliquenonseulement l’identification de re`gles ge´ne´rales mais aussi la de´termination de quel mot exige, autorise ou interdit l’ap plicationdequeller`egle.Cestcequacherche´`afairepour lefranc¸aisMauriceGross`atraverslelexiquegrammaire (Gro75). Le lexiquegrammaire de Maurice Gross est une descriptionsyst´ematiquedespropri´ete´ssyntaxiqueset s´emantiquesdesfoncteurssyntaxiquesdufran¸cais,cesta`direlesverbes,lesnomspr´edicatifsetlesadjectifs.Ilest organise´ en groupes de tables, chaque groupe e´tant associe´ a`unecate´goriesyntaxiquedonn´ee(verbespleins,verbes supports, noms, etc.). Au sein d’un groupe, une table cor respond a` une ou deux constructions syntaxiques parti culie`res et rassemble tous les mots qui entrent dans cette ou ces constructions. Par exemple, la table 1 des verbes contient tous les verbes qui admettent en plus d’un su jet un comple´ment infinitif mais pas un comple´ment qui soitunecompl´etivenieouunnom.Unetableestdivis´ee en lignes selon les mots qu’elle contient et en colonnes selonlespropri´et´essyntaxiquesous´emantiquesquisappliquent`acesmotsetleursarguments.Alintersection d’une ligne et d’une colonne, un signe + ou – indique que laproprie´t´eindiqu´eeenenteˆtedelacolonnesapplique positivementoun´egativementaumotplac´eenentˆetede laligne.Cetteproprie´t´eestsoitunajoutdinformationsur le mot ou un de ses arguments, soit une transformation du cadredesouscat´egorisationdebaseassoci´e`alatable. Actuellement, le lexiquegrammaire est surtout de´veloppe´ pour les verbes et les locutions pre´dicatives.
NousremercionsEricLaporteetl´equipedinformatique linguistiquedelIGMdavoirmis`anotredispositionsousun format e´lectronique certaines tables du LADL. Nous remercions aussi la Re´gion Lorraine et les e´tablissements publics qui fi nancent le Contrat de Plan Etat Re´gion dans lequel s’inscrit le travailderecherchepre´sent´edanscepapier.
Pour ce qu’on appelle les verbes simples, 5000 d’entre euxonte´te´d´ecritssuruntotalde15000enusage (Gro75; BGL76a; BGL76b). En outre, 25 000 locu tionspr´edicativesonte´te´de´critesdemˆemeque20000 locutions construites aveceˆtreouavoir(Gro89).
2. Lexiquese´lectroniques et traitement automatique des langues Larobustesseetlapr´ecisiondessyste`mesTALreposent entre autres sur l’acquisition des connaissances lin guistiques et extralinguistiques pertinentes. Dans cette section, nous identifions deux types de connaissances pre´sentes dans le lexiquegrammaire qui sont parti culi`erementpertinentespourleTAL:linformationsurla souscat´egorisationetlinformationsurlesalternances.
2.1.souscat´egorisation Le lexiquegrammaire contient des informations de´taill´eesetexhaustivessurlasouscat´egorisationdes foncteurs syntaxiques, c’esta`dire sur le nombre et le type de leurs arguments. Ainsi par exemple, les tables du LADL incluent pour chaque emploi verbal : – unou plusieurs cadres de souscate´gorisation sous la forme d’une liste d’arguments, pourchaquecadredesouscat´egorisation,uneinformationmorphos´emanticosyntaxiquesurlesarguments et sur le verbe qui inclura par exemple : – pourle verbe, une information sur son type (verbe normal, verbe U de Harris), sur l’auxiliaire uti lise´ pour construire les temps compose´s (eˆtre ou avoir), sur les contraintes de concordance des temps portant sur les arguments verbaux, etc ; – pour les arguments nominaux, une information surlecaract`erehumainounondure´f´erent, sur le nombre, sur la pronominalisation, sur les d´eterminantspermis,etc; – pourles arguments pre´positionnels, une informa tion sur le type (e.g., locatif) et sur la valeur de la pre´positionutilis´ee; – pourles arguments phrastiques, une information sur le mode (indicatif, infinitif, subjonctif), sur la structuredecontrˆole(parlesujet,lobjet),surles verbes admis, etc. Orlinformationsurlasouscat´egorisationestune composanteessentielledunsyst`emedeTAL.Plus spe´cifiquement, (Gar05) re´capitule un certain nombre de r´esultatsr´ecentsmontrantquuneinformationneetexhaustive sur la souscate´gorisation permet d’une part,
  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents