Apprentissage automatique d une distance d edition dediee a la reconnaissance de l ecriture manuscrite
6 pages
Français

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Apprentissage automatique d'une distance d'edition dediee a la reconnaissance de l'ecriture manuscrite

-

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
6 pages
Français
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Niveau: Secondaire, Lycée
Apprentissage automatique d'une distance d'edition dediee a la reconnaissance de l'ecriture manuscrite Sabine Carbonnel – Eric Anquetil IRISA, INSA Rennes Campus universitaire de Beaulieu Avenue de General Leclerc F-35 042 Rennes cedex fsabine.carbonnel, Resume : Ce travail s'inscrit dans le cadre d'un post- traitement lexical base a la fois sur une organisation struc- turee de dictionnaire (a partir de caracteristiques glo- bales des mots) et sur un algorithme d'appariement de mots specifique a l'ecriture manuscrite en-ligne (distance d'edition). L'objectif est de compenser les erreurs de re- connaissance et de segmentation en s'appuyant sur les in- formations lexicales extraites d'un dictionnaire. Pour cela nous avons adapte une distance d'edition a l'ecriture ma- nuscrite pour le post-traitement lexical en reconnaissance en-ligne de mots. Cet article presente une methode d'appren- tissage automatique de la distance d'edition. L'objectif est de pouvoir automatiquement specialiser la distance d'edition en fonction des proprietes du reconnaisseur. Les resultats experimentaux obtenus montrent que l'approche proposee pour adapter automatiquement la distance d'edition obtient d'aussi bons resultats qu'une distance d'edition calibree em- piriquement a la main de fac¸on longue et fastidieuse. Mots-cles : Reconnaissance d'ecriture manuscrite en- ligne, post-traitement lexical, apprentissage de la distance d'edition.

  • telephones mobiles des systemes de reconnaissance de lettres et de mots manuscrits

  • operations

  • post- traitement lexical

  • reconnaissance de l'ecriture manuscrite

  • hypotheses de reconnaissance

  • distance d'edition


Sujets

Informations

Publié par
Nombre de lectures 42
Langue Français

Extrait

Apprentissageautomatiqued'unedistanced'´editionde´die´ea`la reconnaissancedel'´ecrituremanuscrite ´ Sabine Carbonnel – Eric Anquetil
IRISA, INSA Rennes Campus universitaire de Beaulieu AvenuedeG´ene´ralLeclerc F-35 042 Rennes cedex { } sabine.carbonnel, eric.anquetil @irisa.fr Re´sum´e:Ce travail s'inscrit dans le cadre d'un post-nrse´etrisnaonececnaslesprobl`emess´pceiuqseercnno traitement lexical base´ a` la fois sur une organisation struc-imruxuee´siopse´'derutirceadap,desonsotaticne´tnode´la´tre tur´eededictionnaire(a`partirdecaracte´ristiquesglo-les prendre en compte. Les re´sultats obtenus sont meilleurs bales des mots) et sur un algorithme d'appariement detsetuaflisiamp´soleesuttoerimidit'de´oisnretalesssibonpo motsspe´cique`al'´ecrituremanuscriteen-ligne(distanceR0CAe[qu.3]leelamunipirtemeˆtulteusrscoec¸ondefa d'´edition).L'objectifestdecompenserleserreursdere-lcitraterpsuon,escanDoheduaotamituqe´esentonsunem´et connaissance et de segmentation en s'appuyant sur les in-n-rl'essuenniaerocseuddritrpseirpo´te´r´ouabetr`liarapp formations lexicales extraites d'un dictionnaire. Pour celascleueiqnsaiontiide´'dsnoitare´pdesombleseelrusˆotuqsiu nousavonsadapte´unedistanced'´edition`al'´ecriturema-sont associe´s. nuscrite pour le post-traitement lexical en reconnaissancese´eonntnontprussehpaviurapeargancciDuacnssslntmete en-lignedemots.Cetarticlepr´esenteunem´ethoded'appren-dere`emeaissconnERISnaecteudMFtolepicnirpstsysudse tissage automatique de la distance d' e´dition. L'objectif est dessoci´e.Nousintrdoiuossnstpora-temittlencixeuqlaiuliatse pouvoirautomatiquementspe´cialiserladistanced'´editiondans le paragraphe 3 la notion de distance d'´edition avant enfonctiondesproprie´t´esdureconnaisseur.Lesre´sultatsde proposer, dans le paragraphe 4 une me´thode d'apprentis-expe´rimentauxobtenusmontrentquel'approchepropos´eesage automatique de distance d'´edition. Dans le dernier pa-pouradapterautomatiquementladistanced'´editionobtientsenoetpxrgaarhpntettapermnemixuatxestre´pesr´taul´eosessl d'aussibonsr´esultatsqu'unedistanced'e´ditioncalibre´eem-de comparer la distance d'´edition re´sultant de l'apprentissage piriquementa`lamaindefa¸conlongueetfastidieuse.´esent´eavecunedatumotaqieurpeln´orabed´eeatsidecnde´'oiti fac¸on empirique. Mots-cle´s: Reconnaissance d'´ecriture manuscrite en-ligne, post-traitement lexical, apprentissage de la distance d'´edition.ntat´ese´en´iong2rPsudelareeme`tsy de reconnaissance et du post-traite-1 Introduction ment La communication par l'´ecrit et le geste graphique joue un roˆlepre´pond´erantdanslesnouvellestechnologiesassocie´es 2.1 Lesyste`me de reconnaissance de mots `al'informatiquemobile.Lesassistantspersonnels(PDA),les isole´s RESIFMot ordinateurstablettes(tablettePC)ouencoreleste´l´ephones mobiles de nouvelle ge´ne´ration (smartphones) axent leurs Le syste`me de reconnaissance de mots manuscrits en-ligne interfaceshommemachinesurdesmodalit´esd'interactions RESIFMot est base´ sur une approche analytique ou` les orient´eesstylet:l'utilisateurinteragitetcommuniqueavec motssontsegment´essuivantdiffe´renteshypoth`esesd'allo-1 la machine en e´crivant directement sur son e´cran. La qua-graphesdelettres[ANQ96,ANQ97b].Leshypoth`eses lit´edessyst`emesdereconnaissanced'´ecritureestun´ele´mentd'allographessontorganis´eesdansungraphedesegmen-cle´dansl'ergonomieassoci´ee`acetyped'interactions.Nous tationstructur´erepre´sentantl'ensembledessegmentations collaborons depuis plusieurs anne´es avec des industriels possibles (Figure 1). and'embarquersurdest´ele´phonesmobilesdessyst`emes Apre`s l'´etape de segmentation, une version adapte´e de de reconnaissance de lettres et de mots manuscrits isole´s RESIFCarestutilis´eepouridentierchaquehypoth`esed'al-(RESIFCar [ANQ 02] et RESIFMot [ANQ 97b]). lographe. Cette approche analytique engendre plusieurs hy-Dans cet article, nous nous focalisons sur l'´etude de poth`esesdereconnaissance(se´quencesd'allographesde l'int´egration de connaissances lexicales au syste`me lettres)quisontassoci´ees`adeuxtypesdeproble`mes:les RESIFMot (reconnaissance de mots manuscrits cursifs ambiguı¨t´esdesegmentationetlesconfusionsinter-lettresin-lie´s) [ANQ97b] ;plus particulie`rement sur la distance duites par la phase d'identification des allographes. d'´editionutilis´eelorsdupost-traitementlexical.Unedis-1 tance d'´edition classique ne permettant pas de re´soudrevariantes de styles dans une meˆme classe de lettre
  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents