La lecture à portée de main
Description
Sujets
Informations
Publié par | dumas_ccsd |
Nombre de lectures | 38 |
Langue | Français |
Poids de l'ouvrage | 1 Mo |
Extrait
Adaptation des techniques de
Text Mining aux données
conversationnelles issues de
l'oral
Nom : DANESI
Prénom : Charlotte
UFR des Sciences du Langage
Mémoire de master 2 professionnel – 20 ECTS
Mention : Sciences du Langage
Spécialité : Modélisation et traitements en industries de la langue : parole écrit apprentissage
Parcours :Traitement automatique de la langue et de la parole (TALEP)
Sous la direction de Monsieur Thomas Lebarbé
Année universitaire 2009-2010
dumas-00567888, version 1 - 22 Feb 2011
2
dumas-00567888, version 1 - 22 Feb 2011
Adaptation des techniques de
Text Mining aux données
conversationnelles issues de
l'oral
3
dumas-00567888, version 1 - 22 Feb 2011
4
dumas-00567888, version 1 - 22 Feb 2011MOTS-CLÉS : Disfluences, parole spontanée, discours oral, erreur de reconnaissance, text
mining, règle linguistique, cartouche de connaissance.
RÉSUMÉ
Ce mémoire aborde la problématique du traitement des données issues de l’oral. En effet, les
entreprises regorgent de données concernant leurs clients, données issues d’enquêtes de
satisfaction, de forums, d’appels téléphoniques… qui ne sont pas exploitables en l’état.
En premier lieu, un rappel des différents travaux existants en matière d’analyse linguistique
des données issues de l’oral y est effectué (voir p 75 à 80). Les transcriptions manuelles et
automatiques de ces données orales issues de conversations téléphoniques entre agents EDF et
clients y sont ensuite analysées (voir p 75 à 80). Enfin, une solution permettant d’adapter une
cartouche de connaissance à ces données spécifiques y est proposée (voir p 75).
KEYWORDS : Disfluencies, spontaneous speech, oral speech, recognition errors, text
mining, linguistic pattern, skill cartridge.
ABSTRACT
This thesis addresses the problem of processing data derived from the oral. Indeed, businesses
are full of data about their customers, data from satisfaction surveys, forums, call-center...
Which are not workable.
First, a reminder of existing work on the linguistic analysis of data from the spontaneous
speech is proposed (see p 75 à 80). The manual and automatic transcriptions of speech features
from telephone conversations between agents and customers EDF are analyzed (see p 75 à 80).
Finally a solution is proposed to accommodate a Skill Cartridge to specific data (see p 75).
5
dumas-00567888, version 1 - 22 Feb 2011
6
dumas-00567888, version 1 - 22 Feb 2011Remerciements
« Le meilleur ami de "merci" est "beaucoup". »
Michel Bouthot
Je tiens tout d'abord à remercier ma tutrice de stage Mme Chloé Clavel ainsi que notre chef de
projet Mme Anne Peradotto, pour leur gentillesse et leur disponibilité. Merci d'avoir pris le
temps de répondre à mes questions et de m’avoir accordé votre confiance.
J'aimerais remercier Mme Silvia Fagnoni, chef de groupe, ainsi que l’équipe SOAD de
m’avoir intégrée au sein de leur groupe et s’être montrées aussi accueillantes. Egalement, un
grand merci à Ludivine Kuznik pour sa gentillesse, sa présence et son soutien tout au long du
stage.
Je souhaiterais également remercier Delphine Lagarde et Mathilde Thebault de TEMIS pour
leur patience ainsi que pour l’aide apportée dans l’utilisation de l’outil Luxid.
Enfin, je souhaite remercier l’ensemble des professeurs que j’ai pu avoir tout au long de mon
cursus universitaire dans les différentes universités (Nice – Aix en Provence – Grenoble).
Et plus particulièrement :
- Mr Lebarbé, mon tuteur de stage, pour sa disponibilité, son amabilité et pour avoir
répondu à mes questions et m’avoir conseillé utilement.
- Mr Véronis, de l’université d’Aix en Provence, qui a été un professeur formidable. Il
m’a permis de prendre confiance en moi et m’a laissée entrevoir les multiples facettes
de notre spécialité. Encore merci pour sa gentillesse, sa disponibilité et son implication
indéfectible.
"Mes remerciements les plus sincères à toutes les personnes qui auront contribué de
près ou de loin à l'élaboration de ce mémoire ainsi qu'à la réussite de cette formidable
année universitaire !"
7
dumas-00567888, version 1 - 22 Feb 2011
8
dumas-00567888, version 1 - 22 Feb 2011Dédicace
A tous les « Taliens »
9
dumas-00567888, version 1 - 22 Feb 2011
10
dumas-00567888, version 1 - 22 Feb 2011