5e journées internationales d'analyse statistique des données textuelles(Lausanne, jeudi 9 mars)Analyse des données textuelles et Statistique lexicale(Textual Data Analysis and Lexical Statistics)Dominique LabbéCERAT-IEP - BP 48 - F38.402 Grenoble Cedexcerat@iep.upmf-grenoble.frRésuméCette conférence plaide pour des données textuelles de qualité, normalisées et étiquetées.Elle illustre leur utilité à l'aide d'un exemple : le sens du mot "amour" dans l'oeuvre deCorneille. La technique de l'étiquetage est présentée. Enfin, on évoque la nécessairecoopération entre les chercheurs pour la réalisation des outils de normalisation et d'étiquetageet pour la constitution de corpus de référence.SummaryThis presentation argues in favor of high quality normalized and tagged textual data. Anexample is given : the sense of the word "love" in Corneille's plays. Then it explains the mainprinciples for normalization and tagging. At least, large cooperation between researchers isneeded to elaborate norms and tagging tolls and to create large tagged corpora.Key Words : textual data, normalization, tagging, corpora1Dans les conférences qui ouvrent un congrès comme le nôtre, il est de bon ton de brosserde vastes fresques portant sur l'état présent de la discipline et sur les développements,nécessairement enthousiasmants, qui se profilent à l'horizon. Permettez-moi de déroger uninstant à cette règle et d'abaisser le regard sur nos outils et nos matériaux.En ce qui ...