Université Paris-Sud 11 — Faculté des sciences d’Orsay Ecole Doctorale d’Informatique de Paris-Sud Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur Thèse pour le diplôme de Docteur en Sciences, spécialité Informatique présentée et défendue publiquement le lundi 17 décembre 2007 à Orsay (91) par Daniel Déchelotte Traduction automatique de la parole par méthodes statistiques Automatic Speech Translation by statistical methods Membres du jury : Laurent Besacier (rapporteur) Roland Kuhn (rapporteur) Holger Schwenk (directeur) Jean-Luc Gauvain (co-directeur) Philipp Koehn (examinateur) Joseph Mariani (examinateur)Pour leur écoute, Pour leur patience, Pour leurs conseils, Pour leur gentilesse, Merci à ma fiancée, à ma famille, mes parents et mes sœurs, à mes directeur et co-directeur de thèse, aux collègues du groupe TLP et du LIMSI, aux amis, à mon kinésithérapeute, et à toi lecteur!4 Cette thèse a été partiellement financé par l’Union Européenne sous le projet TC-Star (IST-2002-FP6-506738), et par le Gouvernement français sous le projet Instar (ANR JCJC06_143038).Table des matières 1 Introduction 9 I Modèles et algorithmes pour la traduction automatique 11 2 Introduction à la traduction automatique 13 2.1 État de l’art de algorithmes de traduction automatique . . . . . . . . . 13 2.1.1 Approches à la traduction automatique . . . . . . . . . . . . . . 13 2.1.2 L’approche statistique . . . . . . . . . . . . . . . . . . . . . . . . 16 2.1.3 Modèles ...