La parole numérique, analyse, reconnaissance et synthèse du signal vocal
53 pages
Français

Vous pourrez modifier la taille du texte de cet ouvrage

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

La parole numérique, analyse, reconnaissance et synthèse du signal vocal , livre ebook

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
53 pages
Français

Vous pourrez modifier la taille du texte de cet ouvrage

Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

La reconnaissance automatique de la parole donne lieu à un ensemble d’applications de nature et de difficulté très variées, concernant quotidiennement des millions de personnes. Elle fait appel à des notions variées allant des mathématiques, du traitement du signal, de l’informatique et de l’intelligence artificielle jusqu’à la phonétique, la linguistique, les sciences cognitives et les neurosciences.
L’ouvrage présente les fondements du domaine ainsi que les différents modèles et algorithmes utilisés (statistiques, neuromimétiques, symboliques).
Les domaines d’application sont également étudiés : dictée, commandes, télématique, traduction, etc.

Jean-Paul Haton, agrégé de l’Université (Ecole Normale Supérieure de Saint-Cloud) et Docteur d’état ès Sciences, est professeur émérite à l’Université de Lorraine à Nancy et chercheur au LORIA/INRIA. Il est membre senior de l’Institut Universitaire de France, Vice-Président de l’Académie Lorraine des Sciences et membre associé de l’Académie Royale de Belgique.

Sujets

Informations

Publié par
Nombre de lectures 10
EAN13 9782803105298
Langue Français

Informations légales : prix de location à la page 0,0030€. Cette information est donnée uniquement à titre indicatif conformément à la législation en vigueur.

Extrait

LA PAROLE NUMÉRIQUE
Jean-Paul Haton
La parole numérique Analyse, reconnaissance et synthèse du signal vocal
Académie royale de Belgique
rue Ducale, 1 - 1000 Bruxelles, Belgique
www.academieroyale.be
Informations concernant la version numérique
ISBN : 978-2-8031-0529-8

© 2016, Académie royale de Belgique
Collection L’Académie en poche
Sous la responsabilité académique de Véronique Dehant
Volume 79
Diffusion
Académie royale de Belgique
www.academie-editions.be
Crédits
Conception et réalisation : Laurent Hansen, Académie royale de Belgique
Couverture : © Aniwhite, Shutterstock
Publié en collaboration avec
Introduction
Le traitement automatique de la parole recouvre un vaste ensemble d’activités, souvent complémentaires, que l’on peut classer en six grands thèmes : — codage et compression de la parole, intervenant en transmission et en restitution de la parole, — synthèse de la parole, produisant un signal vocal à partir d’un dictionnaire d’éléments phonétiques et/ou de règles, — reconnaissance de la parole, revenant à faire interpréter par une machine des mots ou des phrases prononcés par un locuteur humain dans le but de réaliser une action précise, — reconnaissance et vérification du locuteur, problème dual du précédent dans lequel on cherche à authentifier une personne par sa voix, — identification de la langue dans laquelle une personne s’exprime, — détermination de l’état émotionnel d’un locuteur.
Ces différents thèmes ne sont pas indépendants les uns des autres. Ils se trouvent souvent utilisés simultanément au sein d’une application.
Ainsi, un système de dialogue oral comporte des modules de reconnaissance, de synthèse et éventuellement d’identification des locuteurs ou de la langue dans laquelle ces derniers s’expriment. Ces techniques permettent de mettre en œuvre des interfaces homme-machine (IHM) dans lesquelles une part importante de l’interaction utilise la voix.
Chapitre 1
La communication parlée
La communication parlée permet le transfert d’informations d’une personne à une autre par le biais de la parole. Ce mode de communication est primordial pour l’être humain. Cela le distingue des autres animaux et, en outre, langage et développement culturel sont inséparables. Les moyens technologiques ont étendu la portée de cette communication, d’une part en proposant de nouveaux vecteurs tels que téléphone, radio, télévision, Internet, et d’autre part en introduisant la communication orale homme-machine en complément de la communication entre humains.
Le signal acoustique de parole résulte des variations de pression de l’air au niveau de la bouche et du nez d’un locuteur. Ce signal transporte un ensemble d’informations linguistiques relatives au message que le locuteur veut faire parvenir, ainsi que des informations sur son identité, son état, etc. On peut distinguer quatre grandes étapes dans le processus de la communication parlée : — Intention : le locuteur transforme l’idée qu’il désire transmettre en une structure linguistique formée des mots adéquats. — Articulation : la structure linguistique est transformée en une suite de commandes motrices pour les organes articulateurs. — Émission : l’onde vocale est produite par le mouvement des muscles articulateurs et se propage dans l’air depuis la bouche du locuteur. — Perception : l’onde vocale parvient aux oreilles d’un auditeur. Elle est alors transformée en impulsions nerveuses transmises au cerveau de façon à être comprise par l’auditeur.
L’ensemble des processus ci-dessus constitue la chaîne de communication parlée. 1. La production de la parole
La parole est produite par les mouvements de l’appareil phonatoire. Cet appareil se compose de deux parties distinctes, une source et un canal. La source d’énergie utilisée pour produire les sons est l’air contenu dans les poumons. Le flux d’air sous pression passe à travers la trachée et parvient au conduit vocal qui comprend le larynx avec les cordes vocales, des cavités résonantes plus ou moins déformables (pharynx ; cavité buccale et fosses nasales pouvant être mises en communication grâce au voile du palais) et des organes d’articulation (langue, lèvres, mâchoires, etc.) permettant d’obturer le canal vocal ou d’en modifier la forme. 2. Les sons élémentaires du français
Les sons élémentaires de parole peuvent être classés en fonction de trois variables : le voisement (activité des cordes vocales), le mode d’articulation (type de mécanisme de production) et le lieu d’articulation (endroit de resserrement maximal du conduit vocal). ...

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents