Étude de la parole dysarthrique par des méthodes objectives

Hibos - Pierre Clément

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

6 pages

Français

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

A propos
Informations
Extrait

Description

Méthodes objectives issues du traitement automatique de la parole pour larecherche de zones “déviantes” dans la parole dysarthriquePierreCLÉMENT,CorinneFREDOUILLELaboratoire Informatique d’Avignon - CERI/LIA - Université d’Avignon, FranceCourriel : pierre.clement@etd.uapv.fr, corinne.fredouille@univ-avignon.frABSTRACT Néanmoins, un tel système d’évaluation de la paroledysarthrique nécessite avant tout de meilleures connais-A deﬁciency or a misfunction of an enzym present in the sances de ce type de parole. Cet article s’inscrit dans celysosoms causes the lysosomal diseases. One of the symp- cadre et décrit les méthodologies suivies pour repérer destoms due to these diseases is the dysarthria. Dysarthria zones déviantes de la parole dysarthrique avec des out-is deﬁned as a speech disorder caused by a damage of ils de traitement automatique de la parole. Dans un pre-the nervous system. At the present time, the severity de- mier temps, nous expliquerons ce que sont la dysarthrie etgree of dysarthria is measured perceptively by clinicians. les maladies lysosomales. Nous présenterons ensuite lesEven if various perceptual and visual criterias have been méthodologies proposées. Enﬁn, nous présenterons nosdeﬁned to evaluate dysarthria, this evaluation depends di- conclusions sur les analyses préliminaires que nous avonsrectly on the clinician, leading to subjectivity factor. Be- effectuées.cause of that, the evaluation of this pathology should bedone objectively ...

Informations

Publié par	Hibos
Nombre de lectures	177
Langue	Français

Extrait

Mèthodes objectives issues du traitement automatique de la parole pour la recherche de zones “dèviantes” dans la parole dysarthrique Pierre CLÈMENT, Corinne FREDOUILLE Laboratoire Informatique d’Avignon - CERI/LIA - UniversitÉ d’Avignon, France Courriel : pierre.clement@etd.uapv.fr, corinne.fredouille@univ-avignon.fr

ABSTRACTNÉanmoins, un tel systÈme d’Évaluation de la parole dysarthrique nÉcessite avant tout de meilleures connais-A deﬁciency or a misfunction of an enzym present in the sances de ce type de parole. Cet article s’inscrit dans ce lysosoms causes the lysosomal diseases. One of the symp-cadre et dÉcrit les mÉthodologies suivies pour repÉrer des toms due to these diseases is the dysarthria. Dysarthria zones dÉviantes de la parole dysarthrique avec des out-is deﬁned as a speech disorder caused by a damage of ils de traitement automatique de la parole. Dans un pre-the nervous system. At the present time, the severity de-mier temps, nous expliquerons ce que sont la dysarthrie et gree of dysarthria is measured perceptively by clinicians. les maladies lysosomales. Nous prÉsenterons ensuite les Even if various perceptual and visual criterias have been mÉthodologies proposÉes. Enﬁn, nous prÉsenterons nos deﬁned to evaluate dysarthria, this evaluation depends di-conclusions sur les analyses prÉliminaires que nous avons rectly on the clinician, leading to subjectivity factor. Be-effectuÉes. cause of that, the evaluation of this pathology should be done objectively. This article describes the methodologies 2. PATHOLOGIE proposed to ﬁnd “deviant” part of dysarthric speech. The study of its characteristics with automatic speech process-2.1. Dysarthrie ing tools will be the basis of the analysis of the dysarthric speech. La dysarthrie est un trouble de l’Élocution ayant pour orig-ine un trouble neurologique. Les ﬂux nerveux contrÔlant 1. INTRODUCTIONles articulateurs nÉcessaires À l’Élocution proviennent de diffÉrentes zones du cortex cÉrÉbral. La dysarthrie peut Une dÉﬁcience ou un dysfonctionnement d’une enzyme tre le fruit de la lÉsion d’un seul des neurones par lesquels prÉsente dans les lysosomes est À l’origine des maladies transitent les informations de parole. Cette lÉsion entrane dites lysosomales. Cet ensemble de maladies gÉnÉtiques une altÉration des mouvements de la langue, de la gorge, touche essentiellement les enfants, environ un sur 7500. des lÈvres, . . . Parmi les nombreux symptÔmes pouvant tre liÉs À ces maladies, ces jeunes patients peuvent tre atteints deLes symptÔmes de la dysarthrie sont : dysarthrie. Ce symptÔme, prÉsent aussi pour d’autres mal-–parole marmonne adies (telles que la maladie de Parkinson), est un trouble–dbit de parole altr, rythme saccad de l’Élocution qui, suivant sa sÉvÉritÉ, peut traduire une–parole plus nasale incapacitÉ totale À communiquer de maniÈre intelligible.–dysphonie –voix rauque A l’heure actuelle, le degrÉ de sÉvÉritÉ de la dysarthrie –voix monotone est ÉvaluÉ de faÇon perceptive par les cliniciens. Bien Il se peut aussi que le patient Éprouve des difﬁcultÉs À 1 qu’un certain nombre de critÈres sur lesquels les cliniciens avaler et qu’il souffre de dysphagie. s’appuient pour cette evaluation soient dÉﬁnis ([Dar69a], [Dar69b], [Dar75], [Duf05] et [Auz06Parmi les pathologies À l’origine de ces lÉsions, on peut]), il n’en reste pas moins vrai que cette derniÈre ne peut-tre considÉrÉenotamment trouver la maladie de Parkinson, une compli-comme totalement ﬁable, de par son caractÈre subjectif.cation de la syphilis entranant une paralysie totale, la sclÉrose en plaques, la sclÉrose latÉrale amyotrophique Il existe deux grands types de variabilitÉ pour cette Éval-(SLA), les maladies lysosomales telles que Niemann-Pick uation : la variabilitÉ inter-cliniciens et intra-clinicien. ou encore la maladie de Tay Sachs (appelÉe aussi gan-Face aux limites de l’Évaluation actuelle de la parole gliosidose GM2). dysarthrique, liÉes À ces deux variabilitÉs, la mise en place d’un nouveau protocole d’Évaluation plus objectif devientEn raison de sa grande variabilitÉ, il est devenu nÉcessaire une nÉcessitÉ. Dans l’idÉal, ce nouveau protocole s’intÉgr-de proposer une classiﬁcation de la dysarthrie, pour la pra-erait dans l’examen clinique du patient en vue d’apportertique clinique et les travaux de recherche. En 1957, Grewel 2 une aide au diagnostic et au suivi thÉrapeutique. Les so-([Gre57([]) s’inspire du travail de PeacherPea50]) aﬁn lutions envisagÉes dans ce cadre peuvent reposer soit surde diviser les dysarthries en quatorze classes. Ces classes des technologies instrumentales (À base de capteurs de 1 La dysphagie est une sensation de gne ressentie lors du passage mesures acoustiques, aÉrodynamiques et physiologiques) d’aliments dans la bouche, le pharynx ou l’œsophage. soit sur des systÈmes de traitement automatique de la pa-2 Peacher a effectuÉ en 1950 une premiÈre classiﬁcation des maladies role. dysarthriques.

reposent sur la localisation des lÉsions cÉrÉbrales, avec–Tay Sachs: deux femmes et un homme parfois une information supplÉmentaire concernant la–Niemann-Pick type C: deux femmes et trois hommes 3 pathologie associÉe ou l’Étiologie. Le fait que cette clas-Tous ces patients suivent un traitement thÉrapeutique ex-siﬁcation repose sur des critÈres diffÉrents (anatomiques,pÉrimental basÉ sur la molÉcule de miglustat. Ce traite-4 Étiologiques ou physiopathologiques) en est son principalment doit, normalement, apporter une stabilisation des inconvÉnient. symptÔmesdes patients (dont la dysarthrie). L’Équipe de Darley et al. de la Mayo Clinic a proposÉLes enregistrements, effectuÉs sur une pÉriode de deux une classiﬁcation de la dysarthrie ([Dar69a], [Dar69bans, À plusieurs mois d’intervalle, contiennent plusieurs] et [Dar75]) en six classes reposant uniquement sur les trou-types de parole. Lors de nos expÉriences, nous n’avons bles neurologiques qui ont provoquÉ la dysarthrie. CetteutilisÉ que les enregistrements de la lecture d’un texte (le classiﬁcation, complÉtÉe en 2005 par Duffy ([Duf05cordonnier qui contient 19 phrases), pour les raisons suiv-]) qui ajouta deux nouvelles classes, est la classiﬁcation actuelle-antes : ment utilisÉe.– ilnous fallait une quantitÉ de parole relativement im-portante, homogÈne et prÉsentant une variabilitÉ phonÉ-2.2. Maladieslysosomalestique ÉlevÉe. – il nous fallait de la parole commune À chacun, aﬁn Les lysosomes sont des structures contenues au cœur de de pouvoir comparer les rÉsultats entre eux. La parole nos cellules. Ils ont pour rÔle de recycler les mÉtabo-spontanÉe est donc À exclure. 5 lites . Les lysosomes remplissent leur fonction gráce À La parole lue semble par consÉquent la mieux adap-trois types d’enzymes qu’ils contiennent : des lipases, des tÉe mme si cela entrane la perte d’autres informations protÉases et des osidases. L’altÉration du fonctionnement (comme la spontanÉitÉ par exemple). d’une de ces trois enzymes, due À une dÉﬁcience gÉnÉ-tique, est À l’origine des “maladies lysosomales”.Nous avons aussi, pour chaque patient, son “contrÔle”. Il s’agit d’enregistrements d’une personne, sans pathologie Les enzymes sont crÉÉes et codÉes par les gÈnes. Si le particuliÈre (saine), associÉs aux enregistrements d’un pa-gÈne code mal ou ne crÉe pas l’enzyme, alors le bon fonc-tient. L’appariement patients/contrÔles a ÉtÉ effectuÉ par tionnement de celle-ci est compromis. Chaque enzyme in-des orthophonistes sur des critÈres physiques de similaritÉ tervient sur le recyclage d’un mÉtabolite. Par consÉquent, (sexe et tranche d’áge). si l’une des trois fonctionne mal ou ne fonctionne pas, le mÉtabolite concernÉ ne sera pas traitÉ ou pas correctementLe corpus est constituÉ d’environ 5h45 d’enregistrement par le lysosome. Avec le temps, les mÉtabolites s’accu-au total, tout type de parole, de maladie, de genre etc. con-mulent, les cellules s’engorgent et entranent un dÉfaut defondus et les “contrÔles” inclus. La durÉe totale des en-fonctionnement des diffÉrents organes.registrements de parole lue, donc utilisÉe lors de nos ex-pÉriences, reprÉsente 23% du corpus, soit environ 1h20 Ainsi, on englobe sous le terme de “maladies lysosoma-d’enregistrement. les” une cinquantaine d’affections handicapantes de l’en-fant À l’adulte. Nous nous intÉressons ici À 2 maladies par-3.2. PrÉsentationdes mÉthodologies ticuliÈres : – lamaladie de Niemann-Pick type C (accumulation deLa ﬁgure1dÉcrit les deux grandes mÉthodologies que cholesterol dans les cellules)nous avons suivies aﬁn de rechercher des zones “dÉ-– lamaladie de Tay Sachs (accumulation de gangliosidesviantes” dans la parole dysarthrique. En utilisant les outils GM2 dans les cellules)de traitement automatique de la parole, nous souhaitons Il semblerait que la dysarthrie rÉsultante de ces patholo-mettre en Évidence des entitÉs linguistiques (phonÈmes, gies soit liÉe À diverses atteintes dans le systÈme nerveux,classes de phonÈmes etc.. . .) pertinentes pour distinguer la cette dysarthrie peut donc tre classÉe comme dysarthrieparole dysarthrique de la parole normale par rapport À cet mixte ([Dar69a], [Dar69b] et [Dar75]). objectif. Dans un premiers temps, les patients et les contrÔles seront 3. MÈTHODOLOGIES comparÉs À un modÈle gÉnÉrique de parole estimÉ sur une grande population de locuteurs normophoniques (cor-3.1. Corpus pus “Bref”, [Lam91]). Ce modÈle gÉnÉrique de parole reposera sur les techniques de modÉlisation statistique À Nous avons À notre disposition un corpus constituÉ À base de GMM (Gaussian Mixture Model) ÉprouvÉes en re-l’hÔpital de la PitiÉ-SalptriÈre oÙ les patients ont ÉtÉ en-connaissance automatique de la langue (RAL, [Bim04]). registrÉs par une orthophoniste. Nous calculerons des scores de vraisemblances associÉs Ce corpus comprend des enregistrements de quatre pa-aux signaux de parole par rapport À ce modÈle. A partir de tients fÉminins et quatre patients masculins. Ces huit pa-ces scores, nous produirons une cartographie des zones de tients sont atteints de deux maladies lysosomales dif-dÉviance et des histogrammes (expliquÉs en section3.4) fÉrentes :aﬁn d’observer si la parole des patients est trÈs ÉloignÉe de notre modÈle gÉnÉrique. 3 L’Étiologie est l’Étude des causes et des facteurs d’une pathologie. 4 La physiopathologie est la discipline biologique qui traite des dÉrÈ-Dans un deuxiÈme temps, les signaux de parole seront glements de la physiologie, c’est-À-dire du mode de fonctionnement nor-comparÉs À des modÈles spÉciﬁques de parole. En effet, mal des ÉlÉments constitutifs du corps humain, d’un animal ou d’un l’alignement automatique nous fournira des scores de con-vÉgÉtal. ﬁance par phonÈme À partir desquels seront produits À nou-5 Les mÉtabolites sont des matiÈres issues du fonctionnement cellu-veau une cartographie des zones de dÉviance et des his-laire.

FIG. 1:MÉthodologies

togrammes. cetalignement automatique rÉsulte une segmentation tem-porelle en phonÈmes comprenant, pour chaque phonÈme, 3.3. Calculdes scoresses frontiÈres de dÉbut et de ﬁn au sein du signal de parole ainsi qu’un score de vraisemblance (Équation1) entre le Suivant les deux mÉthodologies dÉcrites prÉcÉdemment, segment de parole associÉ et le modÈle statistique corre-deux types de score seront produits : spondant. – scorede vraisemblance dans le cadre du modÈle gÉnÉrique de la parole – score de conﬁance dans le cadre des modÈles spÉci-ﬁques VraisemblanceLors de la phase de reconnaissance, un signal de parole est comparÉ au modÈle statistique gÉnÉrÉ lors de la phase d’apprentissage sur un corpus de parole normophonique (“Bref”). Cette comparaison repose sur la mesure d’une similaritÉ entre les vecteurs acoustiquesyt extraits du signal et le modÈleX. Cette similaritÉ, appelÉe vraisemblance, peut-tre dÉﬁnie par : FIG. 2:Alignement contraint par le texte M X L(yt|X) =piLi(yt)(1) Ces scores de vraisemblance, notÉsLi(yt) n’Étant pas nor-i=1 malisÉs, il est difﬁcile de savoir si un “mauvais” rÉsultat 1est dÛ À la qualitÉ du signal ou À une mauvaise prononci-1T−1 2ytiyt −(−x) (Σi) (−xi) oÙLi(yt) =e d/2 1/2ation du phonÈme. Pour pallier ce problÈme, les rÉsultats (2π)|Σi| sont normalisÉs par les vraisemblances rÉsultantes du dÉ-La vraisemblance calculÉe À partir de l’Équation [1] cor-codage acoustico-phonÉtique (DAP). respond À l’estimation de la reprÉsentativitÉ du vecteur de testytpar le mÉlange de gaussiennesX. Le DAP est en fait un alignement non-contraint par le texte (táche Également issue de la RAP, illustrÉ par la ﬁgure3). Score de conﬁanceL’alignement automatique contraint N’ayant pas accÈs À la transcription en mots, le systÈme par le texte ([Bru93]) est une táche du domaine de la re-n’a aucun a priori sur la sÉquence de phonÈmes pronon-connaissance automatique de la parole (RAP). Il consiste, cÉs par le locuteur. Pour un segment de parole donnÉ, À partir d’un signal de parole et de sa transcription en mots un systÈme DAP compare, par le biais d’une mesure de (texte), À dÉtecter automatiquement les frontiÈres dans le vraisemblance, les paramÈtres de ce dernier avec le mod-signal de parole de chacun des phonÈmes prÉsents dans Èle statistique de tous les phonÈmes connus du systÈme. le texte prononcÉ (illustrÉ par la ﬁgure2). Cet alignement Le phonÈme associÉ À la plus grande vraisemblance est automatique repose sur un dÉcodage du signal de parole alors dÉsignÉ comme Étant celui rÉalisÉ dans le segment par l’algorithme Viterbi basÉ sur des modÈles statistiques de parole traitÉ. 6 (HMM )associÉs À chacun des phonÈmes recherchÉs. De (phonÈmes par exemple) que celles modÉlisÉes par des GMM. A noter 6 HMM : Hidden Markov Model, ModÈle de Markov CachÉ. Ce mod-qu’un GMM est en fait un HMM particulier comportant un seul État, À Èle est un automate À États ﬁnis ([Bak90] et [Jel76]). Les HMM per-comparer, par exemple, aux HMM À trois États, gÉnÉralement utilisÉs, mettent de modÉliser des unitÉs acoustiques indÉpendantes plus longuespour la modÉlisation des phonÈmes..

FIG. 3:DÉcodage acoustico-phonÉtique (DAP)

Finalement, la normalisation des scores de vraisemblancecontre laquelle les enregistrements ÀT+nseront com-issus de l’alignement contraint par le texte repose surparÉs. Dans notre Étude, diffÉrentes rÉfÉrences peuvent l’Équation suivante :tre choisies comme illustrÉ par le tableau1. Suivant l’ analyse visÉe (dÉtection de zones dÉviantes, Étude longi-C L(y norm it) tudinale par patient, .. .),la rÉfÉrence adÉquate sera donc L log i(yt) =(2) N C L(yt)utilisÉe. La ﬁgure4est un exemple de carte, la rÉfÉrence i normÉtant prise sur l’enregistrement courant du patient. oÙL) est la vr i(ytaisemblance issue de la normalisa-C on,L(ysemblance issue de l’alignement con-tii t) la vrai N C (ysemblance issue du traint par le texte etLi t) la vrai Rèfèrences possiblesComparaisons possibles DAP. pour l’ètablissement du minimum et du Ces scores normalisÉs seront considÉrÉs comme des scores maximum de conﬁance et associÉs À chaque segment phonÉmique. Enregistrement courantAucune Tous les enregistrementsComparaisons entre les 3.4. PrÉsentationdes rÉsultats d’un mme patientenregistrements Tous les enregistrementsComparaisons entre tous Aﬁn de faciliter l’analyse des scores issus des deux de tous les contrÔlesles ﬁchiers mÉthodologies mises en place en vue de la dÉtection des Tous les enregistrementsComparaisons entre tous zones de dÉviance de la parole dysarthrique ou de la com-de tous les patients et con-les ﬁchiers paraison entre enregistrements d’un mme patient (Étude trÔles longitudinale), deux grands types de reprÉsentation sont proposÉs. TAB. 1:Choix de la rÉfÉrence pour les cartes et incidences Cartessur les comparaisons.Le premier repose sur la mise en place d’une cartographie des enregistrements des patients/contrÔles. Chaque enregistrement est associÉ À une carte, illustrant par segment de parole (par exemple un phonÈme), l’É-cart du score obtenu par rapport À une rÉfÉrence donnÉe. HistogrammesLe deuxiÈme type de reprÉsentation des Cette rÉfÉrence, qui rÉsulte d’un seul ou plusieurs enreg-scores repose sur l’Établissement d’histogrammes. Les istrements, nous fournit l’Étendue des scores de compara-histogrammes permettent de synthÉtiser les Écarts des ison en fonction de trois points clÉs que sont le minimum, scores, par rapport À notre rÉfÉrence pour chacun des en-la mÉdiane et le maximum. Ces valeurs nous permettent registrements des contrÔles et des patients. Cette synthÈse d’Établir une Échelle de rÉfÉrence graduÉe (note : un dÉ-peut tre fournie pour un phonÈme donnÉ (considÉrant gradÉ de couleurs, allant du minimum au maximum, sera l’ensemble des productions de ce mme phonÈme dans le utilisÉ pour la visualisation de cette Échelle sur les cartes) texte), pour une classe de phonÈme, pour une phrase.. .La sur laquelle sera positionnÉ chacun des scores des seg-ﬁgure5montre l’histogramme du phonÈme [l] d’un pa-ments associÉ À un enregistrement À analyser. tient. En partie gauche de l’axe des ordonnÉes on retrouve Le choix de la rÉfÉrence est important et trÈs dÉpen-les moyennes des Écarts des scores pour tous les contrÔles dant de la táche visÉe. En effet, s’il s’agit de com-sur le phonÈme ÉtudiÉ et en partie droite celles du pa-parer les enregistrements d’un mme patient dans letient. Chaque barre de l’histogramme reprÉsente un enreg-cadre d’une Étude longitudinale (plusieurs temps d’enreg-istrement. Dans ce cadre, nous avons dÉﬁni deux seuils, istrement pour Étudier l’Évolution de la maladie), l’enreg-le premier se situant À la moyenne des Écarts des scores istrement ÀT0sur les enregistrements des contrÔles moins leur Écart-typepeut tre considÉrÉ comme la rÉfÉrence

FIG. 4:Exemple d’une carte

et le second À la moyenne des Écarts des scores moinsLe fait que rien ne ressorte de ces analyses peut s’expli-deux fois leur Écart-type. Ces seuils reprÉsentent respec-quer de la faÇon suivante : il semblerait que le corpus tivements 98% et 84% des donnÉes, en supposant que ladysarthrique ne soit pas aussi ÉloignÉ du modÈle gÉnÉrique rÉpartition des donnÉes soit gaussienne. Ils nous permet-du point de vue de la machine. Notre systÈme arrive, avec tront par la suite de faire les observations suivantes : si laplus ou moins de succÈs, À associer ces segments de parole moyenne des valeurs, pour un phonÈme d’un patient est audysarthrique À de la parole normale. De cette observation dessus de ces seuils, alors il ne sera pas considÉrÉ commeon peut Émettre l’hypothÈse suivante : les sons produits dÉviant, il sera dans la “normalitÉ” telle que nous l’avonspar les patients dysarthriques sont connus de nos mod-dÉﬁnie. Èles.Cette hypothÈse, trÈs importante car non-attendue avant les expÉriences, semble aller dans le sens des Évalua-tions perceptives prÉliminaires rÉalisÉes sur ce mme cor-pus. En effet, les auditeurs semblent reconnatre les ÉvÉne-ments acoustiques perÇus mais soulignent le fait que leur rÉalisation dans le signal de parole est anormalement po-sitionnÉe. Par exemple, si un phonÈme [p] est remplacÉ par un [b] car le patient n’arrive pas À prononcer le [p] de “petit”, le systÈme fournira une vraisemblance correcte, cet ÉvÉnement ([b]) Étant bien prÉsent dans le modÈle gÉnÉrique de parole, bien que le phonÈme attendu soit [p]. 4.2. Analysesdes modÈles spÉciﬁques Comme vu prÉcÉdemment, la cartographie et les his-FIG. 5:Exemple d’histogramme de rÉpartition des togrammes reﬂÈtent ici les scores de conﬁance fournis par moyenne des Écarts des scores par rapport À la rÉfÉrence l’aligneur contraint par le texte, c’est-À-dire issus des mod-Èles spÉciﬁques de parole. 4. ANALYSES Les analyses ont ÉtÉ effectuÉes À deux Échelles : –par phonme 4.1. Analysespar segment –par classe de phonmes Aﬁn d’Éviter de fausser les rÉsultats avec des statis-Ceci dans le but d’Éviter qu’une particularitÉ de pronon-tiques sur les pauses, nous avons segmentÉ les ﬁchiers enciation chez un patient non-liÉ À la pathologie fausse parole/non-parole, ceci nous permettant de nous focaliserles rÉsultats si on ne considÈre que les phonÈmes. Les uniquement sur les temps de parole. Cette segmentationclasses de phonÈmes nous permettent en effet d’obtenir est rÉalisÉe de maniÈre automatique : un dÉtecteur basÉ surdes moyennes plus reprÉsentatives car calculÉes sur plus le coefﬁcient Énergie fournit la segmentation d’un ﬁchierd’observations. En effet, si on prend par exemple le paramÉtrisÉ en parole/non-parole.phonÈme /b/, il n’est prononcÉ que deux fois. Si jamais ce phonÈme rÉagit bien au systÈme (c’est À dire qui son score Nous avons Également utilisÉ la segmentation phonÉmiquemoyen est en dessous des seuils dÉﬁnis), on ne pourrait fournie par le systÈme d’alignement contraint par le texte.malheureusement rien dÉduire car la moyenne rÉsultante A partir de ces deux types de segmentation, la comparai-ne serait pas reprÉsentative du cas prÉsent. son entre les signaux des patients/contrÔles et notre mod-Èle gÉnÉrique a permis de fournir un score de vraisem-Une premiÈre analyse prÉliminaire des cartes et his-blance moyen par segment, À partir desquels cartes et his-togrammes a permis de mettre en Évidence diffÉrents axes togrammes sont produits.d’observation À croiser ultÉrieurement avec une analyse perceptive et phonÉtique : L’analyse des cartes et histogrammes alors gÉnÉrÉs ne– contrairementÀ la mÉthodologie prÉcÉdente (basÉe sur nous a pas permis de mettre en Évidence des phrases,un modÈle gÉnÉrique), les cartographies des diffÉrents mots, classes de phonÈmes ou phonÈmes dÉviants. En ef-patients montrent des zones de dÉviance comparÉes fet, aucune comparaison aux contrÔles ou Étude longitudi-À leur contrÔle. L’utilisation des modÈles spÉciﬁques nale (comparaison entre les enregistrements d’un patient)semble donc pertinente. ne met en Évidence des portions de parole nettement dÉ-– onpeut observer que le systÈme est moins rÉactif sur les viantes et communes aux diffÉrents patients et contrÔles.

hommes que sur les femmes, notamment en observantEnﬁn ce travail sera appliquÉ À un corpus plus consÉquent la rÉpartition des classes de phonÈmes par rapport À noscomprenant d’autres types de dysarthrie telle que celle as-deux seuils. En effet, trÈs peu de classes de phonÈmes,sociÉe À la maladie de Parkinson et À la SLA. chez les hommes, se retrouvent en dessous du premier 6. REMERCIEMENTS seuil de “normalitÉ”. – demme, on peut constater, chez les femmes, que les patientes atteintes de la maladie de Tay Sachs prÉsen-Cette Étude a reÇu le soutient de l’association “Vaincre tent moins de variabilitÉ dans la rÉpartition des classesles Maladies Lysosomales (VML)” (soutient ﬁnancier) et de phonÈmes par rapport À nos seuils que les patientesde l’hÔpital de la PitiÉ-SalpÉtriÈre (partage des enreg-atteintes de la maladie de Niemman-Pick type C.istrements). – nousavons Également observÉ que les consonnes voisÉes et les voyelles nasales sont les classes deRÈFÈRENCES phonÈmes qui montrent le plus de variabilitÉ vis À vis [Auz06] Auzou,P. and Rolland-Monnoury, V. (2006), de nos deux seuils de “normalitÉ”. Par exemple, les con-Batterie d’valuation clinique de la dysarthrie, sonnes voisÉes sont la seule classe À tre en dessous du ORTHO.1 seuil haut pour la patiente jugÉe perceptivement comme la moins dysarthrique. Pour les hommes, ce sont princi-[Bak90] Baker,J.K. (1990), “Stochastic modeling for palement les voyelles nasales qui varient. automatic speech understanding”, , pp. 297– Ces quelques observations prÉliminaires semblent donc 307.3 montrer l’intÉrt de cette mÉthodologie. Il reste main-[Bim04] Bimbot, F., Bonastre, J.F., Fredouille, C., tenant À comparer les zones de dÉviance dÉtectÉe automa-Gravier, G., Magrin-Chagnolleau, I., Meignier, tiquement par le systÈme aux rÉsultats d’analyse de ces S., Merlin, T., Ortega-Garcia, J., Petrovska, D. mmes signaux d’un point de vue phonÉtique (en cours de and Reynolds, D.A. (2004), “A tutorial on text-rÉalisation). independent speaker veriﬁcation”,EURASIP Journal on Applied Signal Processing, vol. 39, 5. CONCLUSION ET PERSPECTIVES pp. 430–451.2 Nous avons pu, gráce À ce travail, mettre en place deux[Bru93] Brugnara,F., Falavigna, D. and Omologo, M. grandes mÉthodologies nous permettant de reprÉsenter(1993), “Automatic segmentation and labeling un signal de parole dysarthrique sous forme de cartesof speech based on hidden markov models”, et d’histogrammes. Ces donnÉes seront, dans un avenirSpeech Communication, vol. 12, pp. 357–370. proche, analysÉes en dÉtails. Elles seront notamment com-3 parÉes aux analyses perceptives rÉalisÉes par des experts [Dar69a] Darley, F.L., Aronson, A.E. and Brown, J.R. en phonÉtique aﬁn de voir si nos cartes permettent de met-(1969), “Clusters of deviant speech dimensions tre en Évidence des dÉformations de la parole relevÉes de in the dysarthrias.”,J Speech Hear Res, vol. 12, faÇon manuelle par ces derniers. pp. 462–496.1,2 [Dar69b] Darley, F.L., Aronson, A.E. and Brown, J.R. Sur le travail effectuÉ, la taille du corpus ne nous per-(1969), “Differential diagnostic patterns of met malheureusement pas d’afﬁrmer ou d’inﬁrmer les hy-dysarthria.”,J Speech Hear Res, vol. 12, pp. pothÈses, observations et autres remarques que nous avons 246–269.1,2 effectuÉes. L’exemple le plus marquant est probablement l’observation Émise À partir des derniÈres analyses : on ne[Dar75] Darley,F.L., Aronson, A.E. and Brown, J.R. peut pas conﬁrmer que le systÈme est plus rÉactif avec les(1975),Motor speech disorders, Philadelphia. patientes atteintes de la maladie de Niemann-Pick type C1,2 qu’avec les patientes atteintes de la maladie de Tay Sachs, [Duf05] Duffy,J.R. (2005),Motor speech disorders : par manque de cas d’Études. substrates, differential diagnosis, and manage-ment, Mosby.1,2 Par ailleurs, l’un des inconvÉnients actuels des cartes est qu’elles ne se basent que sur la segmentation propre À[Gre57] Grewel,F. (1957), “Classiﬁcation of chaque patient/contrÔle. Or, ces segmentations pouvantdysarthrias.”,Acta Psychiatr Neurol Scand, tre diffÉrentes d’un patient À l’autre (ajout de mots pos-vol. 32, pp. 325–337.1 sibles, omission de phonÈmes, .. .),les cartes ne sont [Jel76] Jelinek,F. (1976), “Continuous speech recogni-pas, actuellement, directement comparables. Une solution tion by statistical methods”, vol. 64, pp. 532– À mettre en place serait l’utilisation d’un “masque” qui 556.3 ne contiendrait que la parole commune À tous les enreg-[Lam91] Lamel,L.F., Gauvain, J.L. and EskÉnazi, M. istrements. Tout ce qui serait en dehors de ce masque ne (1991), “BREF, a large vocabulary spoken cor-serait pas analysÉ. A noter que cette Étape ne pourra pas pus for french”, Genoa, Italy, pp. 505–508.2 se faire de faÇon automatique, l’intervention humaine sera [Pea50] Peacher,W.G. (1950), “The etiology and differ-nÉcessaire. ential diagnosis of dysarthria.”,J Speech Dis-Par ailleurs, les mÉthodologies mises en place serontord, vol. 15, pp. 252–265.1 testÉes suivant diffÉrentes conﬁgurations : – denouveaux modÈles spÉciﬁques, plus complets et plus prÉcis sertont expÉrimentÉs (issus des campagnes d’É-valuation ESTER) – des modÈles dÉpendants du genre seront Également ÉtudiÉs