Cet ouvrage fait partie de la bibliothèque YouScribe
Obtenez un accès à la bibliothèque pour le lire en ligne
En savoir plus

Diagnostic et reconnaissance des formes (Traité des nouvelles technologies Série Diagnostic et maintenance)

De
328 pages
Le diagnostic d'un système physique est un important problème industriel : savoir reconnaître le mode de fonctionnement d'un système permet d'en améliorer la conduite, et donc d'augmenter les performances du processus de fabrication. Parmi les multiples approches possibles du diagnostic, l'auteur a choisi de privilégier la reconnaissance des formes, s'appuyant ainsi sur une importante expérience. Un des problèmes fondamentaux du diagnostic réside, en effet, dans la méconnaissance de tous les modes de fonctionnement : la reconnaissance des formes à l'aide de règles de décision dites avec rejet permet de résoudre ce problème et d'apprendre les caractéristiques des nouveaux modes lorsqu'ils se produisent. De nombreuses méthodes sont exposées et discutées, étayées d'exemples dont certains sont issus d'expériences industrielles. Le lecteur pourra ainsi trouver un ensemble de solutions possibles à ses problèmes de diagnostic.
1. Introduction2. Prétraitement par analyse des données3. Discrimination paramétrique avec rejet4. Discrimination non paramétrique5. Diagnostic par des méthodes de distance6. Calcul direct de frontières7. Prise en compte de l'évolution8. PerspectivesBibliographieIndex
Voir plus Voir moins

3 Q Traité des Nouvelles Technologies
série Diagnostic et Maintenance
Diagnostic
et
reconnaissance
des
formes
Bernard Dubuisson
HERME S Diagnostic
et
reconnaissance des formes Collection dirigée par
Bernard Dubuisson
et
Gilles Zwingelstein Traité des Nouvelles Technologies
série Diagnostic et Maintenance
Diagnostic
et
reconnaissance des formes
Bernard Dubuisson
Professeur à l'université de technologie
de Compiègne
Directeur de l'URA — CNRS
Heuristique et diagnostic
des systèmes complexes
HERME S © Hermès, Paris, 1990
Éditions Hermès
34, rue Eugène Flachat
75017 Paris
ISBN 2-86601-240-2 A Francine,
Marie-Pierre,
Sophie,
Séverine
pour leur soutien continu,
leur aide...
et leur infinie patience Table des matières
Préface de Gilles Zwingelstein 13
Avant-propos5
Principales notations7
Chapitre 1. Introduction9
1.1. Du diagnostic 1
1.1.1. Définitions
1.1.2. Différents types de connaissance 21
1.1.3. Quelques questions4
1.2. De la reconnaissance des formes5
1.3. Du diagnostic et de la reconnaissance des formes7
1.3.1. Phase d'analyse 2
1.3.2.e de choix d'un système de détection9
1.3.3. Phase d'exploitation
1.4. Plan du livre 30
1.5. Bibliographie générale sommaire1
Chapitre 2. Prétraitement par analyse des données 33
2.1. L'analyse en composantes principales 3
2.1.1. Principe4
2.1.1.1. Choix de l'origine5
2.1.1.2. Choix des axes7
2.1.1.3.x d'une matrice M 40
2.1.2. Etude des composantes principales1
2.1.3. Description des individus
2.1.4.n des variables
2.2. Les méthodes de coalescence8 Diagnostic et reconnaissance des formes
2.2.1. Indice de proximité 48
2.2.2. Nombre de partitions 50
2.2.3. Critères de qualité1
2.2.3.1. Critère de l'erreur quadratique1
2.2.3.2. Critères basés sur des matrices de covariance 52
2.2.4. Algorithme de coalescence4
2.2.5. Etude de la convergence5
2.2.5.1. Décroissance de la fonction critère 57
2.2.5.2. Stationnante de la suite créée8
2.2.5.3. Notion de formes fortes9
2.3. Exemple d'analyse factorielle et de coalescence9
2.3.1. Prétraitement et choix du vecteur 60
2.3.2. Analyse factorielle1
2.3.3. Recherche d'une partition5
2.4. Sélection de caractères 65
2.4.1. Présentation générale7
2.4.2. Choix d'un critère8
2.4.3. Méthodes de sélection9
2.4.3.1. Méthodes sous-optimales9
2.4.3.2. Méthode de recherche optimale 70
2.4.4. Extension au problème de diagnostic5
2.4.5. Exemple 77
2.5. Conclusion8
Chapitre 3. Discrimination paramétrique avec rejet 79
3.1. Règle de Bayes ou du coût minimum 80
3.1.1. Principe général0
3.1.2. Règle des coûts {0, 1)1
3.1.2.1. Définition des différentes probabilités 83
3.1.2.2. Relation entre les probabilités et le coût optimum 86
3.1.2.3. Cas où Cr est supérieur à M - 1/M9
3.2. Cas de deux classes obéissant à des lois de Gauss multivariées 90
3.2.1. Loi de Gauss multidimensionnelle 90
3.2.2. Décision entre deux classes5
3.2.2.1. Cas général5
3.2.2.2. Cas où les deux classes ont même matrice de variance-
covariance 96
3.2.2.2.1. d quelconque6
3.2.2.2.2. Cas sans rejet 100
3.2.2.2.3. Cas où d est égal à 1 101
3.3. Extension de la notion de rejet4
3.4. Application au diagnostic7
3.4.1. Estimation de paramètres7
3.4.2. Mise en place du discriminateur9
3.5. Probabilité d'erreur 109 Table des matières 9
Chapitre 4. Discrimination non paramétrique 113
4.1. Principe de l'estimation d'une loi de probabilité
4.2. Estimateur de Parzen 116
4.2.1. Définition de l'estimateur
4.2.2. Propriétés der8
4.2.3. Choix de K(.) et de H9
p
4.2.4. Application à la discrimination entre deux classes 122
4.3. Règle des k plus proches voisins 123
4.3.1. Principe
4.3.2. Application à la discrimination sans rejet4
4.3.3. Règle du 1PPV5
4.3.4. Règle des kPPV 130
4.4. Règles des kPPV avec rejet2
4.4.1. Rejet d'ambiguïté
4.4.2. Rejet de la distance7
4.5. Choix de la distance dans la règle des kPPV 139
4.6. Amélioration de la recherche des kPPV 140
4.6.1. Recherche rapide des distances 14
4.6.1.1. Recherche rapide locale1
4.6.1.1.1. Méthode de Kittler
4.6.1.1.2.e de Yunck3
4.6.1.1.3. Méthode de Sethi
4.6.1.1.4.e de Friedman
4.6.1.2. Méthodes structurant l'ensemble d'apprentissage 145
4.6.1.2.1. Méthode de Fukunaja 14
4.6.1.2.2. Découpage récursif de l'espace 151
4.6.1.2.3. Méthode de Vidal 152
4.6.1.2.4. Algorithme de Kim7
4.6.1.2.5. Recherche de la frontière entre deux classes 16
4.6.2. Recherche rapide des kPPV par réduction du nombre de points. 161
4.6.2.1. Edition 161
4.6.2.2. Condensation5
Chapitre 5. Diagnostic par des méthodes de distance 167
5.1. Cadre du problème
5.2. Méthode paramétrique8
5.2.1. Caractérisation de l'ensemble d'apprentissage
5.2.2. Décision 169
5.2.2.1. Recherche d'une variable discriminante 16
5.2.2.2. Procédure du test 171
5.2.3. Actualisation de la connaissance2
5.2.3.1. Actualisation du nombre de classes connues 17
5.2.3.1.1. Création de classes
5.2.3.1.2. Disparition de classes3 10 Diagnostic et reconnaissance des formes
5.2.3.2. Actualisation des paramètres 174
5.2.3.2.1. Actualisation de la moyenne6
5.2.3.2.2.n de la matrice de variance-
covariance 17
5.2.4. Etude des paramètres de l'algorithme8
5.2.5. Exemple 181
5.3. Méthode non paramétrique7
5.3.1. Caractérisation de l'ensemble d'apprentissage 18
5.3.1.1. Caractérisation des points
5.3.1.1.1. Choix de la distance9
5.3.1.1.2.x du prototype 190
5.3.1.2. Caractérisation des classes
5.3.2. Décision 193
5.3.3. Mise à jour de la connaissance5
5.3.3.1. Mise à jour des paramètres 198
5.3.3.1.1. Centre de gravité
5.3.3.1.2. Matrice de variance-covariance 19
5.3.3.1.3. Seuils d'appartenance
5.3.3.2. Mise à jour du nombre de classes
5.3.4. Exemple9
5.4. Conclusion 202
Chapitre 6. Calcul direct de frontières 203
6.1. Présentation du cas linéaire
6.2. Cas d'une discrimination linéaire entre deux classes8
6.2.1. Algorithme du perceptron
6.2.2.e de relaxation 211
6.2.3. Procédure quadratique
6.2.3.1. Méthode4
6.2.3.2. Etude de cas particuliers5
6.2.4. Méthode de Ho-Kashyap8
6.2.4.1. Algorithme
6.2.4.2. Etude de la convergence 220
6.2.4.2.1. Premier résultat
6.2.4.2.2. Deuxièmet
6.2.4.2.3. Troisième résultat2
6.2.3.2.4. Quatrièmet
6.2.4.3. Autre formulation de l'algorithme 223
6.2.5. Application au diagnostic 224
6.3. Cas d'une discrimination linéaire entre plusieurs classes8
6.4. Cas de séparatrices non linéaires 23
6.5. Discrimination quadratique
6.5.1. Formulation du problème
6.5.2. Exemple sur données simulées8
6.5.3. Frontière quadratique et diagnostic 240 Table des matières 11
6.5.4. Généralisation au cas multiclasses 243
6.5.5. Introduction du rejet5
6.5.6. Etude de données réelles6
6.6. Réseaux neuromimétiques7
6.6.1. Rétropropagation du gradient 25
6.6.2. Application au diagnostic
6.6.3. Conclusion9
Chapitre 7. Prise en compte de l'évolution 261
7.1. Algorithme utilisant l'approche floue2
7.1.1. Notion de sous-ensembles flous
7.1.2. Coalescence floue 265
7.1.3. Discrimination floue6
7.1.3.1. Choix d'une fonction d'appartenance 26
7.1.3.2. Affectation d'un nouveau point
7.1.3.3. Etude des points rejetés 270
7.1.4. Exemples d'utilisation1
7.1.4.1. Données simultanées
7.1.4.2. Application pratique9
7.2. Utilisation de la géométrie de l'ensemble d'apprentissage 284
7.2.1. Fonction potentielle 28
7.2.2. Discrimination6
7.2.3. Utilisation en méthode de coalescence 288
7.3. Détection d'évolution 290
7.3.1. Utilisation du vecteur potentiel
7.3.1.1. Description des règles1
7.3.2.1. Exemple3
7.3.2. Filtre de Kalman5
7.3.2.1. Principe
7.3.2.2. Application en reconnaissance des formes 29
7.3.2.3.n en diagnostic 297
7.4. Conclusion8
Chapitre 8. Perspectives 299
8.1. Règle des plus proches voisins
8.2. Les réseaux neuromimétiques 300
8.3. La notion de métaclasse
8.4. Conclusion2
Bibliographie 303
Index 315 Préface
L'ouvrage de Monsieur Bernard Dubuisson comble les lacunes liées aux
derniers développements de la discipline de la Reconnaissance des Formes
qui est une des branches historiques de l'intelligence artificielle, puisque les
premiers ont vu le jour dans les années 1950 pour la
reconnaissance de caractères et de la parole. Il est en outre l'un des premiers
ouvrages écrits en langue française sur le sujet et traitant des applications de
la reconnaissance des formes appliquées au diagnostic industriel.
Le présent volume est le fruit de nombreuses années d'expériences
personnelles aussi bien industrielles que pédagogiques et il intègre également
les résultats d'équipes nationales et internationales. Il offre un remarquable
état de l'art des méthodes classiques et modernes de reconnaissances des
formes, appliqué au diagnostic en insistant sur les avantages et limitations
différentes méthodes.
En évitant délibérément de céder à la facilité des équations
mathématiques, l'auteur s'est attaché à expliquer les justifications théoriques
et pratiques d'une méthode plutôt que leurs réalisations pratiques
informatiques.
Il est d'une excellente pédagogie en proposant une approche graduelle de
la reconnaissance des formes, partant de la description des techniques
réduction de données aux méthodes les plus performantes de classification.
Une contribution particulièrement intéressante et originale pour le diagnostic
industriel concerne la classification avec rejet.
L'apport de cet ouvrage dans le domaine du diagnostic industriel de
pannes est majeur : il apporte des solutions efficaces pour la résolution
problèmes de diagnostic de pannes de procédés industriels. Il est certain que
sa lecture offrira des alternatives efficaces et performantes souvent délaissées
au profit de techniques plus médiatiques telles que les systèmes experts ou les
réseaux de neurones.
Deux objectifs importants sont atteints, qui s'adressent à différents
publics. Tout d'abord, nous possédons désormais là un excellent support
pédagogique au public désireux de se former aux techniques de
reconnaissances des formes. Ensuite, grâce aux exemples d'applications 14 Diagnostic et reconnaissance des formes
industrielles, ce livre répond aux attentes de nombreux responsables de
grandes et moyennes industries, concernés par la problématique du "zéro
défaut".
Cet ouvrage, couvrant simultanément la théorie et la pratique des
techniques de reconnaissance des formes, s'impose comme un
supports indispensables à toute démarche préalable en diagnostic industriel.
Gilles ZWINGELSTEIN
Directeur de recherche associé au CNRS Avant-propos
Une activité de recherche a été lancée sur le thème du diagnostic dès l'ouverture de
l'Université de Technologie de Compiègne en 1973. En 1980, dans ce même
établissement une Unité de Recherche était associée au C.N.R.S. sous le nom de
"Heuristique et Diagnostic des Systèmes Complexes" : les trois mots clefs
Heuristique,c et Systèmes Complexes en définissaient la problématique de
recherche ; le diagnostic était officiellement affiché en privilégiant une approche
originale par la reconnaissance des formes.
Le Commissariat à l'Energie Atomique par l'intermédiaire de son Centre de
Cadarache fut le premier à croire à cette approche ; il a permis de développer les
recherches, les premières thèses ont été soutenues dans le cadre de collaborations avec
cet organisme. Il n'était pas évident en 1974 que la reconnaissance des formes
pouvait être un outil puissant pour le diagnostic ; c'est tout le mérite de cet
organisme d'avoir voulu dès le départ s'associer à l'Université de Technologie de
Compiègne, puis au C.N.R.S. pour soutenir cet effort. D'autres domaines industriels
s'y sont ensuite intéressés et ont soutenu cette activité, certains sont cités, d'autres
non (le choix fut souvent arbitraire) pour éviter de surcharger l'ouvrage. Je me
permets de remercier ici ces nombreux partenaires industriels avec qui des
collaborations fructueuses pour le diagnostic de processus réels ont été menées : les
cas réels font progresser la connaissance, la variété des études a permis de définir et
de préciser l'approche conceptuelle qui fait l'objet de ce livre.
L'intérêt du monde industriel comme celui du monde de la recherche se sont
traduits d'ailleurs fort récemment par le choix du thème diagnostic comme un des
thèmes de travail du Groupement de Recherche Automatique du C.N.R.S. Ce choix
est une marque de plus de l'intérêt actuel de disposer de méthodes performantes pour
résoudre ce problème.
Ce livre rassemble de nombreux travaux de recherche effectués dans le laboratoire,
travaux concrétisés en thèses de Doctorat de troisième cycle, de Doctorat-ingénieur
et, plus récemment, de Doctorat. Ces travaux sont autant d'étapes dans l'élaboration
d'un modèle pour résoudre le problème du diagnostic par la reconnaissance des
formes. Tous les travaux des chercheurs du laboratoire ayant effectué des recherches
en diagnostic, ne sont pas cités, le choix a été guidé par une présentation voulue
pédagogique de l'ouvrage. Tout le monde sait que la démarche de recherche n'obéit
pas à un tel souci et que beaucoup de voies sont explorées avant d'aboutir à une 16 Diagnostic et reconnaissance des formes
démarche ordonnée. Je souhaite remercier ici de leurs concours, tous ces anciens
étudiants qui occupent maintenant des postes dans l'industrie ou dans l'enseignement
supérieur. Ce livre illustre l'intérêt et le plaisir que j'ai eu à travailler avec eux. La
recherche ne s'est pas arrêtée, de nouveaux étudiants sont engagés sur des thèses qui
apporteront leur pierre à la démarche diagnostic, la connaissance continue de
progresser.
Tous les logiciels évoqués dans ce livre ont été réalisés dans un standard unique
avec l'aide de E.D.F.- Etudes et Recherches. Cet ensemble de logiciels porte le nom
de REFORM : un utilisateur a ainsi accès à la plupart des méthodes de
reconnaissance des formes et leurs dérivées, il peut facilement déterminer celle qui est
la mieux adaptée à son problème. Agnès Joussellin et Francis Lefèvre (E.D.F.-
Etudes et Recherches) ont beaucoup investi dans ce projet, en particulier pour sa
définition et la coordination des membres du Laboratoire qui y ont travaillé. Merci de
leur intérêt continu.
Enfin, je ne saurais terminer ce préambule sans remercier pour leur aide et leur
soutien technique Corinne Boscolo, Nathalie Laboureur, Harry Claisse et Jean-
Claude Escande ainsi que Martine Béreau pour ses corrections pleines d'humour sur
une version de ce manuscrit. Principales notations
<x, y> : produit scalaire de x et de y
1A : matrice inverse de la matrice A
c
A :e transposée de lae A
C*: coût optimum de Bayes
C : combinaison de k éléments parmi n
n
C : coût de rejet
r
d : dimension de l'espace
d(x, y) : distance de x à y
x :dE( - y)e euclidienne de x à y
det(A), IAI : déterminant de la matrice A
x :d\i( . y) distance de Manhattan de x à y
doo(x, y) :e du max de x à y
E(.) : espérance mathématique
f(x / coi) : densité de probabilité de x dans la classe a);
f(x) : densité mélange
J : critère
K(.) : fonction noyau
Log : logarithme népérien
M : nombre de classes
m : estimateur de la moyenne, centre de gravité
A
m j : estimateur de la moyenne de la classe œ;, centre de gravité de cette classe
m : moyenne
N(m, L) : loi de Gauss multidimensionnelle de paramètres m et E
n : taille de l'échantillon
P((0;) : probabilité a priori de la classe coi
Pa :é d'acceptation
Pc : probabilité de décision correcte
Pe :é d'erreur
Pr : probabilité de rejet
tr(A) : trace de la matrice A 18 Diagnostic et reconnaissance des formes
x': voisin de x
x'i : plus proche voisin de x
x; : ième composante de x
X| : ième vecteur de l'échantillon
xjj : jième composante de x\
xP : projection de x
x : vecteur généralement de dimension d
llxll : norme de x
a : probabilité de l'erreur de première espèce
A
0 : estimateur de 9
H : fonction d'appartenance
n : potentiel
Z : matrice de variance-covariance
<fi : variance
Eb : matrice dee inter classes
E\v :e dee intra classe
a>0 : classe de rejet
coi : ième classe
V : gradient
M
X 0 : somme sur l'indice j
j=l
M
:
f i 0 produit sur l'indice j
j=l Chapitr e 1
Introduction
Le suivi de fonctionnement d'un système technologique est un enjeu industriel
majeur ; les arrêts intempestifs coûtent cher, savoir dans quel état le système se
trouve est donc particulièrement important. Si, suite à la crise de l'énergie, de
nombreuses recherches ont été menées afin de diminuer la consommation de cette
dernière, on se rend compte aujourd'hui que ces économies peuvent être largement
remises en cause par des périodes de mauvais fonctionnement. D'où actuellement un
intérêt croissant, marqué pour ce domaine du diagnostic, aussi bien dans le monde
industriel que dans celui de la recherche.
1.1 . Du diagnostic
De nombreuses définitions sont proposées pour le terme de diagnostic. Celle du
dictionnaire Robert est rigoureusement étymologique : "action de déterminer une
maladie d'après ses symptômes", elle fait référence aux origines grecques du mot. En
effet, "SiaYvaxriç" de "oiayiYVCoaKCu" (discerner) signifie "action de discerner,
action de décider, décision" et a pour racine "yvûxjiç", "connaissance, action de
reconnaître, enquête, décision", ce qui a donné en français gnosie ("perception,
connaissance"). Plutôt que de reprendre les diverses acceptions qui associent soit un
sens restrictif soit un sens très ouvert au mot, nous avons choisi de reprendre les
définitions proposées dans le cadre du groupe de travail diagnostic du Pôle
Automatisation Intégrée du Groupement de Recherche C.N.R.S. Automatique où se
réunissent industriels et chercheurs.
1.1.1 . Définitions
Commençons par le processus expérimental : le système. Un système est défini
comme un ensemble, susceptible d'évoluer dans le temps, composé d'éléments 20 Diagnostic et reconnaissance des formes
interagissant entre eux et avec l'extérieur, réunis pour assurer une mission.
N'importe quel processus technologique de fabrication, de transformation, de
transport... entre bien dans cette définition.
La mission pour laquelle le système a été conçu peut être totalement remplie,
partiellement remplie ou non remplie ; cela dépend du mode de fonctionnement sous
lequel évolue le système.
Un système présente généralement plusieurs modes de fonctionnement. On peut
observer des modes de différents types :
- modes de fonctionnement normaux qui, s'ils ne sont pas nuisibles, ne
correspondent pas forcément tous à ce que l'on attend du point de vue de la qualité de
la mission accomplie. Parmi eux, il y a le mode de fonctionnement nominal qui doit
être, en principe, en parfaite adéquation avec la qualité de la mission.
- modes de fonctionnement anormaux. Lorsque le système est gouverné par un de
ces modes, la mission peut être partiellement remplie ou non remplie ; en tout état
de cause, le service n'est pas satisfaisant, il peut aussi être critique. Ces modes
peuvent d'ailleurs être décomposés en :
- modes interdits : ce sont des modes sous lesquels le système ne doit
absolument pas fonctionner pour des raisons de sécurité, danger...
- modes défaillants qui correspondent à des mauvais fonctionnements du
système. Un sous-ensemble de ces modes est constitué des modes de pannes où un
sous-ensemble du système, voire le système complet ne fonctionne plus.
- modes dégradés qui correspondent soit à l'accomplissement partiel de la
mission, soit à l'accomplissement de celle-ci avec des performances moindres.
- modes critiques pour lesquels le système présente des caractéristiques de
fonctionnement très particulières et souvent non souhaitées.
- modes de fonctionnement d'exception qui peuvent être normaux ou anormaux
mais qui ont la caractéristique d'être peu tolérés, ou peu fréquents.
- modes d'indisponibilité sous lesquels le système ne peut accomplir sa mission.
-s de fonctionnement évolutifs qui caractérisent des modes, souvent
transitoires, de passage d'un mode à un autre quelle que soit la qualification (normal
ou anormal) du mode de départ ou du mode d'arrivée.
Bien évidemment, tous les systèmes ne présentent pas tous ces modes de
fonctionnement : cette classification qui n'est d'ailleurs pas une partition permet de
couvrir pratiquement tous les modes susceptibles de se produire et de s'adapter à la
variété des systèmes rencontrés.
Le diagnostic est, enfin, défini comme un processus à trois phases :
- détection du mode de fonctionnement,
- qualification du mode de,
- décision à partir de la reconnaissance du mode de fonctionnement.
Un système est dit diagnosticable s'il est susceptible d'être soumis à un
diagnostic, c'est-à-dire s'il est muni d'organes d'observation (capteurs) et d'un système
d'analyse pour étudier les informations fournies. La diagnosticabilité sera l'aptitude
d'un système à être diagnostiqué.
Enfin, il est souvent intéressant de pratiquer un pronostic qui est un diagnostic
prédictif : on a tout avantage à anticiper sur le fonctionnement du système et donc à Introduction 21
envisager des actions correctives avant qu'un mode non désiré ne se produise.
Effectuer un diagnostic nécessite la reconnaissance du mode de fonctionnement
d'un système, l'identification et la localisation de sa cause, et le suivi décisionnel
concernant les opérations à effectuer pour maintenir ou contrer ce mode. Une
fonction de retour du type reconfiguration peut être ajoutée : la reconfiguration
consiste à forcer le passage d'un mode à un autre à l'aide d'une modification
structurelle dans le but de continuer à accomplir la mission, même sous forme
partielle. Cette possibilité n'est pas toujours présente, elle est souvent associée aux
notions de sûreté et de sécurité.
1.1.2 . Différents types de connaissance
Le diagnostic est donc une chaîne complexe où aucune action n'est indépendante
de celle qui la précède comme de celle qui la suit. Il demande l'exploitation de toute
la connaissance "accessible" existant sur le système.
Il convient d'effectuer une distinction entre connaissance "accessible" et
connaissance "disponible". La première repose sur les instruments d'observation dont
on dispose, qu'ils agissent sur le présent ou sur le passé, c'est-à-dire qu'elle est basée
sur toute l'information que recueillent les capteurs. Le seconde concerne l'ensemble
des informations qu'on pourrait atteindre s'il n'existait aucune limitation physique ou
technologique.
Il est évident que, si on avait accès à un grand nombre d'observateurs,
indépendants ou non, susceptibles d'éclairer le présent comme le passé du système,
une opération de diagnostic pourrait être menée avec un taux d'erreur nul. Il serait
donc peut-être intéressant de préciser mathématiquement cette notion d'accessibilité
de l'information, notion qui ressemble à celle d'observabilité en automatique, mais
qui est plus complexe car il ne s'agit pas uniquement de propriétés des variables
représentant le système et son environnement, mais aussi des des modes de
fonctionnement et de leur apport informationnel. En tout état de cause, une
définition basée sur les modèles mathématiques habituellement utilisés pour les
systèmes ne suffit pas. Peut-être des recherches intéressantes sont-elles à mener, avec
pour base les concepts de la théorie de l'information de Shannon et des travaux qui en
sont issus [DUBU 85]. Cette théorie permettrait peut-être d'intégrer le concept de
"diagnosticabilité" dès la conception du système comme un critère de performance au
moins aussi important que ceux de consommation ou d'autres qui sont généralement
choisis. Une des conséquences importante serait, par exemple, le choix du nombre de
capteurs et leur répartition en vue du diagnostic. On constate en effet, souvent, qu'on
se sert pour le diagnostic de capteurs qui n'ont pas été prévus pour cette mission : la
fonction dec utilise alors des informations qui ont été pensées dans d'autres
buts et devient un sous produit du sytème d'observations, ce qui entraîne la plupart
du temps une complexification. Ce désagrément pourrait être largement diminué si
cette mission faisait partie des objectifs initiaux. Cette remarque tombe pour les
systèmes où la fonction sûreté ou la fonction sécurité sont primordiales.
En raisonnant sur la connaissance accessible, deux types de démarches sont
nécessaires pour mener une opération de diagnostic. 22 Diagnostic et reconnaissance des formes
La première repose sur le passé du système et constitue la connaissance
"globale" ou connaissance "a priori", c'est la connaissance des modes de
fonctionnement rencontrés sur le système.
Souvent le problème est simplifié en n'envisageant que deux modes : le mode
normal et un mode regroupant tous les autres, qualifié de mode "anormal". Cette
simplification peut suffire dans certains cas : elle offre l'avantage de disposer dès le
départ d'une connaissance globale complète. Elle ne suffit toutefois généralement pas
car cela revient à limiter le diagnostic à la détection, l'identification et la localisation
étant souvent impossibles dans ce cas. Cette dichotomie repose aussi sur une
hypothèse implicite rarement vérifiée : l'anormal constitue un tout, homogène,
distinct du normal. Dans beaucoup de systèmes physiques, cette homogénéité est
fausse car il n'y a aucun lien entre une défaillance pouvant conduire à l'arrêt et une
défaillance menant à un fonctionnement dégradé. Cependant, cette première démarche
pouvant suffire pour des analyses de sécurité ou des analyses préliminaires, elle est
souvent pratiquée..
Pour des analyses plus complètes, il faut donc pouvoir disposer d'une liste des
modes de fonctionnement avec leurs caractéristiques : cela suppose qu'on arrive à
bâtir cette liste de façon exhaustive avec une information suffisante. On peut avoir
recours pour cela à des méthodes d'analyse qui reposent sur la décomposition du
système en organes, le degré de décomposition étant lié à l'exhaustivité des modes.
Ces techniques qui reposent sur des représentations arborescentes (arbres de
défaillance...) ne fournissent pas la liste des modes de fonctionnement, mais lient ces
modes aux causes ; l'utilisateur doit ensuite reconstruire les modes. Ces techniques
sont essentiellement utilisées pour les modes de type panne. Une autre possibilité
est d'exploiter tout l'historique du système, que celui-ci se présente sous forme de
données accumulées ou sous forme d'expérience humaine. La liste des modes est
alors obtenue après analyse de ces données et extraction de la connaissance dont
disposent les responsables du système. Cet ensemble est donc par construction
limité à la seule connaissance issue du passé. Il ne peut être que rarement exhaustif ;
c'est bien normal puisque le nombre de modes de fonctionnement que peut présenter
un système est toujours très grand, il serait bien étrange que tous ces modes se
soient produits dans le passé. Certains modes ne sont pas désirés par l'uùlisateur qui
fait le maximum pour les éviter : il y a fort peu de chances de disposer de données
pour ces modes.
C'est donc une caractéristique essentielle des problèmes de diagnostic de devoir
raisonner avec une connaissance a priori incomplète. Les décisions ne peuvent être
prises que par rapport aux modes connus. Si on raisonne de façon simple, il suffit
donc d'associer une nouvelle observation à un des modes répertoriés ; il faut être
conscient que cette observation peut être la représentante d'un mode inconnu jusqu'à
présent, donc que l'association préconisée peut comporter un risque d'erreur. Ce point
est un point clé : un système de diagnostic doit être adaptatif, c'est-à-dire capable
d'inclure de nouveaux modes de fonctionnement dans sa connaissance a priori, au fur
et à mesure que ces modes apparaissent.
La notion d'apprentissage intervient donc : le système de détection doit être
susceptible de prendre en compte de nouveaux modes de fonctionnement auxquels on
n'avait pas pensé dans une première analyse et, donc, d'envisager de les détecter et de Introduction 23
les reconnaître. L'apprentissage est un problème difficile : il ne peut être intégré dans
l'identification et la localisation car cela supposerait que l'analyse préalable ait
envisagé cette possibilité. C'est donc uniquement au niveau de la détection que des
méthodes devront être proposées, quitte à ce que des analyses a posteriori justifient la
découverte du nouveau mode de fonctionnement mis en évidence et en précisent la
cause.
Le second type de connaissance est une connaissance qu'on peut qualifier
"instantanée". C'est l'ensemble des éléments dont on dispose à un instant donné pour
prendre une décision et l'exploiter. Cette connaissance repose sur des observations
qui peuvent être de deux types :
- observations numériques,
-s symboliques.
Les observations numériques sont basées sur l'ensemble des capteurs qui équipent
le système (connaissance "accessible"). L'opération de détection consistera à associer
la connaissance instantanée à un mode de fonctionnement. Les techniques sont très
liées à la représentation retenue pour les modes. Les modes peuvent, en effet,
bénéficier de différentes représentations : modèle mathématique de comportement,
modèle statistique, simple base de données d'historique...Les techniques proposées
pour traiter ces connaissances instantanées numériques sont, par exemple :
- méthodes de traitement de signal ( détection de sauts...),
-s basées sur des modèles analytiques (estimation, filtrage, rupture de
modèles...),
- méthodes basées sur la reconnaissance des formes.
La qualité, le caractère plus ou moins exhaustif de la connaissance a priori,
guident dans le choix parmi ces méthodes. On ne peut pas dire qu'un ensemble de
méthodes est plus performant qu'un autre : des méthodes sont simplement plus
adaptées à certaines représentations du problème que d'autres, d'où leur compétitivité
dans ce cas. Un essai comparatif est toujours intéressant mais cet essai ne devrait pas
apporter de critère permettant à l'utilisateur de choisir avec pertinence telle ou telle
approche pour résoudre son problème.
La formalisation est totalement différente dans ces trois méthodes et, en
particulier, la connaissance globale n'est pas représentée de la même façon ; cette
formalisation reste très liée au degré de connaissance a priori que l'on a du système.
Un autre critère de choix réside dans le caractère plus ou moins exhaustif de la
connaissance a priori : si l'exhaustivité est faible et que de nouveaux modes peuvent
fréquemment apparaître, il conviendra d'étudier avec soin les possibilités
d'apprentissage des différentes méthodes sur ce point.
Le deuxième type de connaissance instantanée est basé sur des observations
symboliques. A partir d'un ensemble de faits et d'une base de connaissances
préalablement établie, il s'agit d'inférer une décision. L'approche système expert est
donc la voie normale, traditionnelle maintenant, avec plusieurs problèmes qui ne
sont pas spécifiques au diagnostic :
- problème du temps réel qui suppose des décisions prises dans un temps
permettant la réaction mais qui repose sur celui de l'amélioration de la connaissance,
au fil des faits. 24 Diagnostic et reconnaissance des formes
- problème de la prise en compte du temps en tant que variable pour les systèmes
dynamiques qui entraîne qu'un fait vrai au temps t peut ne plus l'être au temps
(t + D-
Des travaux sont donc nécessaires en logique, en décompositions d'arborescences
de règles (compilation par morceaux)...
Les partisans de l'approche intelligence artificielle en diagnostic argumentent sur
le fait qu'elle répond bien à un certain nombre de problèmes soulevés : manipulation
d'une grande quantité d'informations, d'où risque d'explosion combinatoire que les
systèmes experts savent dominer, manipulation de données non homogènes,
manipulation de données dépendantes du contexte, manipulations de données
incomplètes...
Le diagnostic a été et est toujours un des domaines de prédilection pour
l'approche système expert. Souvent, toutefois, il s'agit d'un diagnostic statique sur
un système arrêté et les applications de diagnostic par système expert en dynamique
restent limitées.
Jusqu'à présent nous avons soigneusement séparé les observations numériques
des observations symboliques : il n'y a pas concurrence entre ces deux types de
données mais généralement complémentarité ou redondance à exploiter. D'ailleurs les
systèmes utilisant l'intelligence artificielle tendent actuellement vers l'intégration :
- intégration de données numériques et symboliques,
-n de techniques de raisonnement différentes,
- intégration de la notion de temps réel et du contenu temporel de l'information.
Les progrès en matière de technologie de manipulation de l'information ont donné
naissance à des systèmes de décision utilisant de façon mixte l'approche numérique,
l'approche statistique et l'approche intelligence artificielle. Dans un premier temps,
les techniques d'intelligence artificielle appliquées au diagnostic ont permis d'utiliser
un formalisme totalement nouveau. Dans un deuxième temps, ces formalismes ont
été ajoutés sans notion hiérarchique aux méthodes qualifiées par abus de langage de
plus "classiques". L'avenir réside vraisemblablement, quand c'est nécessaire, dans une
association étroite entre ces méthodes qui profite complètement des puissances de
chacune.
1.1.3 . Quelques questions
Avant de choisir une méthode l'utilisateur doit tenter de répondre à quelques
questions qui permettent de guider son choix :
- Le diagnostic est-il statique (système arrêté) ou dynamique ?
- Les données sont-elles seulement numériques, seulement symboliques, mixtes ?
- La connaissance a priori sur les modes de fonctionnement est-elle riche ou
non ?
- La prise en compte de nouveaux modes det est-elle nécessaire ?
- Peut-on se limiter à deux modes (normal et anormal) ?
- Désire-t-on faire du pronostic ?
- Veut-on suivre le système au cours du temps ou simplement reconnaître le
mode de fonctionnement ? Introduction 25
1.2 . De la reconnaissance des formes
Cet ouvrage est consacré à l'approche reconnaissance des formes du diagnostic, il
n'a pas la prétention de couvrir tout le domaine du diagnostic. La reconnaissance des
formes est un outil très puissant qui a, entre autres, la capacité d'apprentissage. Ses
performances doivent être toujours jugées comparativement à celles des autres
méthodes pour la résolution d'un problème donné.
La reconnaissance des formes est une science de définition d'algorithmes
permettant de classer des objets dont l'aspect a varié par rapport à un objet type. En
anglais, forme se dit "pattern", mot issu du latin qui a donné en français le mot
"patron", au sens de modèle et non de "boss". En fait, il s'agit de définir à quelle
forme-type une forme observée ressemble le plus. Supposons que nous ayons à
décider parmi M formes-type, qu'on pourrait aussi appeler prototypes. Pour qualifier
la variabilité qui est créée par le bruit, les erreurs du système de mesure etc., nous
m e
dirons que nous avons à décider parmi M classes notées (1)1, ©2 . •••> M - L
problème de la reconnaissance des formes est alors le suivant :
"observant une forme, trouver à quelle classe parmi (ù\,u>2, GÛM la
rattacher".
La connaissance a priori nécessaire à tout système de reconnaissance des formes
est donc une définition de la forme et des classes possibles.
Traditionnellement, on distingue deux types de reconnaissance des formes : la
reconnaissance structurelle qui s'appuie sur une représentation des formes à l'aide de
grammaires et la reconnaissance statistique qui utilise une représentation purement
numérique des formes. Cet ouvrage n'utilise que le deuxième type de reconnaissance.
En reconnaissance des formes statistique, on définit la forme par un ensemble de
d paramètres, appelés aussi caractères. Constituons un espace à l'aide d'une base dont
chaque élément est associé à un caractère ; cete est appelé espace de
d
représentation, on le note R dans le cas où les caractères peuvent prendre toute
valeur réelle. Une forme est représentée par un point dans l'espace de dimension d.
Dans la suite, nous désignerons une forme par un vecteur à d composantes noté x ;
la ième composante ou valeur du ième caractère pour cette forme est notée XJ.
Les prototypes sont donc des points représentatifs dans cet espace et le problème
est d'associer un point quelconque de cet espace à un des prototypes. Si aucune
perturbation ne marquait une nouvelle forme observée, celle-ci se confondrait dans
Rd avec un prototype et le problème de reconnaissance deviendrait trivial. A cause du
bruit, à chaque forme-type est donc associée une zone géométrique ; à chaque zone,
on associe le nom de classe. Le problème de la reconnaissance des formes est donc
l'obtention de frontières entre les classes (Fig. 1.1). Suivant sa position par rapport à
l'ensemble des frontières, un nouveau point x sera associé à une des classes parmi
toi, 0)2. • ••> WM , c'est l'opération de classification ou de discrimination.
La définition de ces frontières doit s'appuyer sur un indice de performance, qui,
tout naturellement, doit reposer sur les résultats de classification. On choisit donc la
probabilité de mauvaise classification.
En résumé, un problème de reconnaissance des formes demande :
- la définition précise des M classes entre lesquelles on va décider,
- le choix d'un espace de représentation. 26 Diagnostic et reconnaissance des formes
1*7
Fig. 1.1 Principe d'un problème de reconnaissance des formes : à quelle classe
associer l'observation x ?
Diverses méthodes d'obtention de frontières existent, dépendant du degré de
connnaissance que l'on a du problème : connaissance complète, partielle ou nulle de
la modélisation probabiliste des classes.
Avant de lier l'approche reconnaissance des formes et le diagnostic, discutons les
deux fondements d'un problème de reconnaissance des formes :
- le choix d'un espace de représentation. Ce point est très important car le choix
d'un espace influe sur la qualité du résultat Dans un espace, les classes peuvent être
mal séparées, augmentant la difficulté de discrimination ; un meilleur choix donne
des classes très distantes, ce qui ne pose aucun problème à la discrimination.
Malheureusement, il n'y a pas de règle générale pour choisir l'espace de
représentation : ce choix ne s'appuie que sur les connaissances a priori existant sur le
problème à résoudre, aucune démarche algorithmique ne permet de le formaliser.
- le nombre de classes est supposé connu au départ ; la connaissance est supposée
exhaustive, c'est-à-dire qu'il n'est pas envisagé qu'une observation puisse appartenir à
une autre classe que celles définies. Ce point marque, on le verra, une grande
différence avec ce qui peut se produire dans un problème de diagnostic.
Pour conclure cette brève introduction sur la reconnaissance des formes, il est
bon de préciser que les applications menées dans ce domaine sont nombreuses et ont Introduction 27
souvent des performances excellentes : reconnaissance de caractères, analyse
d'images, etc...
1.3. Du diagnostic et de la reconnaissance des formes
La liaison entre ces deux domaines paraît évidente une fois posée clairement la
problématique des deux domaines :
- le vecteur forme rassemble les paramètres observés sur le système, qui vont être
utilisés pour le diagnostic. Ces paramètres ont été choisis pour leur pertinence vis-à-
vis de la résolution du problème posé. Aucune méthode algorithmique n'existe qui
permette d'en régler le choix : la seule connaissance a priori que l'on a du système
permet de retenir tel jeu plutôt que tel autre. Ce vecteur sera noté en général x, il a d
composantes, chacune associée à un paramètre représentatif de l'état du système.
- les modes de fonctionnement sont représentés par les classes. La caractérisation
d'un mode det devient la caractérisation d'une classe.
Les méthodes de reconnnaissance des formes peuvent alors être employées pour
faire la détection et le schéma de la figure 1.1. est toujours valable : ayant déterminé
les frontières entre classes (modes), on sait associer une nouvelle observation x à
une de ces classes. A chaque classe, on a associé une décision et une interprétation
possible, d'où la construction complète d'un système de diagnostic.
Cependant, il reste le problème de l'ignorance de certains modes de
fonctionnement, donc de la caractéristique de nombreuses classes : les méthodes
usuelles de reconnaissance des formes utilisées en reconnaissance d'images, de
caractères doivent être adaptées à ce problème caractéristique du diagnostic. Ce
problème n'est pas usuel en reconnaissance des formes où le nombre de classes est
généralement fixé. Nous utiliserons des méthodes de décision dites avec rejet, qui
vont se révéler parfaitement aptes à prendre en compte l'ignorance au départ sur
l'existence de certaines classes. Bien évidemment, il faudra faire suivre les détections
de nouvelles classes d'un apprentissage de leurs caractéristiques pour les inclure dans
le système de détection. Un système de diagnostic basé sur l'approche reconnaissance
des formes est donc un système évolutif, capable de prendre en compte tout nouveau
phénomène se déclarant sur le processus à diagnostiquer.
La conception d'un système de diagnostic se déroule en trois phases :
- une phase d'analyse,
- une phase de choix d'un système de détection,
- une phase d'exploitation.
Le schéma général se trouve résumé sur la figure 1.2.
1.3.1. Phase d'analyse
Durant cette phase, on étudie le processus à diagnostiquer. Toute l'expérience
numérique et humaine accumulée sur les doit être étudiée. C'est une phase
très importante qu'il convient de mener avec méthode et patience : une bonne analyse 28 Diagnostic et reconnaissance des formes
expérience
vecteur
Analyse
connaissance
classes
historique
choix d'une
méthode méthode
Essais
méthode i
A
méthode h
55S55SS5 5
observation x Système
de
décision I noix d'une classe
détection de
nouvelles classes
B
Module d'adaptation
Fig. 1.2 Différentes phases d'un système de diagnostic par reconnaissance des
formes : A - élaboration (analyse et choix d'un système de décision) ;
B - exploitation

Un pour Un
Permettre à tous d'accéder à la lecture
Pour chaque accès à la bibliothèque, YouScribe donne un accès à une personne dans le besoin