Cours datamining
79 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
79 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

Université de BourgogneDESS informatiqueEXTRACTION DECONNAISSANCESAnnée universitaire 2004-20051. THéMATIQUE DU COURS1.1. PRIME DéFINITION.............................................................................. 11.2. DE L'INFORMATIQUE DE PRODUCTION àL'INFORMATIQUE DéCISIONNELLE....................................................... 11.2.1. Rationnalisation des traitements informatiques............................. 21.2.2. Mise en place d'infocentres........................... 21.2.3. Émergence de l'informatique de décision...................................... 21.3. DES DONNéES BRUTES AUX INFORMATIONS UTILESINTERPRéTéES............................................................................................. 31.3.1. Données....................... 31.3.2. Connaissances.............................................................................. 31.3.3. Extraction de connaissances......................... 31.4. FONCTIONNALITéS EXTERNES........................................................ 31.4.1. Classification................................................ 41.4.2. Estimation..................... 41.4.3. Prédiction................................ 41.4.4. Association (analyse du panier de la ménagère)............................ 41.4.5. Interprétation ................................................ 51.4.6. Révélation..................................................... 51.4.7. Regroupement.............. 51.5. FONCTIONNALITéS INTERNES.. ...

Sujets

Informations

Publié par
Nombre de lectures 89
Langue Français

Extrait

Université de Bourgogne
DESS informatique
EXTRACTION DE
CONNAISSANCES
Année universitaire 2004-20051. THéMATIQUE DU COURS
1.1. PRIME DéFINITION.............................................................................. 1
1.2. DE L'INFORMATIQUE DE PRODUCTION à
L'INFORMATIQUE DéCISIONNELLE....................................................... 1
1.2.1. Rationnalisation des traitements informatiques............................. 2
1.2.2. Mise en place d'infocentres........................... 2
1.2.3. Émergence de l'informatique de décision...................................... 2
1.3. DES DONNéES BRUTES AUX INFORMATIONS UTILES
INTERPRéTéES............................................................................................. 3
1.3.1. Données....................... 3
1.3.2. Connaissances.............................................................................. 3
1.3.3. Extraction de connaissances......................... 3
1.4. FONCTIONNALITéS EXTERNES........................................................ 3
1.4.1. Classification................................................ 4
1.4.2. Estimation..................... 4
1.4.3. Prédiction................................ 4
1.4.4. Association (analyse du panier de la ménagère)............................ 4
1.4.5. Interprétation ................................................ 5
1.4.6. Révélation..................................................... 5
1.4.7. Regroupement.............. 5
1.5. FONCTIONNALITéS INTERNES......................... 5
1.6. EXEMPLES DE DOMAINES D'APPLICATION.................................. 6
1.7. PROCESSUS DE DATA MINING........................................................ 7
1.7.1. Poser le problème......................................................................... 7
1.7.2. Recherche des données. 8
1.7.3. “Enrôlement” des données.......................................................... 8
1.7.4. Nettoyage des données................................. 8
1.7.5. Modification des données............................. 8
1.7.6. Extraction proprement dite............................................................ 8
1.7.7. Évaluation des résultats................................. 8
1.7.8. Intégration de la connaissance...................... 9
- I -2. EXTRACTION D’ASSOCIATIONS
2.1. IMPLICATIONS (NIVEAU VALEURS) ............................................... 9
2.1.1. Table de contingence de deux variables........ 9
2.1.2. Utilisation des tables de contingence............ 9
2.1.3. Définitions.................................................................................... 9
2.1.3.1. Confiance..... 10
2.1.3.2. Support........ 10
2.1.4. Rôle de la confiance et du support.............................................. 10
2.1.5. Exemple...................................................... 10
2.1.6. Limites de l’approche................................................................. 12
2.2. DéPENDANCE (NIVEAU ATTRIBUTS)............ 12
2.2.1. Dépendances fonctionnelles ....................................................... 12
2.2.2. Déterminations ........................................... 12
2.2.3. Expression générale de la relation de détermination.................... 13
2.2.4. Exemple...................................................... 13
2.2.5. Utilité des déterminations........................... 14
3. DISTANCE
3.1. DISTANCE............................................................................................ 16
3.1.1. Distance entre valeurs................................. 16
3.1.2. Distance globale ......................................... 17
3.1.3. Propriétés de la distance............................. 17
3.2. RESSEMBLANCE / SIMILITUDE...................................................... 17
3.2.1. Définition qualitative de la ressemblance .................................... 17
3.2.2. Mesure de la ressemblance entre valeurs.... 18
3.2.3. Mesure de la ressemblance globale entre objets.......................... 18
3.2.4. Calcul du meilleur couple sans calcul d’une ressemblance
globale.................................................................................................. 19
3.3. JUGEMENT DE LA RESSEMBLANCE............. 19
3.3.1. Ressemblance absolue 19
3.3.2. Ressemblance relative................................................................. 20
3.4. TECHNIQUES DE REGROUPEMENT.............. 20
3.4.1. K-moyennes............................................................................... 20
- II -3.4.2. Voisinage dense.......................................................................... 21
3.4.3. Agglomération............ 22
3.5. RECHERCHE D'INFORMATION PAR RESSEMBLANCE.............. 23
3.5.1. Quand les recherches impératives sont inadéquates.................... 23
3.5.1.1. Exemples...................................................................... 24
3.5.2. Exemple des Bases de Données textuelles.. 24
3.5.3. Exemple d'une base de données d'images... 24
4. APPRENTISSAGE ET OUTILS VOISINS
4.1. DéFINITIONS PRéLIMINAIRES........................................................ 25
4.1.1. Espace de description, descripteur, exemples positifs,
négatifs, propriétés................................................ 25
4.1.2. Objet concret / abstrait................................................................ 25
4.1.3. Description d'un objet. 25
4.1.4. Concept / classe.......... 26
4.1.5. Définition intensive ou intension ................................................ 26
4.1.6. Définition extensive ou extension............... 26
4.2. LES TROIS FAMILLES DE RAISONNEMENTS HUMAINS.......... 26
4.2.1. Fiabilité d'un raisonnement......................................................... 27
4.2.1.1. Validité......................................................................... 27
4.2.1.2. Pertinence..... 28
4.2.2. Rôle informatique des différents raisonnements......................... 29
4.2.2.1. Preuve, Argumentation ................................................. 29
4.2.2.2. Heuristique................................... 29
4.2.2.3. Créativité, imagination.................. 29
4.2.2.4. fi Transfert de niveau de connaissances....................... 29
4.2.3. Le raisonnement étalon : la déduction......................................... 30
4.2.3.1. Sémantique de la déduction.......... 30
4.2.3.2. Règles d'inférence ........................................................ 31
Modus Ponens............................ 31
Modus Tollens 31
4.2.4. Le raisonnement analogique ....................................................... 31
4.2.4.1. Inférence analogique.................... 31
4.2.4.2. Quand l’analogie devient valide.................................... 32
Dépendance forte......................................................... 32
Relation de détermination............ 32
- III -Détermination et dépendance fonctionnelle.................. 33
4.2.4.3. Qualité du raisonnement analogique............................. 34
Qualité de la validité..................................................... 34
Possibilité d’utiliser les relations de
détermination............................... 34
4.2.5. Le raisonnement inductif ............................................................ 36
4.2.5.1. Induction abductive...................... 36
Inférence...................................... 36
Qualité......................................... 36
4.2.5.2. Induction par généralisation......... 37
Inférence...................................... 37
Qualité......................................... 38
4.2.5.3. Induction par orientation des concepts ......................... 38
Inférence...................................... 38
Qualité......................................... 38
4.3. TYPES D'APPRENTISSAGES............................. 38
4.3.1. Apprentissage non supervisé  ..................................................... 38
4.3.2. Apprentissage supervisé 39
4.3.3. Apprentissage semi-supervisé (par renforcement) ...................... 39
4.3.4. Apprentissage à partir d'exemples............................................... 39
4.3.4.1. Hypothèse de l'apprentissage à partir
d'exemples................................................. 39
4.3.4.2. Paradigme de l'apprentissage à partir
d'exemples................................................. 39
4.3.5. Apprentissage incrémental.......................... 40
4.3.6. Apprentissage à partir d'un nombre réduit d'exemples................ 41
4.3.6.1. Exemple ....................................................................... 41
Théorie du monde........................ 41
Définition du concept but............ 42
Description de l'exemple.............................................. 42
Critère d'opérationalité................. 42
Preuve...................

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents