Traitement de données numériques par analyse formelle de concepts et structures de patrons, Mining numerical data with formal concept analysis and pattern structures
135 pages
English

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Traitement de données numériques par analyse formelle de concepts et structures de patrons, Mining numerical data with formal concept analysis and pattern structures

-

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
135 pages
English
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Sous la direction de Amedeo Napoli
Thèse soutenue le 22 avril 2011: Nancy 1
Le sujet principal de cette thèse porte sur la fouille de données numériques et plus particulièrement de données d'expression de gènes. Ces données caractérisent le comportement de gènes dans diverses situations biologiques (temps, cellule, etc.). Un problème important consiste à établir des groupes de gènes partageant un même comportement biologique. Cela permet d'identifier les gènes actifs lors d'un processus biologique, comme par exemple les gènes actifs lors de la défense d'un organisme face à une attaque. Le cadre de la thèse s'inscrit donc dans celui de l'extraction de connaissances à partir de données biologiques. Nous nous proposons d'étudier comment la méthode de classification conceptuelle qu'est l'analyse formelle de concepts (AFC) peut répondre au problème d'extraction de familles de gènes. Pour cela, nous avons développé et expérimenté diverses méthodes originales en nous appuyant sur une extension peu explorée de l'AFC : les structures de patrons. Plus précisément, nous montrons comment construire un treillis de concepts synthétisant des familles de gènes à comportement similaire. L'originalité de ce travail est (i) de construire un treillis de concepts sans discrétisation préalable des données de manière efficace, (ii) d'introduire une relation de similarité entres les gènes et (iii) de proposer des ensembles minimaux de conditions nécessaires et suffisantes expliquant les regroupements formés. Les résultats de ces travaux nous amènent également à montrer comment les structures de patrons peuvent améliorer la prise de décision quant à la dangerosité de pratiques agricoles dans le vaste domaine de la fusion d'information
-Découverte de connaissances
-Analyse formelle de concepts
-Extraction de motifs numériques
-Bi-clustering
-Fusion d'information
The main topic of this thesis addresses the important problem of mining numerical data, and especially gene expression data. These data characterize the behaviour of thousand of genes in various biological situations (time, cell, etc.).A difficult task consists in clustering genes to obtain classes of genes with similar behaviour, supposed to be involved together within a biological process.Accordingly, we are interested in designing and comparing methods in the field of knowledge discovery from biological data. We propose to study how the conceptual classification method called Formal Concept Analysis (FCA) can handle the problem of extracting interesting classes of genes. For this purpose, we have designed and experimented several original methods based on an extension of FCA called pattern structures. Furthermore, we show that these methods can enhance decision making in agronomy and crop sanity in the vast formal domain of information fusion
-Knowledge discovery in databases
-Formal concept analysis
-Numerical pattern mining
-Biclustering
-Information fusion
Source: http://www.theses.fr/2011NAN10015/document

Informations

Publié par
Nombre de lectures 21
Langue English
Poids de l'ouvrage 2 Mo

Extrait




AVERTISSEMENT

Ce document est le fruit d'un long travail approuvé par le
jury de soutenance et mis à disposition de l'ensemble de la
communauté universitaire élargie.

Il est soumis à la propriété intellectuelle de l'auteur. Ceci
implique une obligation de citation et de référencement lors
de l’utilisation de ce document.

D’autre part, toute contrefaçon, plagiat, reproduction
illicite encourt une poursuite pénale.


➢ Contact SCD Nancy 1 : theses.sciences@scd.uhp-nancy.fr




LIENS


Code de la Propriété Intellectuelle. articles L 122. 4
Code de la Propriété Intellectuelle. articles L 335.2- L 335.10
http://www.cfcopies.com/V2/leg/leg_droi.php
http://www.culture.gouv.fr/culture/infos-pratiques/droits/protection.htm ´D´epartement de formation doctorale en informatique Ecole doctorale IAEM Lorraine
UFR Sciences & Technologies
Traitement de donn´ees num´eriques par analyse
formelle de concepts et structures de patrons
`THESE
pr´esent´ee et soutenue publiquement le 22 Avril 2011
pour l’obtention du
Doctorat de l’universit´e Henri Poincar´e – Nancy 1
(sp´ecialit´e informatique)
par
Mehdi Kaytoue
Composition du jury
Rapporteurs : Pr. Jean-Fran¸cois BOULICAUT – Universit´e de Lyon
Pr. Bernhard GANTER – Technische Universita¨t Dresden (Allemagne)
Examinateurs : Dr. S´ebastien DUPLESSIS – Charg´e de recherche INRA
Pr. Bernard GIRAU – Universit´e Henri Poincar´e (Nancy 1)
Pr. Sergei O. KUZNETSOV – Higher School of Economics (Moscou – Russie)
Dr. Amedeo NAPOLI – Directeur de recherche CNRS
Pr. C´eline ROUVEIROL – Universit´e Paris-Nord
Laboratoire Lorrain de Recherche en Informatique et ses Applications — UMR 7503Mis

la
en
thloria.
page
avecV
les
Il
Remerciemen
our
ts
tel
Je
p
remercie
Merci
en
remercie
premier
de
lieu
d'autres
Jean-F
parti
rançois
de
Boulicaut,

Professeur
brigade
à
bres
l'Univ
la
ersité
dans
de
es
Ly
fond
on,

et
tre
Bern-
ne
hard
le
Gan
lab
ter,
d'autres
Professeur
est
à
mem
la
pas
T
j'en
ec
Univ

t
he

Univ
otre
ersität
suis
de
T
Dresden,
voile,
d'a
é
v
t
oir

tous
merv
deux
don

vie.
d'être
et
rapp
ne
orteurs
t.
de
o


mémoire.
Je
Leur
LORIA/INRIA,

j'ai
et
et
exp
tral
ertise
plus
on
e
t
la
été
mon
une
ils
aide
remercie
précieuse
mathématiques
et

un
étudian
honneur.
b
Je
t
les
Merci
remercie
otre
particulièremen
toujours
t
tan
d'a
marin,
v
fantaisie
oir
pr
p
vent
orté
e
un
ène
regard

profond
÷ur.
et
sur
atten
De
tionné
de
sur
t

souv
man
des

la
malgré
hange
les
u
délais

serrés
liste.
et
eux,
leurs
eux,

ou
hes
azie
professionnelles
me
resp
La
ectiv
thèse
es.
vie
Je

remercie
ainsi
aussi
bres
Céline
l'INRA,
Rouv
oratoires,
eirol,
tré.
Professeur
de
à
diéren
l'Univ
pilier
ersité
l'épanouissemen
P
tous,
aris-Nord,
t
et
de
Bernard
À
Girau,
ternationale
Pro-
Je
fesseur

à
ylo
l'Univ
nommer
ersité

Nancy
sûr.
1
les
p
UFR
our
informatique
leur
de
participation
enseigné.
au
t
jury
qui
de
xalemen
thèse,
appris
l'in
de
térêt
surtout
qu'ils
dernier
on
ma
t

p
t,
orté
m'on
à
et

t
tra
qu'individu.
v
piètr
ail
gr
et
que
les
erne
div
le
erses
brisant
discussions
tel
qui
oussant
on
un
t
me
suivies.
la
Sergei
me
Olego
onforte,


h
mon
Kuznetso
en
v,
aussi
mathématicien
bien
à
sujets).
Moscou,
ton
a
t,
été
ta
un
resteron

de
orateur
eilleux
de
enirs.

est
hoix
gens
de
t
nom-
rencon
breux

tra
une
v
T
aux
fais
présen
de
tés

dans
précieuse

Je
man
p

ni
Sa
v
vision
expliquer
mathématique,
ourquoi
son

esprit
Gr

mil
sur
A
les
de
problèmes
.
p
préparation
osés

et
s'est
la
d'une
manière
de
formelle
oratoire
de
he.
les
remercie
résoudre
tous
en
mem
on
du
t
de
donné
et
une
lab
toute
que
autre
rencon-
dimension
Cette
que
hesse
je

me
d'opinions
suis
tes

le
de

suivre.
de
P
t.
our
à
toutes
et
nos
particulièremen
réunions
aux
de
bres
tra
l'équip
v
Orpailleur.
ail
la
(et
in-
autres
de
momen
science.
ts),
n'ai
à
assez
Moscou,
à
Nancy
st
,
p
Darmstadt,
les

tous,

se

t
j'adresse
suis
mon
Je
profond
aussi
resp
mem
ect
des
et
de
mes
et
remer-
des

ersités
ts
Nancy
les
j'ai
plus
Je
sincères.
égalemen
Sp
les
acib
ts
o
m'on
.
parado
L'étude
t
du
eaucoup
viv
sur
an
science
t,
l'enseignemen
particulièremen
(même
t
!
de
du

rang).
p
à
etits
famille.

otre
hampignons
v
qui

jouen
v
t

un
t
rôle
aidé
si
guidé
imp

ortan
en
t
t
dans
Je
nos
un
forêts,
e
est
au
une
é
science
vagues
passionnan
ma
te.
disc
Merci
mal.
Sébastien
el
d'a
la
v
oue
oir

partagé
vagues,
ta
le
passion,
p
merci
ma
p
tel
our
phar

qui
longues
guide,
discussions
le
(bien
sir
souv
qui
en
r
t

dev
Béné
an
mer
t
du
le
de
LORIA


i
souviiablo
des
que
Les
onses.
o
iii
rdinateurs
donner
sont
rép
inutiles.
(P
Ils

ne
saventiv.
.
5
able
terv
of
pattern
Con
.
ten
.
ts
.
1
formal
In
hes
tro
.

v
1
.
1
.
Conceptual
.
kno

wledge
.
disco
.
v
.
ery
.
in
.
databases
.
.
.
.
.
.
F
.
.
.
.
.
.
.
.
.
.
.
patterns
.
.
.
.
.
31
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
Discussion
2
.
Gene
.
expression
y
data
.
analysis
.
.
.
.
y
.
.
.
terv
.
.
.
50
.
.
.
o
.
.
.
.
.
.
.
.
.
Mining
.
31
.
.
.
.
.
.
.
.
.
.
.
al
.
.
.
.
.
.
.
terv
.
.
.
.
.
.
.
Comparing
.
.
3
.
3
.
Con
.
tributions
ts
and
.

.
of
.
the
.
thesis
.
.
.
.
.
.
.
.
.
.
tro
.
w
.<

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents