PLANIFICATION
EXPERIENCES
(http://genome.jouy.inra.fr/ssb/)
PRE−TRAITEMENT /
NORMALISATION
CLASSIFICATION
(http://migale.jouy.inra.fr/formations)
)
)
Expérience
8600 gènes humains,
mesures d’expression sur
échantillons
de fibroblastes en fonction du temps.
Méthode de classification hiérarchique
métrique = coeff. de corrélation,
méthode d’agrégation = lien moyen
(average linkage).
ref : Cluster analysis and display of genome wide expression patterns, Eisen et al, PNAS 98
(x;y) E E
+s : E E7!R
s(x;y) =s(y;x)
s(x;x) =s(y;y) =s x;y E x =ymax
+
d : E E7!R
d(x;y) =d(y;x)
vd(x;x) =d(y;y) = 0 x;y E x =y u n
uX
t 2d(x;y) = (x y )s d i i
i=1
d(x;y) =s s(x;y)max
nX
d(x;y) = jx yji i
i=1
Pn
xyi ii=1d(x;y) = 1 q q
P Pn n2 2x yi=1 i i=1 i
2d(x;y) = 1 r(x;y) 1 r(x;y)
Pn
(x x )(y y )i i i ii=1r(x;y) =p pP Pn n2 2(x x ) (y y )i i i ii=1 i=1
q
k
q
G1 G2 G3 G4 G5
E d
+d :E E7!R
d(x;y) = 0 x =y
d(x;y) =d(y;x) * *
**d(x;y) d(x;z) +d(y;z) **Classe A *
d(x;y)5
*
maxd(x;z);d(y;z) ()
Classe B
* *
**
**Classe A *
C CK L
* X(C ) (C )K L 2D(C ;C ) = (G G )K L K Li iClasse B (C ) + (C )K L
i
GKi
CK
complete single
mat.d mat.d
hclust (*, "complete") hclust (*, "single")g1
average ward
g2
g3
g4
g5
(n 1)2
Height
Height
0
2
4
6
8
0
2
4
6
8
10
g5
g5
g4
g1
g3
g2
g1
g3
g2
g4
Height
Height
0
2
4
6
8
10
12
1