Analyse des performances dans les Analyse des performances ...

De
Publié par

A
A
n
a
l
y
s
s
e

d
e
s
s

p
e
r
f
f
o
o
r
m
a
a
n
n
c
e
s


d
d
a
n
s


l
l
e
s

s
y
s
t
t
è
è
m
e
s
s


i
n
t
é
g
g
r
é
s

m
m
u
l
t
i
-
-
c
c
œ
u
r
r
s
s

B
e
n
S
S
a
a
l
l
m
a

S
A
N
N
A

E
n
c
c
a
a
d
r
é

p
a
r
r
:
:
F
o
u
r
n
n
e
e
l

N
i
c
o
l
l
a
a
s
P
é
t
r
o
o
t
t
F
r
é
d
é
r
r
i
i
c
c
1 Int
r
o
d
d
uc
t
i
i
o
o
n
Év
o
l
ut
i
i
o
o
n
d
e
s


m
m
i
c
r
o
pr
o
o
c
c
e
s
s
e
ur
s
s
:
:

A
ug
m
m
m
m
e
nt
a
t
i
o
o
o
o
n
n
n
n
d
e

l
a

pui
pui
pui
pui
s
s
a
nc
e




e
e
e
e
n
é
l
e
v
a
a
a
a
nt
nt
nt
nt

l
a

fr
é
que
nc
nc
e

d
e


c
c
a
a
l
c
ul


A
t
t
t
e
e
i
nt
e

d
e
s
s


l
l
i
m
i
t
e
s

A
ug
m
m
e
nt
a
t
i
o
o
n
n
d
u
no
m
m
br
br
e

d
e
s
s


pr
pr
o
c
e
s
s
e
e
ur
ur
s

A
r
r
i
i
v
v
é
é
e

d
e
s


s
s
y
y
s
t
è
m
e
s
s


i
i
nt
nt
é
g
r
é
s
s


m
m
ul
t
i
-
c
œ
œ
ur
ur
s


2 Q
u

e
e
s
s
t

c
e

q
q
u
u

u
n

b
b
e
e
n
c
h
m
a
a
r
k
?

P
o
i
nt

d
e

r
é

r
e
nc
e


e
xpl
o
r
a
t
i
o
n
d
u
d
e
s
i
g
ns

Ex
e
m
pl
e
s

d
e

be
nc
hm
a
r
k
s
:

F
l
o
ps
,

W
he
t
s
t
o
ne
,

S
pl
a
s
h2,

P
A
R
S
E
C
«
T
he

P
r
i
nc
e
t
o
n
A
ppl
i
c
a
t
i
o
n
R
e
po
s
i
t
o
r
y

f
o
r

S
ha
r
e
d

M
e
m
o
r
y

C
o
m
put
e
r
s
»

V
i
s
é
s

po
ur

l
e
s

puc
e
s

m
ul
t
i
pr
o
c
e
s
s
e
ur
s

U
t
i
l
e
s

po
ur

l
a

r
e
c
he
r
c
he

f
o
nc
t
i
o
nne
nt

s
ur

pl
us
i
e
ur
s

pl
a
t
e
f
o
r
m
e
s

(
i
386,

x86
_
64,
...
Voir plus Voir moins
Analyse des performances dans les systèmes intégrés multi-urs Ben Salma SANA Encadré par:Fournel NicolasPétrotFrédéric1
IntroductionÉvolution des microprocesseurs:Augmentation de la puissance en élevant la fréquence de calcul Atteinte des limitesAugmentation du nombre des processeursArrivée des systèmes intégrés multi-cœurs  2
Qu’est ce qu’un benchmark?Point de référence exploration du designsExemples de benchmarks: Flops, Whetstone, Splash2, PARSEC«The Princeton Application Repository for Shared Memory Computers»•Visés pour les puces multiprocesseurs•Utiles pour la recherche•fonctionnent sur plusieurs plateformes (i386, x86_64, Sparc)3
objectifs-Adapter les benchmarks Parsec à des architectures présentes dans les systèmes embarqués ARM -Analyser les performances du système intégré simulé. 4
Etapes du projet:-Compilation et simuler les Parsec sur la machine locale -Compilation croie pour ARM-Simulation des benchmarks sur la machine ARM-Analyse des résultats5
ParsecComposés de 9 applications et 3 noyaux:-9 applications: blackscholes, bodytrack, facesim, ferret, fluidanimate, freqmine, swaptions.-3 noyaux: canneal, dedup, streamcluster-diversité des domaines: finance,  visualisation, animation… -différents types de parallélisme: pipline, parallélisme de données6
Compilation des Parsec sur la machine localeIl s’agit d’une machine Intel: Ordinateur classique:tuB-prendre en main les Parsec-pour avoir un point de repère pour la comparaison7
Plateforme viséeplateforme virtuelle «LOMOSA »développée au sein d’un projet européen8
Compilation croisée pour ARMQu’est ce que La Compilation Croisée ?Un compilateur croisé cross compilerest capable de traduireun code source en code objetayant un environnement d’exécution différent de celui où la compilation est effectuée.9
Black scholesPermet de calculer la valeur d’une option européenne analytiquement avec le modèle d'équations différentielles partiellesBlack Scholes.-Modèle de parallélisme: parallélisme de données. 01
Simulation sur machine locale et ARMEntrée:nombre de threads, numOptionSortie du benchmarks:Sizeof data = numOptions*(sizeof(optionData)+sizeof(int))Pour numOption=300 ; nthreads= 4Machine locale LomosaPARSEC Benchmark Suite Version 2.0PARSEC Benchmark Suite Version 2.0NNuumm  ooff  ROupntis:o 1n0s: 0300NNuumm  ooff  ROupntis:o 1n0s: 0300Size of data: 12000Size of data: 1320011
Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.