Ordonnancement hybride statique-dynamique en algèbre linéaire creuse pour de grands clusters de machines NUMA et multi-coeurs

De
Publié par

Sous la direction de Raymond Namyst, Jean Roman
Thèse soutenue le 07 décembre 2009: Bordeaux 1
Les nouvelles architectures de calcul intensif intègrent de plus en plus de microprocesseurs qui eux-mêmes intègrent un nombre croissant de cœurs de calcul. Cette multiplication des unités de calcul dans les architectures ont fait apparaître des topologies fortement hiérarchiques. Ces architectures sont dites NUMA. Les algorithmes de simulation numérique et les solveurs de systèmes linéaires qui en sont une brique de base doivent s'adapter à ces nouvelles architectures dont les accès mémoire sont dissymétriques. Nous proposons dans cette thèse d'introduire un ordonnancement dynamique adapté aux architectures NUMA dans le solveur PaStiX. Les structures de données du solveur, ainsi que les schémas de communication ont dû être modifiés pour répondre aux besoins de ces architectures et de l'ordonnancement dynamique. Nous nous sommes également intéressés à l'adaptation dynamique du grain de calcul pour exploiter au mieux les architectures multi-cœurs et la mémoire partagée. Ces développements sont ensuite validés sur un ensemble de cas tests sur différentes architectures.
-Parallélisme
-Architectures NUMA
-Ordonnancement dynamique
-Systèmes linéaires creux
-Méthodes directes
New supercomputers incorporate many microprocessors which include themselves one or many computational cores. These new architectures induce strongly hierarchical topologies. These are called NUMA architectures. Sparse direct solvers are a basic building block of many numerical simulation algorithms. They need to be adapted to these new architectures with Non Uniform Memory Accesses. We propose to introduce a dynamic scheduling designed for NUMA architectures in the PaStiX solver. The data structures of the solver, as well as the patterns of communication have been modified to meet the needs of these architectures and dynamic scheduling. We are also interested in the dynamic adaptation of the computation grain to use efficiently multi-core architectures and shared memory. Experiments on several numerical test cases will be presented to prove the efficiency of the approach on different architectures.
-Parallelism
-Dynamic scheduling
-Sparse direct solver
-Sparse linear system
-NUMA architectures
Source: http://www.theses.fr/2009BOR13922/document
Publié le : vendredi 28 octobre 2011
Lecture(s) : 41
Tags :
Nombre de pages : 117
Voir plus Voir moins

Š
Z
z

v



k

c

p

Ÿ

v

i

z

R



š

k

Z



}

w

[







W

d

i



ˆ

z

[









k

o

q







k


!

"
¨






#
{

e
$


g

Œ
%
g
&

'



(

&
x
%



&



)
k
'
k


(


£
*

)


{
+
k


*
n
)
r


,
{
-

.




u

y

|
(

/

,


h
0
š
&
q

¬
*

)


¯
,
ƒ
-

.





1
ˆ
2

3
V
4
Œ
5
f
6
R
7
U
8
U
9:

#


X

z


;


[


&

.


{
&

<
Z



i


,
˜

ƒ
'



=


k
)
k
(


p
(


i

l
"

>
¡

¤

w









ˆ
%

,
p
)

'
i
,
l

k

p
?
t
,
x


0
z
&
j


*
~
)
¥


,
h
-
¦
.


˜
"

@
q
A

B
p
C

C

4
œ
C

D

8

E
q
8
j
C
ª
5
ƒ
6
y
F

G

@

7
p
A

8

H
©
5
®
4

5

7

I
k
9

8

J

A
[
F

C
[
4

E

7

I
Š
9
U
8
d
8
T
C
d
4
R
K

L
c
M
f
G
V
@
Ž
8

K

7
V
C
R
N
`
4
c
7
U
@
U
8
h
D

@
[
8

9
u
H

8
p
O

B

9
z
@

A

8
[
L

@
[
4

C

A

H
Š
D

K
q
9

H
l
5
h
8
}
@
p
H

A
v
8

E
u
4

D

6

7

C
z
8
{
H





3

#
[
8

5
œ
E
\
9
l
K

5
z
7
h
J
j
D
k
P
m
9
ž
@
q
H
 
Q
¢
R

S
¤
T
ƒ
U

V
k
S

U

W

U
[
X

Y
[


Z

[


Š
\
œ
]
\

l

z
^
h
^
j

k
_
m
`

a
l
b

c
q
d
s
e
u
f
w
c

g
y
U
q
c

a

d
|
`
n
`

R
l
a
]
T

U
k
S
¥
a

c

X

h
i
i
k
j
\

l
k
§
l
š
m

n
x


k

l
q
o
z

{
p
l
q
ž
r

s
¨
t

u

v
z
w

x
p




y
z


q

q
©


z
i


{
l
|
«
j
u
n
x
}




q
l
z

{
]
ˆ
~



h

i

n
[


Z



Z


q
p
­
[
®


€/





^


%









3







%



6



%

























R

%













/

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.

Diffusez cette publication

Vous aimerez aussi