La lecture à portée de main
Description
Sujets
Informations
Publié par | bomel |
Nombre de lectures | 2 484 |
Poids de l'ouvrage | 2 Mo |
Extrait
Rapport de Stage
« Étude pour l’accélération du code de calcul parallèle elsA à l’aide de
processeurs graphiques (GPU). »
Université Pierre et Marie Curie
Paris VI
Master de Mathématiques et Applications
Spécialité : Mathématiques de la Modélisation
Parcours: Mathématiques & Informatique
Année 2008/2009
Florent Dahm
1Table des matières
I. Cadre du stage.................................................................................................................................................. ..........3
1. L'entreprise...................................................................................................................................... .....................3
2. Contexte du stage...................................................................................................................... ...........................4
3. Mission et déroulement......................................................................................................................... ...............4
II. Nvidia Cuda et le GPU T10..................................................................................................................................... .5
1. Architecture.................................................................................................................................. ........................5
a) Modèle d'organisation des threads................................................................................................... ...............6
b) Organisation hiérarchique de la mémoire............................................................................................ ...........7
2. Modèle de programmation..................................................................................................................... ..............9
a) Kernels et threads.............................................................................................................................. ..............9
b) Utilisation de la mémoire.................................................................................................................. ............10
c) Compilation, exécution et performance................................................................................... .....................11
3. Premiers essais.................................................................................................................................................... 13
III. Analyse du code elsA.......................................................................................................................... ..................14
1. Présentation du code............................................................................................................................... ............14
a) Historique ............................14
b) Architecture générale.............................................................................................................. ......................15
c) Cas tests utilisés......................................................................................................................................... ....15
2. Profiling ............................................................................................................................................ .................17
3. Analyse du profiling et sélection des noyaux à porter.............................................................................. .........20
IV. Portage sur GPU des routines et résultats......................................................................................... ....................21
1. Calcul de distance................................................................................................................................. ..............21
a) Schéma algorithmique......................................................................................................................... ..........21
b) Validation du calcul et premiers résultats........................................................................................... ..........22
c) Optimisation et relevé de performance.......................................................................................... ...............23
2. Calcul de flux.................................................................................................................................... .................25
a) Schéma algorithmique................................................................................................................................ ...25
b) Vérifications des calculs et premières mesures.................................................................................. ..........25
c) Améliorations et analyse des performances.............................................................................................. ....26
V. Conclusion.......................................................................................................................................... ....................29
ANNEXE A: Rapport d'installation............................................................................. ..30
ANNEXE B: Modifications apportées au code elsA....................................................32
BIBLIOGRAPHIE...................................................................................... ...................33
2I. Cadre du stage
1. L'entreprise
J'ai été accueilli du 9 mars au10 juillet 2009 au sein de département « Systèmes Haute Performance » de CS, sous la
tutelle de François Roudot.
CS, Communication & Systèmes, est une SSII qui travaille essentiellement sur des projets sensibles et complexes.
CS s'appuie sur ses centres d'excellence technologique pour répondre aux enjeux de ses clients : Simulation et réalité
virtuelle, systèmes embarqués, sécurité des systèmes d'information, sûreté et continuité de fonctionnement, systèmes
d'information techniques (PLM, GED, SIG…), qualification logicielle, logiciels libres, génie logiciel et système...
Ces centres d'excellence technologique permettent à CS d'apporter à ses clients des systèmes clés en main innovants
et d'assurer la performance et la pérennité des systèmes et des infrastructures critiques.
Intégrateur de solutions clés en main, CS poursuit activement le développement de produits matures à forte valeur
ajoutée, pouvant facilement s'intégrer dans des solutions complètes.
Illustration 1: Chiffres clés CS
La simulation fait partie des technologies clé éminemment transverses. Aussi, CS développe des programmes de
simulation pour des secteurs très variés comme l’aéronautique, le spatial, l’énergie, la défense, l’automobile, la
météorologie, la gestion des risques liés aux catastrophes naturelles, terroristes, …
Dans ce contexte, le calcul haute performance a pour but la résolution de problèmes industriels colossaux en
s'appuyant sur des technologies de plus en plus avancées, tant du point de vue théoriques avec des modélisations
mathématiques fines, que de celui des moyens informatiques mis en œuvre, impliquant des clusters de calculs comportant
des