Calcul parallèle sur processeurs GPU
41 pages
Français

Calcul parallèle sur processeurs GPU

-

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
41 pages
Français
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

Calcul parallele sur processeurs GPU Nicolas GAC Maitre de Conference - Universite Paris Sud 11 Laboratoire des Signaux et Systemes (L2S) Cours a l'ESIEE Paris 5ieme annee - Majeure Informatique 19 septembre 2011
  • parallelisation sur machines multi-processeurs ò
  • efficace sur machine
  • vertex shader
  • device architecture
  • architecture des processeurs graphiques
  • cuda
  • cuda exemples du sdk de cuda gpu
  • esiee paris
  • puissance de calcul

Sujets

Informations

Publié par
Nombre de lectures 234
Langue Français
Poids de l'ouvrage 1 Mo

Extrait

Calcul parallele sur processeurs GPU
Nicolas GAC
Maitre de Conference - Universite Paris Sud 11
Laboratoire des Signaux et Systemes (L2S)
Cours a l’ESIEE Paris
5ieme annee - Majeure Informatique
19 septembre 2011Architecture des processeurs graphiques
Programmation sous CUDA
Exemples du SDK deA
1 Architecture des processeurs graphiques
GPU : Graphic Processing Unit
Avant CUDA/
Apres CUDA,
2 Programmation sous CUDA
Principes generaux
Multiplication de matrices
3 Exemples du SDK de CUDA
2/41
2/41Architecture des processeurs graphiques GPU : Graphic Processing Unit
Programmation sous CUDA Avant CUDA : pipeline graphique
Exemples du SDK deA Apres CUDA : plein de threads !
1 Architecture des processeurs graphiques
GPU : Graphic Processing Unit
Avant CUDA/
Apres CUDA,
2 Programmation sous CUDA
3 Exemples du SDK de CUDA
3/41
3/41Architecture des processeurs graphiques GPU : Graphic Processing Unit
Programmation sous CUDA Avant CUDA : pipeline graphique
Exemples du SDK deA Apres CUDA : plein de threads !
Calcul haute performance
High Performance Computing (HPC)
Parallelisation sur machines multi-processeurs
ò E cace sur machine a memoire distribuee
Noeuds de calculs performants
ò processeurs multi-core, many-core ou FPGA/ASIC
Intel Nehalem (4 coeurs)
Carte de developpement Avnet
PCI
SDRAM PLB
Pont
PCI 32 SRAM
32
Switch Virtex II Pro Cache
3D−AP
Ctl Ctl Ctl
BRAM
Interupt SRAM SDRAM
OPB PLB
Cache Cache
32 64
3D−AP 3D−AP
CacheUART
IOCM PPC DOCM 3D−AP Rétro Rétro
3D 3D
Rétro 3D
IBM Cell (8+1 coeurs) Nvidia GTX 200 (240 coeurs)
SoPC (prototypage) 4/41
4/41Architecture des processeurs graphiques GPU : Graphic Processing Unit
Programmation sous CUDA Avant CUDA : pipeline graphique
Exemples du SDK deA Apres CUDA : plein de threads !
GPU : Graphic Processing Unit
Evolution vers une architecture many core
A l’origine, a dediee pour le rendu de volume
ò Pipeline graphique (prog. en OpenGL/Cg)
Depuis 2006, architecture adaptee a la parallelisation de divers
calculs scienti ques
ò CUDA : Common Uni ed Device Architecure (prog. en C)
5/41
5/41Architecture des processeurs graphiques GPU : Graphic Processing Unit
Programmation sous CUDA Avant CUDA : pipeline graphique
Exemples du SDK deA Apres CUDA : plein de threads !
Puissance de calcul
6/41
6/41Architecture des processeurs graphiques GPU : Graphic Processing Unit
Programmation sous CUDA Avant CUDA : pipeline graphique
Exemples du SDK deA Apres CUDA : plein de threads !
Debit memoire
7/41
7/41Architecture des processeurs graphiques GPU : Graphic Processing Unit
Programmation sous CUDA Avant CUDA : pipeline graphique
Exemples du SDK deA Apres CUDA : plein de threads !
Avant CUDA : pipeline graphique
Vertex
Shader
Transformation
geometrique
Rasterization
Polygon >
Fragments
Fragment
Shader
Calcul sur lessource : [?]
Pixels
8/41
8/41Architecture des processeurs graphiques GPU : Graphic Processing Unit
Programmation sous CUDA Avant CUDA : pipeline graphique
Exemples du SDK deA Apres CUDA : plein de threads !
Apres CUDA : plein de threads !
CUDA : Common Uni ed Device Architecture
Vertex shader + Fragment shader = Streams Processors (SPs)
ò Le GPU devient un processeur \many cores"
Jusqu’a 240 Stream Processors (Chip GT200 - Juin 2008)
30 coeurs SIMT (Single instructions Multiple Threads)
8 SPs (Stream Processors) par coeur SIMT
3 op (MADD + MUL) par SP
ò soit 1 Tera ops pour la carte Geforce GTX 285 (SP @1,5
GhZ)
9/41
9/41Architecture des processeurs graphiques GPU : Graphic Processing Unit
Programmation sous CUDA Avant CUDA : pipeline graphique
Exemples du SDK deA Apres CUDA : plein de threads !
GT200 utilise en mode graphique
10/41
10/41

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents