Publiez

S'identifier

S'inscrire

Evaluation des performances de benchmarks MPI sur des ...

Udwue
publié par

s'abonner

9ième Atelier en Evaluation de Performances
Aussois, du 1 au 4 juin 2008
notre étude est la composition parallèle de deux
processus P et P , qui s’envoient alternativement0 1
un seul message à la fois :Evaluation des performances de
benchmarks MPI sur des ping_pong(P ,P ) =0 1
architectures multiprocesseur de 0 1 0 1
||type CC-DSM
1 0 1 0
Meriem Zidouni Dans une implémentation MPICH pour une archi-
tecture CC-DSM, les primitives send et receive uti-
Bull S.A.
lisent des tampons de messages et éventuellementPlatforms Hardware R&D
des verrous pour gérer l’exclusion d’accès aux tam-Architecture & Verification
pons, en tant que mécanisme de communication.Rue Jean Jaurès
Ces structures de communication résident dans la78340 Les Clayes Sous Bois, FRANCE
mémoire distribuée et leurs accès sont régis par leMeriem.Zidouni@bull.net
protocole de cohérence de caches qui assure l’in-
tégrité des données, et implique l’emplacement de
1. Introduction
leur valeur valide à un moment donné.
Comme le programme contient des processus quiDans le cadre de son offre de serveurs haut de
1 s’exécutent en parallèle et accèdent à des variablesgamme, Bull conçoit des multiprocesseurs à mé-
partagées, un accès d’un processus aura une la-moire distribuée partagée avec un protocole de co-
tence qui ne peut pas être déterminée statique-hérence de caches CC-DSM (Cache-Coherent Distri-
ment, puisqu’elle dépend de l’entrelacement desbuted Shared ...

lire la suite replier

Infos
Stats

Publié le : 03/05/2011

Langue : Français

Nombre de pages : 2

Type de la publication : Etudes et statistiques

Thème :

Savoirs > Autres

0 vote(s) 0

51 lecture(s)

0 commentaire(s)

0 téléchargement(s)

Télécharger la publication

Du même auteur :

La maladie de Lyme

La maladie de Lyme

De : Udwue

THESE

THESE

De : Udwue

Télécharger
 ⁄   

Partager

9ièmeAtelierenEvaluationdePerformancesAussois,du1au4juin2008notreétudeestlacompositionparallèlededeuxprocessusP0etP1,quis’envoientalternativementEvaluationdesperformancesdeunseulmessageàlafois:benchmarksMPIsurdesping_pong(P0,P1)=architecturesmultiprocesseurde<send(P0P1);receive(P0P1)>typeCC-DSM||<receive(P1P0);send(P1P0)>MeriemZidouniDansuneimplémentationMPICHpourunearchi-BullS.A.tectureCC-DSM,lesprimitivessendetreceiveuti-PlatformsHardwareR&DlisentdestamponsdemessagesetéventuellementArchitecture&Vericationdesverrouspourgérerlexclusiondaccèsauxtam-RueJeanJaurèspons,entantquemécanismedecommunication.78340LesClayesSousBois,FRANCECesstructuresdecommunicationrésidentdanslaMeriem.Zidouni@bull.netmémoiredistribuéeetleursaccèssontrégisparleprotocoledecohérencedecachesquiassurel’in-1.Introductiontégritédesdonnées,etimpliquel’emplacementdeleurvaleurvalideàunmomentdonné.DanslecadredesonoffredeserveurshautdeCommeleprogrammecontientdesprocessusquigamme,Bull1conçoitdesmultiprocesseursàmé-sexécutentenparallèleetaccèdentàdesvariablesmoiredistribuéepartagéeavecunprotocoledeco-partagées,unaccèsdunprocessusauraunela-hérencedecachesCC-DSM(Cache-CoherentDistri-tencequinepeutpasêtredéterminéestatique-butedSharedMemory)etfournituneimplémenta-ment,puisquelledépenddelentrelacementdestiondelabibliothèquedeprogrammationparal-actionsquiaurontprécédécetaccès.Parconsé-lèleMPI(MessagePassingInterface).Lebutdenotrequent,laccèsàunevariablepeutavoirdiffé-rechercheestdefourniruneméthodeetsesou-renteslatencespossiblescorrespondantauxéven-tilsassociés,permettantlévaluationetloptimisa-tuelstransfertsentrelemplacementdeladonnéetiondecetteimplémentationenfonctiondelarchi-valide(mémoirelocaleoudistante,oucacheduntecturematérielle:topologiedinterconnexionetprocesseurdistant)parrapportauprocesseurde-protocoledecohérencedecaches.Cecipermettra,mandeur.Lalatencedecestransfertsdétermineladunepart,defairelesbonschoixdarchitectureperformancedescommunicationsetdessynchro-matérielleetdimplémentationlogicielleaumo-nisationsinter-processus.mentdelaconception,etdautrepart,fourniradesNousavonsmodélisédefaçonindépendante,enélémentsdanalysenécessairespourcomprendrelangageLOTOS,les3aspectsquidénissentleslesmesuresfaitesaumomentdelavalidationdelaperformancesduneimplémentationdeMPIdansmachineréelle.NousdénissonsetexpérimentonsunearchitectureCC-DSM:unetelleméthode,àtraverslétudedecasdun1.lasuccessiondaccèsdénieparlalgorithmebenchmarkdeMPI(ping-pong).Notreméthodededesprimitivesdecommunication:dansnotremodélisationestbaséesurlathéoriedesIMC(In-casdeping-pong,ils’agitdesprimitivessendteractiveMarkovChains),implémentéedanslaboîteetreceivequicorrespondentàdessuitesd’ac-àoutilsCADP[1].Elleconsisteàmodéliserlesys-cèsauxvariablespourdesopérationsdelec-tèmeenlangageLOTOS[2],puisàvérierformel-ture(load)etd’écriture(store);lementsacorrectionfonctionnelle,etnalementà2.leprotocoledecohérencedecachesquirégitévaluersesperformancesaprèslavoiraugmentéleschangementsdesétatsdescaches(suivantavecdesinformationsquantitatives(latences).leprotocoleMESIclassique),etlestransfertsentrecachesetmémoires,etentrecaches;2.Modélisationetvérificationdubenchmark3.latopologied’interconnexiondel’architectureping-pongmultiprocesseur,quidéterminelalatencedesLebenchmarkping-pongconsisteendesenvoistransfertssuivantleniveaudedistanceentrealternésdemessagesentreprocessusvialeslesmémoiresetlesprocesseursetentrelesprimitivessendetreceive.Celuiconsidérédansprocesseurs.Nousavonsvérifiélacorrectionfonctionnelledu1http://www.bull.comcomportementdonnéparlaspécificationLOTOS
duping-pongaveclesoutilsdeCADP.Pourladistanceentrelesprocesseursdansleréseauétablirlacorrectiondelalgorithmeping-pong,dinterconnexiondelarchitecture:onconsidèrenousavonsemployélavérificationvisuelle(vi-troisniveauxdifférentsdedistanceentrelespro-sualchecking)enutilisantlesoutilsBCG_MINetcesseurssurlesquelssexécuteleping-pong;BCG_EDIT.Pouranalyserleprotocoledecohé-leprotocoledecohérencedecaches:onétudierencedecachesetlagestiondesverrous,nousdeuxprotocolesdecohérencedecachesdontlaavonsutilisélavéricationparlogiquestempo-différencerésidedanslechangementdesétatsrelles(modelchecking)àlaidedeloutilEVALUA-descaches;TOR.lesprimitivessendetreceive:onconsidèredeuxsortesdeprimitives:cellesquiutilisentdeslistes3.Evaluationdesperformancesdubenchmarkchaînéesavecdesverrous,etcellesquiutilisentping-pongdestamponssansverrous.Lebutdenotreétudeestd’évaluerlesperfor-5.Conclusionetperspectivesmancesdubenchmarkping-pong,cequiconsisteàcalculerlalatencedunéchangedemessage(unNousenvisageonsdepoursuivrenosrecherchessendsuivid’unreceive)etlenombredemisseffec-suivantplusieursdirections.Premièrement,noustuéssurchaquevariabledelalgorithmependantallonsfocalisernoseffortssurlamodélisationencetéchange.Pourcela,nousavonsadoptélap-LOTOSdeplusieursvariantesdeprotocolesdeco-procheproposéeen[3]baséesurlathéoriedeshérencedecaches,ainsiquedautresprimitivesdeIMC.ElleconsisteàenrichirlaspécicationLO-communicationetdesynchronisationdeMPI.CesTOS,dontlespropriétésfonctionnellesontétédéjàmodèles,groupésdansdesbibliothèquesréutili-vériées,pardesinformationsquantitativesappe-sablesetparamétréesparlatopologiedintercon-léesdélaisMarkoviens.Dansnotrecas,cesdélaisnexiondesprocesseurs,permettraientdemodé-Markovienscorrespondentauxlatencesdestrans-liserfacilementdescongurationsdifférentesdefertsdaccèsauxvariablesparlesopérationsdemachines.Deuxièmement,noussouhaitonsmettrelectureetdécriture,évaluéesdurantlagénérationenoeuvreunetraductionautomatiqueentrelades-dumodèleduping-pongenLOTOS.Ensuite,ilcriptiondelalgorithmedistribuéetdesprimitivesfautvérier,dunepart,quecetteinsertionestsé-decommunicationetlamodélisationLOTOScor-mantiquementcorrecte,ensassurantparexemplerespondante,augmentéedelatences.Celapermet-quellepréservelaconcurrencedesprocessuspa-traitdedisposerdunechaînecomplètedemodéli-rallèlesdansletemps,etdautrepart,quellenesationetévaluationdeperformancesquiassiste-perturbepaslecomportementfonctionneldelaraitdemanièreutilelesconcepteursdelogicielsspécicationoriginelle.Nousavonsappliquélou-distribuéssurlesmachinesmultiprocesseurs.tilBCG_STEADYdeCADPpourlecalculdesper-formancessurlemodèleMarkovienduping-pong.BibliographieC’estunoutilquipermetdecalculer,demanièreitérative,àl’étatd’équilibreladistributiondepro-1.H.Garavel,F.Lang,R.Mateescu,andW.Serwe.–CADP2006:AToolboxfortheConstructionandbabilitéàlongterme(decefait,onobtientlala-AnalysisofDistributedProcesses.–Proceedingsoftenced’unéchangedemessage),etdefournirdesthe19thInternationalConferenceonComputerAi-mesuresdedébitpourchacunedesétiquettesdededVerificationCAV’2007(Berlin,Germany),vol.transitions(onobtientlenombredemisseffectués4590ofLectureNotesinComputerScience,pp.surchaquevariablependantl’échanged’unmes-158-163.SpringerVerlag,July2007.sage).2.ISO/IEC.–LOTOS:AFormalDescriptionTech-niquebasedontheTemporalOrderingofObserva-4.RésultatstionalBehaviour.–InternationalStandardISO/IEC8807,1989.Cetteapprochenousapermisd’obtenirdesla-3.H.GaravelandH.Hermanns.–OnCombiningtencesmoyennesd’échanged’unmessageconfor-FunctionalVerificationandPerformanceEvalua-téesparlesmesuresexpérimentales,etdelesana-tionusingCADP.–Proceedingsofthe11thInter-lyseraveclenombredemisseffectuésurlesdiffé-nationalSymposiumonFormalMethodsEuroperentesvariablespendantcetéchange.FME’2002(Copenhague,Denmark),vol.2391ofNousavonségalementévaluéetanalysélesperfor-LectureNotesinComputerScience,pp.410-429.mancesduping-pongenfaisantvarierdesaspectsSpringerVerlag,July2002.matérielsetlogiciels:2

Chargement...

Télécharger la publication

Note :

17/1000 caractères maximum.