Les jeux non-coopératifs avec information complète
27 pages
Français
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Les jeux non-coopératifs avec information complète

Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
27 pages
Français

Description

Les jeux non-coopératifs avec information complète

Sujets

Informations

Publié par
Nombre de lectures 1 451
Langue Français

Exrait

Deuxième partie Les jeux non-coopératifs avec information complète 3. Équilibre de Nash (1951) 35 4. Dynamique et rétroduction 61 5. Jeux répétés 85 3. Équilibre de Nash (1951) (1)ohn Nash a généralisé le concept d’équilibre de Cournot . L’idée de l’équilibre de Nash est extrêmement simple en soi et cohérent avecJ l’essence des jeux non-coopératifs. Les jeux non-coopératifs corres- pondent à des situations d’interactions entre individus libres dans leurs choix et poursuivant des objectifs propres et indépendants. Ces individus ne communiquent pas avant le jeu et n’ont pas nécessairement le moyen de s’engager à poursuivre une stratégie particulière. Dans ce contexte, l’équilibre de Nash cherche les résultats qui sont stables par rapport aux déviations individuelles, donc unilatérales. L’absence de communication implique une absence de coordination explicite et des déviations multila- térales. Un équilibre de Nash (EN) est donc un résultat dont aucun joueur n’a envie de dévier unilatéralement, étant données les stratégies jouées par les autres joueurs. Concepts clés étudiés : Cechapitre est consacré àl’équilibre de Nash : l’équilibrede Nash; lesfonctions de meilleures réponses; l’efficacitéet dominationausens de Pareto; leproblème de la multiplicitédes équilibres; lespoints focaux dans un jeu; l’équilibrecorrélé. 1.Pour un exposé simplifié du duopole de Cournot, voir http://beagle.u-bordeaux4.fr/yildi/ micro2web/node33.html. Équilibre de Nash (1951) • 35 ©Dunod. Laphotocopie non autorisée estun délit. Définition 3.1    ∗ ∗ ∗ ∗Unprofilp = p ,...,p p ∈ P,i= 1...n est un équilibre de Nashi1 n i ∗siaucunjoueur n’aintérêtàdévier unilatéralementdesastratégie p quandi ∗les autres joueurs continuent à jouer le profil p . Par conséquent nous −i devons avoir     ∗ ∗ ∗u p ,p  u p,p , ∀p ∈ P, ∀i= 1...n. (3.1)i i i i ii −i −i     ∗ ∗ ∗ ∗p est un équilibre de Nash strict si u p ,p > u p,p , ∀p ∈i i i ii −i −i P, ∀i= 1...n.i Sil’équilibredeNasheststrict,endévierdoitavoiruncoûtpourlesjoueurs. Pour tester si un résultat p est un équilibre de Nash, nous devons vérifier si undesjoueursaumoinsn’apasintérêtàchoisiruneautrestratégie.Sicen’est pas le cas alors p est un équilibre de Nash. Reprenons l’exemple du dilemme du prisonnier (tableau 3.1). Tableau 3.1 Dilemme du prisonnier (reprise). Clyde ND N (−1,−1)( −10,0) Bonnie D (0,−10 −8,−8) (N,N)n’est pas un équilibrede Nash car u (N,N)=−1 < 0= u (N,D)2 2 etdonc Clyde choisira de jouer Dau lieude N. Noussavonsdéjàque(D,D)estunesolutionquiapparaîtaprèsl’élimination desstratégiesdominées.Celaimpliquequ’aucunjoueurn’aintérêtàdévierde D quel que soit le choix de l’autre et donc, en particulier, si l’autre choisit D. Parconséquent, c’est aussi un équilibre de Nash : u (D,D)=−8 >−10= u (N,D)1 1 u (D,D)=−8 >−10= u (D,N)2 2 DoncniBonnie,niClyden’ontintérêtàdévierdeDsil’autrejoueD.Qu’en est-ildes stratégies mixtes? Notons les stratégies mixtes des deux joueurs par p = (q,1−q) et p =1 2 (t,1−t) avec q,t ∈ [0,1]. q est la fréquence du choix de la stratégie N par Bonnie et t est la fréquence du choix de N par Clyde. L’équilibre que ∗nous venons de calculer correspond donc aux stratégies mixtes : p = (0,1)1 ∗et p = (0,1) où Bonnie et Clyde choisissent toujours D. Nous pouvons2 36 • LES JEUX NON-COOPÉRATIFS AVEC INFORMATION COMPLÈTE représenterlesstratégiesmixtesdesjoueursdanslaformenormaledujeupour faciliterleurcompréhension (voir le tableau 3.2). Tableau 3.2 Dilemme du prisonnier et stratégies mixtes. Clyde t 1− t ND qN−1,−1 −10,0 ( )( ) Bonnie 1−qD(0,−10 −8,−8) Peut-il y avoir d’autres équilibres en stratégies mixtes? Étant donné que les stratégies mixtes (et donc les évènements correspondant au choix de D ou de N), sont indépendantes entre les deux joueurs, nous pouvons calculer la probabilitéjointederéalisationdechaqueprofildestratégies(voirtableau3.3). Tableau 3.3 Probabilités jointes des profils de stratégies. Clyde t 1−t ND qN q×tq ×(1−t) Bonnie 1−qD(1−q)×t (1−q)×(1− t) Lesgains espérés des deux joueurs sont alors donnés : U p ,p ≡ Eu p ,p ≡ Eu q,t ( ) ( ) ( )i 1 2 i 1 2 i = qtu (N,N)+q(1−t)u (N,D)i i +(1−q)tu (D,N)+(1−q)(1−t)u (D,D)i i U (0,0)= u (D,D)i i Aveclesvaleursnumériques,legainespérédujoueur1devient: U (q,t)= qt(−1)+q(1−t)(−10)+(1−q)t(0)1 +(1−q)(1−t)(−8) = q(t−2)+8(t−1) Parconséquent dU1 ∗ = t−2 < 0⇒ q = 0 dq ∗Lemême raisonnement pour lesecond joueur implique t = 0. Équilibre de Nash (1951) • 37 ©Dunod. Laphotocopie non autorisée estun délit. ∗Le seul équilibre de Nash est donc p = (0,0). Cela n’est pas surprenant danslamesureoùlastratégiepure N estdominéepar Detdonctoutestratégie mixte qui accorderait un poids strictement positif (q > 0) à N ferait moins bienque la stratégie pure D. ➙ Remarque 3.1 Vérifiez que le Jeu de l’entrée II possède bien trois équilibres de Nash en stratégies pures : ((N,P),A)→ (0,100), ((N,N),A)→ (0,100) et ((I,P),N)→ (50,60). Il est en fait possible de déterminer l’équilibre de Nash de manière plus constructive,enutilisantlesfonctionsdemeilleuresréponses(oufonctionsde réaction)des joueurs. I. Fonctions de meilleures réponses et équilibre de Nash Étant données la structure du jeu et donc celle des gains, nous pouvons déter- minerlesstratégiesdu joueur iqui correspondent àlaplus grande satisfaction pourluifaceàtoutprofil p .Alorscesstratégiescorrespondentàlameilleure −i situation que i peut obtenir face à p . Le concept de meilleure réponse −i généralise cetteidée. Définition 3.2 Dans un jeu à n joueurs, la fonction de meilleure réponse du joueur i, R (p ) associe, à chaque combinaison de stratégies des autres joueurs p ,i −i −i la stratégiedu joueur iqui maximise son gain : u (R (p ),p ) u (p,p ), ∀p ∈ P,p ∈ P .i i −i −i i i −i i i −i −i A. Meilleures réponses avec stratégies pures ConstruisonslafonctiondemeilleureréponseenstratégiespuresdeBonnieet de Clyde dans le jeu initial de Dilemme du Prisonnier (voir tableau 3.4, page ci-contre). Par commodité pédagogique, nous résumons les meilleures réponses des joueurs dans le tableau 3.5, page ci-contre. Dans la colonne concernant Bonnie, N → D signifie que la meilleure réponse de Bonnie à la stratégie N de Clyde est de jouer D. Cela provient 38 • LES JEUX NON-COOPÉRATIFS AVEC INFORMATION COMPLÈTE Tableau 3.4 Clyde ND N (−1,−1)( −10,0) Bonnie D 0,−10 −8,−8 ( ) Tableau 3.5 Meilleures réponses : caractérisation. Bonnie− R (s ) Clyde− R (s )1 2 2 1 N → D N → D D→ D D→ D du fait que u (D,N) = 0 > −1 = u (N,N) comme on l’observe dans la1 1 colonne N de la matricedu jeu. Une manière encore plus simple de visualiser les meilleures réponses de chaquejoueurestdelesreprésenterdanslamatricedujeu.Représentonsdans   la matrice initiale, la fonction de réaction de Bonnie par des carrés et cellede Clyde par des étoiles( ).Celanous donne letableau 3.6. Tableau 3.6 Meilleures réponses : représentation. Clyde ND N Bonnie D Cette analyse nous montre que face au choix de D par un joueur, l’autre ne peut rien faire de mieux que choisir D. Donc (D,D)est l’équilibre de Nash et ilcorrespond à l’intersection des deux courbes de réaction. De la même manière, construisons la fonction de meilleure réponse en stratégies pures de Paul et de Jacqueline dans le jeu initial de la Bataille des Sexes: Jacqueline OF O (2,1)( 0,0) Paul F (0,0 1,2) Équilibre de Nash (1951) • 39 ©Dunod. Laphotocopie non autorisée estun délit. En suivant la même démarche que pour le Dilemme du prisonnier nous obtenons lestableaux 3.7 et3.8. Tableau 3.7 Meilleures réponses : caractérisation. Paul− R s Jacqueline− R s ( ) ( )1 2 2 1 O→ O O→ O F→ F F→ F Représentonsdanslamatriceinitiale,lafonctionderéactiondePaulpardes carréset cellede Jacqueline par des étoiles (tableau3.8). Tableau 3.8 Meilleures réponses : représentation. Jacqueline OF O Paul F L’intersection des deux courbes de réaction correspond aux deux résultats (O,O)et(F,F)etcesontbienleséquilibresdeNashenstratégiespuresdece jeu.De manière plus générale :   ∗ ∗ ∗Proposition 3.1. Si s est un équilibre de Nash, s = R s , ∀i= 1...n.ii −i     ∗ ∗Preuve. Par définition, R s maximise u s,s , pour tout joueur i.i i i −i −i Par conséquent, aucun joueur n’a intérêt à dévier unilatéralement de sa ∗stratégie s . ❏i DansunduopoledeCournot,lesfonctionsderéactionssontlesfonctionsde meilleuresréponses des firmes dans un jeu où lesstratégies sont des quantités produites. L’équilibre de Cournot (et de Nash) correspond à l’intersection des courbes de réaction où chaque firme produit de manière à maximiser son profitétantdonnéeleniveaudeproductiondesonconcurrent.Larecherchede l’équilibredeNashestdoncéquivalenteàlarecherched’unpointd’intersection entreles fonctions de meilleuresréponses de tous les joueurs. B. Meilleures réponses avec stratégies mixtes La prise en compte des stratégies mixtes pourrait faire apparaître d’autres possibilitésdemeilleureréponse.Pourobservercela,reprenonslaBatailledes sexes.Notonslesstratégiesmixtesdesdeuxjoueursparp = (q,1−q)etp =1 2 (t,1−t) avec q,t∈ [0,1]. Nous obtenons alorsle tableau 3.9, page ci-contre. 40 • LES JEUX NON-COOPÉRATIFS AVEC INFORMATION COMPLÈTE Tableau 3.9 Bataille des sexes et stratégies mixtes. Jacqueline t 1− t OF q O (2,1)( 0,0) Paul 1−q F (0,0 1,2) Comparonsalorsl’espéranced’utilitédePaulpoursesdeuxstratégiespures: O : U (p ,p )= Eu (p ,p )= 2t+0(1−t)= 2t1 1 2 1 1 2 F : U (p ,p )= Eu (p ,p )= 0t+1(1−t)= 1− t1 1 2 1 1 2 Face àla stratégie mixte p de Jacqueline, Paul choisira Osi :2 1 2t > 1−t⇒ t > · 3 Paul choisira tout le temps d’aller à l’Opéra (q= 1)siJacquelinevaà l’Opéra plus d’une soirée sur trois (t > 1/3). Il choisira tout le temps d’aller au Foot (q= 0) si Jacqueline va au Foot plus de deux soirées sur trois (t < 1/3⇒ 1−t > 2/3).Sit= 1/3, Paul est indifférent entre aller l’Opéra etFoot.Enfait,danscecas,toutecombinaisondecesstratégiesestéquivalente pour lui. Ce dernierpoint correspond à un principe général qui est souvent utile : Lemme 3.1.Un joueur qui maximise son utilité en utilisant une stratégie mixte sera nécessairement indifférent entre toutes les stratégies pures auxquelles la stratégie mixte attribue une probabilité strictement positive. Si cette indiffé- rence n’était pas vérifiée, une stratégie qui donne une probabilité nulle à la stratégie pure la moins préférée serait meilleure. Preuve.Voir Osborne & Rubinstein(1994), p. 33–34. ❏ Parconséquent, sa fonction de meilleureréponse est :  1Si t > 1/3  ∗R (t)= q (t)= [0,1] Si t= 1/31  0Sit < 1/3. De même pour Jacqueline, nous avons : O : U (p ,p )= Eu (p ,p )= 1q+0(1−q)= q2 1 2 2 1 2 F : U (p ,p )= Eu (p ,p )= 0q+2(1−q)= 2−2q2 1 2 2 1 2 Équilibre de Nash (1951) • 41 ©Dunod. Laphotocopie non autorisée estun délit. Face àla stratégie mixte p de Paul,Jacqueline choisira O(t= 1) si1 2 q > 2−2q⇒ q > · 3 donc seulement si Paul va à l’Opéra plus de deux soirées sur trois. Par conséquent, lafonction de meilleureréponse de Jacqueline est  1Si q > 2/3  ∗R (q)= t (q)= [0,1] Si q= 2/32  0Siq < 2/3. Nous pouvons représenter ces fonctions de réaction sur un graphique (voir figure3.1). t R (q)J O 1 Jacqueline R (t)P 1/3 F 0 q2/30 1 F OPaul Figure 3.1 Les fonctions de meilleures réponses en stratégies mixtes. Ce graphique fait apparaître trois points d’intersection entre les courbes de réaction.Nosdeuxéquilibres enstratégiespures (O,O)et(F,F)apparaissent auxextrêmes(respectivement(1,1)et(0,0)).Unnouveléquilibreenstratégies 2 1 mixtes apparaît : , . Dans cet équilibre, Paul va à l’Opéra deux soirées 3 3 sur trois et Jacqueline, une soirée sur trois. Leur gain espéré est alors : Eu =i 2/3,i= 1,2. 42 • LES JEUX NON-COOPÉRATIFS AVEC INFORMATION COMPLÈTE