Les jeux non-coopératifs avec information complète

romtreff

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

27 pages

Français

Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

A propos
Informations
Extrait

Description

Les jeux non-coopératifs avec information complète

Informations

Publié par	romtreff
Nombre de lectures	943
Langue	Français

Extrait

Deuxième partie Les jeux non-coopératifs avec information complète 3. Équilibre de Nash (1951) 35 4. Dynamique et rétroduction 61 5. Jeux répétés 853. Équilibre de Nash (1951) (1)ohn Nash a généralisé le concept d’équilibre de Cournot . L’idée de l’équilibre de Nash est extrêmement simple en soi et cohérent avecJ l’essence des jeux non-coopératifs. Les jeux non-coopératifs corres- pondent à des situations d’interactions entre individus libres dans leurs choix et poursuivant des objectifs propres et indépendants. Ces individus ne communiquent pas avant le jeu et n’ont pas nécessairement le moyen de s’engager à poursuivre une stratégie particulière. Dans ce contexte, l’équilibre de Nash cherche les résultats qui sont stables par rapport aux déviations individuelles, donc unilatérales. L’absence de communication implique une absence de coordination explicite et des déviations multila- térales. Un équilibre de Nash (EN) est donc un résultat dont aucun joueur n’a envie de dévier unilatéralement, étant données les stratégies jouées par les autres joueurs. Concepts clés étudiés : Cechapitre est consacré àl’équilibre de Nash : l’équilibrede Nash; lesfonctions de meilleures réponses; l’efﬁcacitéet dominationausens de Pareto; leproblème de la multiplicitédes équilibres; lespoints focaux dans un jeu; l’équilibrecorrélé. 1.Pour un exposé simpliﬁé du duopole de Cournot, voir http://beagle.u-bordeaux4.fr/yildi/ micro2web/node33.html. Équilibre de Nash (1951) • 35 ©Dunod. Laphotocopie non autorisée estun délit.Déﬁnition 3.1 ∗ ∗ ∗ ∗Unproﬁlp = p ,...,p p ∈ P,i= 1...n est un équilibre de Nashi1 n i ∗siaucunjoueur n’aintérêtàdévier unilatéralementdesastratégie p quandi ∗les autres joueurs continuent à jouer le proﬁl p . Par conséquent nous −i devons avoir ∗ ∗ ∗u p ,p u p,p , ∀p ∈ P, ∀i= 1...n. (3.1)i i i i ii −i −i ∗ ∗ ∗ ∗p est un équilibre de Nash strict si u p ,p > u p,p , ∀p ∈i i i ii −i −i P, ∀i= 1...n.i Sil’équilibredeNasheststrict,endévierdoitavoiruncoûtpourlesjoueurs. Pour tester si un résultat p est un équilibre de Nash, nous devons vériﬁer si undesjoueursaumoinsn’apasintérêtàchoisiruneautrestratégie.Sicen’est pas le cas alors p est un équilibre de Nash. Reprenons l’exemple du dilemme du prisonnier (tableau 3.1). Tableau 3.1 Dilemme du prisonnier (reprise). Clyde ND N (−1,−1)( −10,0) Bonnie D (0,−10 −8,−8) (N,N)n’est pas un équilibrede Nash car u (N,N)=−1 < 0= u (N,D)2 2 etdonc Clyde choisira de jouer Dau lieude N. Noussavonsdéjàque(D,D)estunesolutionquiapparaîtaprèsl’élimination desstratégiesdominées.Celaimpliquequ’aucunjoueurn’aintérêtàdévierde D quel que soit le choix de l’autre et donc, en particulier, si l’autre choisit D. Parconséquent, c’est aussi un équilibre de Nash : u (D,D)=−8 >−10= u (N,D)1 1 u (D,D)=−8 >−10= u (D,N)2 2 DoncniBonnie,niClyden’ontintérêtàdévierdeDsil’autrejoueD.Qu’en est-ildes stratégies mixtes? Notons les stratégies mixtes des deux joueurs par p = (q,1−q) et p =1 2 (t,1−t) avec q,t ∈ [0,1]. q est la fréquence du choix de la stratégie N par Bonnie et t est la fréquence du choix de N par Clyde. L’équilibre que ∗nous venons de calculer correspond donc aux stratégies mixtes : p = (0,1)1 ∗et p = (0,1) où Bonnie et Clyde choisissent toujours D. Nous pouvons2 36 • LES JEUX NON-COOPÉRATIFS AVEC INFORMATION COMPLÈTEreprésenterlesstratégiesmixtesdesjoueursdanslaformenormaledujeupour faciliterleurcompréhension (voir le tableau 3.2). Tableau 3.2 Dilemme du prisonnier et stratégies mixtes. Clyde t 1− t ND qN−1,−1 −10,0 ( )( ) Bonnie 1−qD(0,−10 −8,−8) Peut-il y avoir d’autres équilibres en stratégies mixtes? Étant donné que les stratégies mixtes (et donc les évènements correspondant au choix de D ou de N), sont indépendantes entre les deux joueurs, nous pouvons calculer la probabilitéjointederéalisationdechaqueproﬁldestratégies(voirtableau3.3). Tableau 3.3 Probabilités jointes des proﬁls de stratégies. Clyde t 1−t ND qN q×tq ×(1−t) Bonnie 1−qD(1−q)×t (1−q)×(1− t) Lesgains espérés des deux joueurs sont alors donnés : U p ,p ≡ Eu p ,p ≡ Eu q,t ( ) ( ) ( )i 1 2 i 1 2 i = qtu (N,N)+q(1−t)u (N,D)i i +(1−q)tu (D,N)+(1−q)(1−t)u (D,D)i i U (0,0)= u (D,D)i i Aveclesvaleursnumériques,legainespérédujoueur1devient: U (q,t)= qt(−1)+q(1−t)(−10)+(1−q)t(0)1 +(1−q)(1−t)(−8) = q(t−2)+8(t−1) Parconséquent dU1 ∗ = t−2 < 0⇒ q = 0 dq ∗Lemême raisonnement pour lesecond joueur implique t = 0. Équilibre de Nash (1951) • 37 ©Dunod. Laphotocopie non autorisée estun délit.∗Le seul équilibre de Nash est donc p = (0,0). Cela n’est pas surprenant danslamesureoùlastratégiepure N estdominéepar Detdonctoutestratégie mixte qui accorderait un poids strictement positif (q > 0) à N ferait moins bienque la stratégie pure D. ➙ Remarque 3.1 Vériﬁez que le Jeu de l’entrée II possède bien trois équilibres de Nash en stratégies pures : ((N,P),A)→ (0,100), ((N,N),A)→ (0,100) et ((I,P),N)→ (50,60). Il est en fait possible de déterminer l’équilibre de Nash de manière plus constructive,enutilisantlesfonctionsdemeilleuresréponses(oufonctionsde réaction)des joueurs. I. Fonctions de meilleures réponses et équilibre de Nash Étant données la structure du jeu et donc celle des gains, nous pouvons déter- minerlesstratégiesdu joueur iqui correspondent àlaplus grande satisfaction pourluifaceàtoutproﬁl p .Alorscesstratégiescorrespondentàlameilleure −i situation que i peut obtenir face à p . Le concept de meilleure réponse −i généralise cetteidée. Déﬁnition 3.2 Dans un jeu à n joueurs, la fonction de meilleure réponse du joueur i, R (p ) associe, à chaque combinaison de stratégies des autres joueurs p ,i −i −i la stratégiedu joueur iqui maximise son gain : u (R (p ),p ) u (p,p ), ∀p ∈ P,p ∈ P .i i −i −i i i −i i i −i −i A. Meilleures réponses avec stratégies pures ConstruisonslafonctiondemeilleureréponseenstratégiespuresdeBonnieet de Clyde dans le jeu initial de Dilemme du Prisonnier (voir tableau 3.4, page ci-contre). Par commodité pédagogique, nous résumons les meilleures réponses des joueurs dans le tableau 3.5, page ci-contre. Dans la colonne concernant Bonnie, N → D signiﬁe que la meilleure réponse de Bonnie à la stratégie N de Clyde est de jouer D. Cela provient 38 • LES JEUX NON-COOPÉRATIFS AVEC INFORMATION COMPLÈTETableau 3.4 Clyde ND N (−1,−1)( −10,0) Bonnie D 0,−10 −8,−8 ( ) Tableau 3.5 Meilleures réponses : caractérisation. Bonnie− R (s ) Clyde− R (s )1 2 2 1 N → D N → D D→ D D→ D du fait que u (D,N) = 0 > −1 = u (N,N) comme on l’observe dans la1 1 colonne N de la matricedu jeu. Une manière encore plus simple de visualiser les meilleures réponses de chaquejoueurestdelesreprésenterdanslamatricedujeu.Représentonsdans la matrice initiale, la fonction de réaction de Bonnie par des carrés et cellede Clyde par des étoiles( ).Celanous donne letableau 3.6. Tableau 3.6 Meilleures réponses : représentation. Clyde ND N Bonnie D Cette analyse nous montre que face au choix de D par un joueur, l’autre ne peut rien faire de mieux que choisir D. Donc (D,D)est l’équilibre de Nash et ilcorrespond à l’intersection des deux courbes de réaction. De la même manière, construisons la fonction de meilleure réponse en stratégies pures de Paul et de Jacqueline dans le jeu initial de la Bataille des Sexes: Jacqueline OF O (2,1)( 0,0) Paul F (0,0 1,2) Équilibre de Nash (1951) • 39 ©Dunod. Laphotocopie non autorisée estun délit.En suivant la même démarche que pour le Dilemme du prisonnier nous obtenons lestableaux 3.7 et3.8. Tableau 3.7 Meilleures réponses : caractérisation. Paul− R s Jacqueline− R s ( ) ( )1 2 2 1 O→ O O→ O F→ F F→ F Représentonsdanslamatriceinitiale,lafonctionderéactiondePaulpardes carréset cellede Jacqueline par des étoiles (tableau3.8). Tableau 3.8 Meilleures réponses : représentation. Jacqueline OF O Paul F L’intersection des deux courbes de réaction correspond aux deux résultats (O,O)et(F,F)etcesontbienleséquilibresdeNashenstratégiespuresdece jeu.De manière plus générale : ∗ ∗ ∗Proposition 3.1. Si s est un équilibre de Nash, s = R s , ∀i= 1...n.ii −i ∗ ∗Preuve. Par déﬁnition, R s maximise u s,s , pour tout joueur i.i i i −i −i Par conséquent, aucun joueur n’a intérêt à dévier unilatéralement de sa ∗stratégie s . ❏i DansunduopoledeCournot,lesfonctionsderéactionssontlesfonctionsde meilleuresréponses des ﬁrmes dans un jeu où lesstratégies sont des quantités produites. L’équilibre de Cournot (et de Nash) correspond à l’intersection des courbes de réaction où chaque ﬁrme produit de manière à maximiser son proﬁtétantdonnéeleniveaudeproductiondesonconcurrent.Larecherchede l’équilibredeNashestdoncéquivalenteàlarecherched’unpointd’intersection entreles fonctions de meilleuresréponses de tous les joueurs. B. Meilleures réponses avec stratégies mixtes La prise en compte des stratégies mixtes pourrait faire apparaître d’autres possibilitésdemeilleureréponse.Pourobservercela,reprenonslaBatailledes sexes.Notonslesstratégiesmixtesdesdeuxjoueursparp = (q,1−q)etp =1 2 (t,1−t) avec q,t∈ [0,1]. Nous obtenons alorsle tableau 3.9, page ci-contre. 40 • LES JEUX NON-COOPÉRATIFS AVEC INFORMATION COMPLÈTETableau 3.9 Bataille des sexes et stratégies mixtes. Jacqueline t 1− t OF q O (2,1)( 0,0) Paul 1−q F (0,0 1,2) Comparonsalorsl’espéranced’utilitédePaulpoursesdeuxstratégiespures: O : U (p ,p )= Eu (p ,p )= 2t+0(1−t)= 2t1 1 2 1 1 2 F : U (p ,p )= Eu (p ,p )= 0t+1(1−t)= 1− t1 1 2 1 1 2 Face àla stratégie mixte p de Jacqueline, Paul choisira Osi :2 1 2t > 1−t⇒ t > · 3 Paul choisira tout le temps d’aller à l’Opéra (q= 1)siJacquelinevaà l’Opéra plus d’une soirée sur trois (t > 1/3). Il choisira tout le temps d’aller au Foot (q= 0) si Jacqueline va au Foot plus de deux soirées sur trois (t < 1/3⇒ 1−t > 2/3).Sit= 1/3, Paul est indifférent entre aller l’Opéra etFoot.Enfait,danscecas,toutecombinaisondecesstratégiesestéquivalente pour lui. Ce dernierpoint correspond à un principe général qui est souvent utile : Lemme 3.1.Un joueur qui maximise son utilité en utilisant une stratégie mixte sera nécessairement indifférent entre toutes les stratégie