Équilibre corrélé

En théorie des jeux, la notion d’équilibre corrélé est un concept de solution proposée pour la première fois en 1974 par le mathématicien Robert Aumann. Il généralise le concept d'équilibre de Nash. L'équilibre corrélé suppose l'existence d'un dispositif externe de corrélation, par exemple un "maître du jeu" auquel tous les joueurs font confiance. Celui-ci affecte leurs stratégies aux différents joueurs suivant une certaine loi de probabilité. Cette loi est un équilibre corrélé lorsque, quelles que soient les stratégies { s i } {\displaystyle \{s_{i}\}} attribuées aux joueurs, aucun joueur i {\displaystyle i} n'aura intérêt à changer sa stratégie (connaissant s i {\displaystyle s_{i}} ainsi que la loi de probabilité suivie par le dispositif).

Définition formelle

Considérons un jeu à n {\displaystyle n} joueurs où chaque joueur i {\displaystyle i} choisit sa stratégie dans un ensemble S i {\displaystyle S_{i}} . La valeur reçue par le joueur i {\displaystyle i} est notée v i ( s i , s i ) {\displaystyle \displaystyle v_{i}(s_{i},s_{-i})} , où s i S i {\displaystyle s_{i}\in S_{i}} désigne la stratégie du joueur i {\displaystyle i} tandis que s i j i S j {\displaystyle s_{-i}\in \prod _{j\neq i}S_{j}} désigne les stratégies de tous les autres joueurs. Par exemple, sous forme vectorielle, pour s = ( 1 , 2 , 3 ) {\displaystyle s=(1,2,3)} , s 2 = 2 {\displaystyle s_{2}=2} et s 2 = ( 1 , 3 ) {\displaystyle s_{-2}=(1,3)} . La notation s = ( s i , s i ) {\displaystyle s=(s_{i},s_{-i})} permet de se référer facilement à la stratégie voisine s = ( s i , s i ) {\displaystyle s'=(s'_{i},s_{-i})} où tous les joueurs conservent la même stratégie à l'exception du joueur i {\displaystyle i} qui remplace sa strategie s i {\displaystyle s_{i}} par s i {\displaystyle s'_{i}} .

Soit une loi de probabilité p {\displaystyle p} sur les vecteurs de stratégies s i S i {\displaystyle s\in \prod _{i}S_{i}}  : p ( s ) {\displaystyle p(s)} désigne la probabilité du vecteur s {\displaystyle s} , que l'on écrira de manière équivalente p ( s i , s i ) {\displaystyle \displaystyle p(s_{i},s_{-i})} lorsqu'on s'intéressera au joueur i {\displaystyle i} . On dit que la loi de probabilité p {\displaystyle p} est un équilibre corrélé lorsque, pour tout joueur i {\displaystyle i} et toute stratégie s i S i {\displaystyle s_{i}\in S_{i}} , on a la relation :

s i S i , s i p ( s i , s i ) v i ( s i , s i ) s i p ( s i , s i ) v i ( s i , s i ) {\displaystyle \forall s'_{i}\in S_{i},\quad \sum _{s_{-i}}p(s_{i},s_{-i})v_{i}(s_{i},s_{-i})\;\geq \;\sum _{s_{-i}}p(s_{i},s_{-i})v_{i}(s'_{i},s_{-i})}

En français, ceci se lit : « sachant que le joueur i {\displaystyle i} s'est vu attribuer la stratégie s i {\displaystyle s_{i}} , il ne peut obtenir en moyenne de valeur perçue plus grande en optant pour une autre stratégie s i {\displaystyle \displaystyle s'_{i}} . »

La moyenne en question correspond à l'espérance de v i {\displaystyle v_{i}} sur les stratégies des autres joueurs, distribuées selon la loi p {\displaystyle p} conditionnée par l'événement « le joueur i {\displaystyle i} a reçu la stratégie s i {\displaystyle s_{i}}  ». En d'autres termes, le raisonnement présente deux étapes : les joueurs reçoivent d'abord leurs stratégies, puis envisagent d'améliorer leurs valeurs moyennes en supposant que les autres ne changent pas de tactique. S'il n'y a d'amélioration possible pour aucun joueur, on a un équilibre corrélé.

Exemple

Jeu de la poule mouillée, en forme normale.
Oser (O) Renoncer (R)
Oser (O) 0, 0 7, 2
Renoncer (R) 2, 7 6, 6

Considérons le jeu de la poule mouillée représenté ci-contre : deux joueurs s'affrontent, chacun ayant le choix entre deux stratégies, oser (O) ou renoncer (R). Si l'un ose, l'autre a tout intérêt à renoncer, et symétriquement, si l'un renonce, l'autre a tout intérêt à oser. Ce jeu représente donc une situation où chacun souhaite oser, mais seulement si son adversaire est susceptible d'abandonner.

Il y a trois équilibres de Nash : deux équilibres purs, ( O , R ) {\displaystyle (O,R)} et ( R , O ) {\displaystyle (R,O)} , ainsi qu'un équilibre mixte où chaque joueur ose avec probabilité 1 / 3 {\displaystyle 1/3} .

Supposons maintenant l'existence d'un arbitre choisissant uniformément un couple de stratégies parmi ( R , R ) {\displaystyle (R,R)} , ( O , R ) {\displaystyle (O,R)} et ( R , O ) {\displaystyle (R,O)} . Une fois le couple choisi, l'arbitre informe chaque joueur de sa stratégie (mais pas de la stratégie de son adversaire). Deux situations se présentent alors :

  • Imaginons qu'un joueur reçoive O {\displaystyle O}  : il sait alors que son adversaire a reçu R {\displaystyle R} et n'a pas intérêt à revenir sur sa stratégie.
  • Imaginons qu'un joueur reçoive R {\displaystyle R}  : dans ce cas, son adversaire jouera O {\displaystyle O} avec probabilité 1 / 2 {\displaystyle 1/2} et R {\displaystyle R} sinon; la valeur moyenne perçue par le joueur s'il conserve la stratégie R {\displaystyle R} est alors 1 / 2 × 2 + 1 / 2 × 6 = 4 {\displaystyle 1/2\times 2+1/2\times 6=4} , tandis que s'il décide de jouer O {\displaystyle O} plutôt cette moyenne ne sera que de 1 / 2 × 0 + 1 / 2 × 7 = 3 , 5 {\displaystyle 1/2\times 0+1/2\times 7=3,5} .

En définitive, aucun joueur n'a intérêt à revenir sur la stratégie que lui suggère l'arbitre : il y a équilibre corrélé. On remarquera que la valeur moyenne perçue dans cet équilibre est alors 1 / 3 × 7 + 1 / 3 × 2 + 1 / 3 × 6 = 5 {\displaystyle 1/3\times 7+1/3\times 2+1/3\times 6=5} , soit plus que celle obtenue avec l'équilibre de Nash mixte.

Lien avec les équilibres de Nash

Lorsque p {\displaystyle p} est la loi produit induite par n {\displaystyle n} stratégies mixtes { p i } {\displaystyle \{p_{i}\}} , i.e. p ( s 1 , . . . , s n ) = p 1 ( s 1 ) p 2 ( s 2 ) p n ( s n ) {\displaystyle p(s_{1},...,s_{n})=p_{1}(s_{1})p_{2}(s_{2})\cdots p_{n}(s_{n})} , un équilibre corrélé est exactement un équilibre de Nash. En effet, la relation d'équilibre devient alors (après division par p i ( s i ) {\displaystyle p_{i}(s_{i})} )

s i S i , s i p i ( s i ) v i ( s i , s i ) s i p i ( s i ) v i ( s i , s i ) . {\displaystyle \forall s'_{i}\in S_{i},\quad \sum _{s_{-i}}p_{-i}(s_{-i})v_{i}(s_{i},s_{-i})\;\geq \;\sum _{s_{-i}}p_{-i}(s_{-i})v_{i}(s'_{i},s_{-i}).}

C'est-à-dire que le mouvement s i {\displaystyle s_{i}} est une réponse optimale aux stratégies (mixtes) des adversaires (les équilibres de Nash mixtes sont exactement les combinaisons convexes de réponses optimales[1]).

Ainsi, un équilibre de Nash est un cas particulier d'équilibre corrélé où la loi est une loi produit (i.e. décorrélée).

Extension

La notion a été étendue pour les jeux en forme normale extensive par Bernard von Stengel et François Forges en 2008[2].

Bibliographie

  • Robert Aumann (1974), Subjectivity and correlation in randomized strategies, Journal of Mathematical Economics, 1:67-96.
  • Robert Aumann (1987), Correlated Equilibrium as an Expression of Bayesian Rationality, Econometrica, 55(1):1-18.
  • Fudenberg, Drew et Jean Tirole (1991), Game Theory, MIT Press, 1991, (ISBN 0-262-06141-4)
  • Martin J. Osborne et Ariel Rubinstein (1994), A Course in Game Theory, MIT Press, (ISBN 0-262-65040-1).
  • (en) Noam Nisan, Tim Roughgarden, Eva Tardos et Vijay Vazirani (trad. de l'indonésien), Algorithmic Game Theory, Cambridge, Cambridge University Press, , 754 p. (ISBN 978-0-521-87282-9, LCCN 2007014231, lire en ligne)
  • Montet C. and D. Serra (2003), Game theory and economics, Palgrave Macmilan, chap. 3 (ISBN 0-333-61847-5)

Références

  1. (Nisan et al. 2007) (chapitre 2)
  2. Bernhard von Stengel et Françoise Forges, Extensive-Form Correlated Equilibrium : Definition and Computational Complexity, (lire en ligne)
v · m
Définitions
Équilibre économique
(concepts)
Stratégies
Classes
de jeux
Jeux
Theorèmes
Personnalités
Voir aussi
  • icône décorative Portail de l’économie
  • icône décorative Portail de l'informatique théorique