L'équilibre de Nash ou quand les mathématiques démontrent l'équilibre d'une société


Les  théories mathématiques de Nash, énoncées ci-dessous à travers d'exemples simples, enfin presque comme ceux du marchand de glace et des prisonniers, démontrent que la confiance, la sincérité et la coopération entre les individus amènent à des résultats positifs majeurs pour les deux parties préalablement opposées.
Ces données vont bouleverser les notions économiques mondiales pour la deuxième partie du 20 ème siècle.
Elles restent cependant peu appliquées, puisque les marchés boursiers et la spéculation, vont à l'inverse des travaux de ce Nobel 1994.

 CR

John Forbes Nash, est un célèbre Mathématicien, prix Nobel 1994 d'économie, et héros du célèbre film "Un homme d'exception" avec Russell Crowe qui reçu 4 Oscars en 2001.

Ce film retrace la vie du célèbre Nash. À l'aube d'une carrière mathématique prometteuse, John Nash a commencé à souffrir de schizophrénie. Il a appris à vivre avec cette maladie seulement vingt-cinq ans plus tard.

Le film traite surtout l'aspect social et sentimental du mathématicien face à la maladie et peu ou pas de son travail.

John Forbes Nash Jr  a travaillé sur la théorie des jeux, la géométrie différentielle, et les équations aux dérivées partielles. Il a partagé le prix Nobel d'économie en 1994 avec Reinhard Selten et John Harsanyi pour leurs travaux en théorie des jeux.


Dans la théorie des jeux, l'équilibre de Nash, est un concept de solution dans lequel l'ensemble des choix faits par plusieurs joueurs, connaissant leurs stratégies réciproques, est devenu stable du fait qu'aucun ne peut modifier seul sa stratégie sans affaiblir sa position personnelle.
Les exemples d'équilibre non-optimaux sont parfois évoqués pour montrer que si chaque acteur économique raisonne individuellement selon son intérêt, alors il peut en résulter une situation pire que si les acteurs se concertaient. D'autres exemples célèbres sont ceux du problème des marchands de glaces ou du dilemme du prisonnier.
Dilemme du prisonnier:
Tucker suppose deux prisonniers (complices d'un crime) retenus dans des cellules séparées et qui ne peuvent communiquer; l'autorité pénitentiaire offre à chacun des prisonniers les choix suivants:
  • si un des deux prisonniers dénonce l'autre, il est remis en liberté alors que le second obtient la peine maximale (10 ans) ;
  • si les deux se dénoncent entre eux, ils seront condamnés à une peine plus légère (5 ans) ;
  • si les deux refusent de dénoncer, la peine sera minimale (6 mois), faute d'éléments au dossier.
Ce problème modélise bien les questions de politique tarifaire : le concurrent qui baisse ses prix gagne des parts de marché et peut ainsi augmenter ses ventes et accroître éventuellement son bénéfice… mais si son concurrent principal en fait autant, les deux peuvent y perdre.
Ce jeu ne conduit pas spontanément à un état où on ne pourrait améliorer le bien-être d’un joueur sans détériorer celui d’un autre (c'est-à-dire un optimum de Pareto; voir aussiéquilibre de Nash). À l'équilibre, chacun des prisonniers choisira probablement de faire défaut alors qu'ils gagneraient à coopérer : chacun est fortement incité à tricher, ce qui constitue le cœur du dilemme.
Si le jeu était répété, chaque joueur pourrait user de représailles envers l'autre joueur pour son absence de coopération, ou même simplement minimiser sa perte maximale en trahissant les fois suivantes. L'incitation à tricher devient alors inférieure à la menace de punition, ce qui introduit la possibilité de coopérer : la fin ne justifie plus les moyens.
Le dilemme du prisonnier est utilisé en économie, étudié en mathématiques, utile parfois aux psychologuesbiologistes des écosystèmes et spécialistes de science politique. Le paradigme correspondant est également mentionné en philosophie et dans le domaine des sciences cognitives

Formulation

La première expérience du dilemme du prisonnier a été réalisée en 1950 par Melvin Dresher et Merill Flood, qui travaillaient alors pour la RAND Corporation. Par la suite, Albert W. Tucker la présenta sous la forme d'une histoire :

Deux suspects sont arrêtés par la police. Mais les agents n'ont pas assez de preuves pour les inculper, donc ils les interrogent séparément en leur faisant la même offre. « Si tu dénonces ton complice et qu'il ne te dénonce pas, tu seras remis en liberté et l'autre écopera de 10 ans de prison. Si tu le dénonces et lui aussi, vous écoperez tous les deux de 5 ans de prison. Si personne ne se dénonce, vous aurez tous deux 6 mois de prison. »
On résume souvent les utilités de chacun dans ce tableau :
1 \ 2Se taitDénonce
Se tait(-1/2;-1/2)(-10;0)
Dénonce(0;-10)(-5;-5)
Chacun des prisonniers réfléchit de son côté en considérant les deux cas possibles de réaction de son complice.
  • « Dans le cas où il me dénoncerait :
    • Si je me tais, je ferai 10 ans de prison ;
    • Mais si je le dénonce, je ne ferai que 5 ans. »
  • « Dans le cas où il ne me dénoncerait pas :
    • Si je me tais, je ferai 6 mois de prison ;
    • Mais si je le dénonce, je serai libre. »
« Quel que soit son choix, j'ai donc intérêt à le dénoncer. »
Si chacun des complices fait ce raisonnement, les deux vont probablement choisir de se dénoncer mutuellement, ce choix étant le plus empreint de rationalité. Conformément à l'énoncé, ils écoperont dès lors de 5 ans de prison chacun. Or, s'ils étaient tous deux restés silencieux, ils n'auraient écopé que de 6 mois chacun. Ainsi, lorsque chacun poursuit son intérêt individuel, le résultat obtenu n'est pas optimal au sens de Vilfredo Pareto.
Ce jeu est à somme non nulle, c'est-à-dire que la somme des gains pour les participants n'est pas toujours la même : il soulève une question de coopération
.
Problème des marchands de glace:
Lorsque les deux marchands sont installés, ils se partagent naturellement la plage en deux zones : la zone d'un marchand est l'ensemble des points de la plage qui sont plus près de lui que de l'autre marchand (notion de diagramme de Voronoï). Il n'est pas difficile de voir que ces zones correspondent à un découpage de la plage par la médiatrice du segmentreliant les deux marchands (schéma ci-dessous, à gauche — la médiatrice étant la ligne verticale noire).
Si un des deux marchands a une zone plus petite que l'autre (c'est le cas s'il est plus loin du centre de la plage), il peut accroître sa zone en se déplaçant (schéma ci-dessous, à droite). Il n'y a donc pas équilibre.
Nash equilibrium1.svg
Il ne peut donc y avoir équilibre que si les deux zones ont la même taille, c'est-à-dire si les marchands sont tous deux de part et d'autre du milieu de la plage, à égale distance (ci-dessous, gauche). Mais, si l'un des marchands se rapproche alors du milieu de la plage (ci-dessous, droite, le vendeur bleu se déplace vers la gauche), il accroîtra sa zone au détriment de l'autre, qui devra aussi se rapprocher du milieu de la plage pour conserver « sa » moitié de plage.
Nash equilibrium2.svg
Du coup, les deux marchands se rapprochent spontanément du milieu de la plage, jusqu'à s'y trouver tous les deux (ci-dessous, gauche). Il y a alors équilibre : chaque marchand a une moitié de plage, et s'il se déplace légèrement d'un côté ou de l'autre, il verra sa zone décroître au profit de son concurrent (ci-dessous, droite, le vendeur rouge se déplace vers la gauche). C'est l'équilibre de Nash de ce jeu.
Nash equilibrium3.svg

Optimalité[modifier | modifier le wikicode]

Si l'on suppose que les clients se déplaceront toujours vers le plus proche marchand, quelle que soit sa position, alors le jeu est à somme nulle : la somme des gains des marchands sera la même dans tous les cas.
Cependant, ce jeu produit des externalités : les clients ne sont pas indifférents à la position des marchands, puisqu'ils devront marcher en conséquence. En particulier, la position d'équilibre, avec les deux marchands au centre de la plage, est loin d'être idéale : certains clients doivent traverser la moitié de la plage pour acheter leur glace.
Une répartition bien meilleure des vendeurs (du point de vue de l'optimum social) serait d'en avoir un au milieu de chaque moitié de la plage (deuxième des trois schémas ci-dessus, gauche). Dans ce cas, non seulement chaque vendeur aurait encore une zone égale à la moitié de la plage, mais les clients ne devraient traverser qu'au plus le quart de la plage pour acheter leur glace. Il ne s'agit cependant pas d'un équilibre.
Ainsi, du point de vue des clients, l'équilibre de ce jeu n'est pas optimal. Il est possible de rendre cet équilibre non-optimal pour les marchands aussi : il suffit de supposer qu'un client préfère renoncer à sa glace que de traverser plus du tiers de la plage. Dans ce cas, l'équilibre pour les marchands consistera à se poster chacun à un tiers de la plage, puisqu'alors si un marchand veut se rapprocher du milieu, pour prendre un client à son concurrent il devra en perdre deux qui viendraient de l'extrémité de la plage. Ce nouvel équilibre améliore alors la condition des clients sans être encore optimal pour eux.

Le modèle et la réalité

Le modèle ne prétend pas représenter un cas réel, mais les conséquences d'une hypothèse d'école très simplifiée. Dans la vie réelle, bien entendu, des clients qui achèteraient une glace si le marchand est près d'eux pourraient y renoncer s'il faut parcourir la moitié de la plage et retour (en d'autres termes le volume des ventes n'est pas une constante). Ou encore un marchand pourrait vendre ses glaces un peu plus cher en jouant sur la préférence du client pour le confort de la proximité (en d'autres termes la proximité constitue un élément de service qui peut aussi se facturer). Cela ne remet pas en cause le modèle, qui ne constitue en tant que tel qu'un exemple idéal destiné à montrer que la main invisible d'Adam Smith peut, selon les cas, s'appliquer ou non.

Source Wikipédia


Commentaires

Posts les plus consultés de ce blog

Dossier 1/4 - Dr. Judy Wood "Where Did the Towers Go ?" - WTC 11/09 - un ouvrage scientifique - une autre vérité

Le canon de Pachelbel, le son qui soigne