Perdemos al genio Nash, pero no su equilibrio

Foto: Peter Badge,  CC BY-SA 3.0, (Crop Image)
Foto: Peter Badge (Wikipedia), CC BY-SA 3.0, (Crop Image)

 

 

 

 

 

 

 

 

 

 

 

 

Uno de los padres de la teoría de juegos fallecía el pasado fin de semana junto a su esposa en un accidente de coche. John Forbes Nash, de 86 años, acababa de regresar de Oslo de recoger el prestigioso Premio Abel de la Academia Noruega de Ciencias y Letras por sus trabajos matemáticos. Curiosamente, hace 21 años regresaría también de escandinavia con un premio. En esa ocasión fue galardonado con el Nobel de Economía por sus pioneros trabajos matemáticos en los años 50 del siglo pasado en los que desarrolló los conceptos de equilibrio de la teoría de juegos.

Sus análisis en juegos cooperativos y no cooperativos, conocidos como el Equilibrio de Nash, aportan soluciones a situaciones en que dos o más partes interaccionan tomando decisiones y han tenido un papel esencial en el desarrollo de muchas ramas de la ciencia, como la política, la biología, la filosofía, la informática y por supuesto la economía.

“Una configuración de estrategias, en la que ningún jugador que actúa por su cuenta puede cambiar su estrategia para lograr un mejor resultado para sí mismo”, es la definición de equilibrio ideada por Nash y tiene gran trascendencia en una situación en la que existe mutua desconfianza, sea ésta de la naturaleza que sea.

El protocolo de Coinffeine que permite descentralizar el intercambio de bitcoins se ha desarrollado en base a los trabajos de Nash y la teoría de juegos ya que no hay confianza entre las partes porque no existe un tercero de confianza. Para intercambiar bitcoins y dinero fiat en Coinffeine las partes son emparejadas de manera automática, sin necesidad de conocer quién es su contraparte y esto podría tener grandes riesgos de no ser por mentes maravillosas como la de Nash que han hecho que esto sea posible.

Con el fallecimiento de Nash, el mundo pierde un genio. Pero afortunadamente su legado permanecerá y las aplicaciones que éste pueda tener, serán inmortales.

R.I.P John Forbes Nash

 

 

Perdemos al genio Nash, pero no su equilibrio

Comprendiendo el protocolo Coinffeine (II)

Chicken
Foto: W_Minshull , CC BY 2.0 (Not changes made)

En esta segunda entrada de la serie Comprendiendo el protocolo Coinffeine (recomendamos la lectura de la primera entrega) volvemos a retomar la teoría de juegos necesaria, después de haber aprendido lo útil que resulta para analizar situaciones estratégicas.

Destrucción mutua asegurada

El siguiente concepto que nos interesa y que se adelantó en la anterior entrada es la destrucción mutua asegurada, muy relacionada con los años de la Guerra Fría. Para ambientarnos, pensemos en la película de culto Teléfono Rojo: Volamos hacia Moscú donde Peter Sellers interpreta a un científico que en realidad es una parodia de nuestro amigo Von Neumann (o si preferís el cine en color Juegos de guerra).

Telefono Rojo: Volamos hacia Moscu
Es Von Neumann y ahora lo sabes

En este juego que es la Guerra Fría tenemos dos actores racionales, USA y la URSS que, por lo tanto, tienen en muy alta estima su supervivencia. En ese momento ya se había desarrollado la potencia nuclear tristemente demostrada sobre Hiroshima y Nagasaki como acto de cierre de la Segunda Guerra Mundial y ambas potencias habían entrado en una carrera armamentística que, de haberse desarrollado, podría haber acabado con la humanidad en varias ocasiones.

Durante años parecía que la guerra nuclear estaba a punto de suceder en cualquier momento, pero afortunadamente nunca llegó a producirse. La respuesta a esto la tenemos en el hecho de que cada jugador mantiene por diversos medios la capacidad de responder a un ataque nuclear aunque sea lo último que haga, y aunque las pérdidas son enormes para ambas partes. La ventaja de ser el primero en atacar es insignificante comparada con las pérdidas a asumir, lo que justificaba el coste de tener siempre a punto misiles intercontinentales, submarinos atómicos o aviones dando vueltas por el Ártico para poder dar esa respuesta.

Tabla destruccion mutua asegurada

Equilibrio de Nash

Si hacemos un balance de los posibles desenlaces en forma de tabla veremos que la mejor respuesta a no atacar es también no atacar y, en el caso de que el otro jugador ataque, es indiferente lo que hagamos. A diferencia del dilema del prisionero, no basta con buscar las soluciones dominantes, sino que necesitamos la siguiente mejor cosa, un equilibrio de Nash (sí, también hay película).

Estas situaciones de equilibrio se dan cuando cada jugador no puede mejorar su situación cambiando su estrategia, si el otro jugador persiste. En el juego que hemos presentado a modo de ejemplo encontramos dos equilibrios: (No atacar, No atacar) y (Atacar, Atacar).

Un equilibrio de Nash es una situación estable por definición y, por lo tanto, en la vida real se suelen acabar dando estos resultados o se suele tender a ellos. Sin embargo, no todos los equilibrios se tienen que dar y, dadas las consecuencias, en este juego el que finalmente se da es el del final feliz (No atacar, No atacar) al igual que sucedió por ejemplo durante la Crisis de los misiles en Cuba.

The only winning move is not to play

La lección que podemos extraer de este juego es que no hace falta un árbitro o tercero de confianza si tenemos un mecanismo por el que haya más que perder de lo que se podría ganar si se abandona la senda de la colaboración. Este principio es muy importante para diseñar un protocolo de intercambio descentralizado como Coinffeine y para evitar aberraciones como las “guerras preventivas”.

El juego del gallina

El siguiente ingrediente que necesitamos conocer es el concepto de movimiento estratégico que vamos a ilustrar con el juego del gallina (Sí, habéis acertado. Rebelde sin causa es una representación de este juego).

Rebelde sin causa

La expresión “juego del gallina” se aplica como metáfora a una situación en la que dos bandos se enzarzan en una escalada en la que no tienen nada que ganar y en la que solo el orgullo evita que se echen atrás. Se representa como una competición automovilística en la que dos vehículos conducen en dirección al contrario. El primero que abandona la trayectoria del choque pierde por cobarde y el otro gana. Si ambos se apartan, ninguno pierde nada, mientras que si ambos siguen, se estrellan y se matan.

Tabla El juego del gallinaUn vistazo rápido a la tabla nos hace comprobar que no hay estrategias dominantes porque si el otro conductor se aparta lo mejor es seguir y si no se aparta la mejor respuesta sería apartarse. Al igual que en el dilema del prisionero, este tipo de situación es común en el mundo real.

Un movimiento estratégico consiste en modificar el juego para cambiar su resultado y poder cambiar el equilibrio. Esto sucedería si el Conductor 1 arranca el volante y lo tira por la ventanilla de forma visible para que el otro conductor se dé cuenta de que sus opciones se han reducido dramáticamente.

Tabla movimiento estrategico El juego del gallinaComo resultado tenemos un nuevo juego en el que si hay una estrategia dominante para el conductor 2: apartarse ya que sólo la muerte (-∞) le espera si continúa. Podemos decir que al restringir las opciones y “arrancar el volante”, hacemos creíble la amenaza de no apartarnos y cambiamos el signo del juego.

Los movimientos estratégicos son terriblemente útiles para diseñar juegos en los que la colaboración sea el camino dominante. Eso sí, no recomiendo hacer esto en casa ya que podríais ver el volante del otro conductor salir también por la ventanilla…

En la siguiente entrega hablaremos del protocolo Coinffeine como juego, aplicando todos estos conceptos.

 

Para saber más:

Comprendiendo el protocolo Coinffeine (II)

Comprendiendo el protocolo Coinffeine (I)

Deal
Foto: Brian Alano, CC BY 2.0, (Not changes made)

Coinffeine es una empresa, una aplicación de escritorio y, lo más importante de todo, un protocolo que permite descentralizar el intercambio de bitcoins. Ésta es la primera de una serie de entradas en las que queremos explicar los fundamentos del protocolo Coinffeine.

Empecemos con la siguiente situación, muy cinematográfica, en la que dos personas que no confían la una en la otra quieren hacer un intercambio. Ésta es una situación de riesgo, ya que, si la primera persona entrega su maletín antes de que la otra persona le dé la mercancía, corre el riesgo de quedarse sin nada y viceversa.

Confianza sin necesidad de un tercero

Esta situación es análoga a la que tenemos en un intercambio de bitcoin en Coinffeine: maletín -> FIAT, mercancía -> bitcoin. No hay confianza entre las partes porque no existe un tercero en el que ambas confían. Las partes han sido emparejadas sin necesidad de conocer quién es su contraparte.

Esta situación parece irresoluble en principio, salvo por el hecho de que nos podemos apoyar en dos poderosas herramientas: la primera es que estamos hablando de agentes racionales, es decir, que miran por su propio beneficio, y la segunda es que asumimos la presencia de bitcoin. Gracias a lo primero podemos utilizar la teoría de juegos para analizar el problema, y gracias a lo segundo tenemos mecanismos, como la multifirma, que nos permiten utilizar los fondos de formas nuevas y creativas.

La teoría de juegos

Hoy nos vamos a centrar en esta primera herramienta: la teoría de juegos, que es una disciplina a medio camino entre las matemáticas y la economía y que es aplicable a situaciones en las que agentes racionales toman decisiones en un escenario bien definido.

Aunque hay reminiscencias del tipo de razonamiento que se hace en la teoría de juegos en muchos textos antiguos como El arte de la guerra de Sun Tzu o en la obra de Charles Darwin, se puede decir que este concepto aparece en 1944 con el libro de John von Neumann y Oskar Morgenstern titulado Theory of Games and Economic Behavior. Von Neumann es un viejo conocido de los ingenieros informáticos ya que, junto con el gran Alan Turing, es uno de los padres de la informática.

La teoría de juegos encaja muy bien con la época en la que se formalizó y durante la Guerra Fría parece como si la terminología militar se filtrase hasta convertirse en jerga de este campo. Los “juegos” pueden ser vistos como juegos de guerra, se habla de “estrategias”… Al fin y al cabo, se salió de la Guerra Fría gracias a la destrucción mutua asegurada, en la que profundizaremos en la siguiente entrada.

El dilema del prisionero

Un buen punto de partida para adentrarnos en los juegos es el del dilema del prisionero, probablemente el juego más conocido, y que nos servirá para identificar los elementos que hay que formalizar en los juegos antes de poder analizarlos y llegar a conclusiones. El juego está ambientado en una comisaría en la que tenemos a dos ladrones que han sido detenidos por la policía y que se encuentran incomunicados en salas de interrogatorio distintas. Los  actores racionales van a ser en este caso los dos ladrones.

El siguiente aspecto a considerar en todo juego es qué acciones disponibles tiene cada actor. En este caso, ambos ladrones se enfrentan a una decisión difícil: la policía les está presionando para que colaboren con la justicia y denuncien (D), aunque se pueden mantener firmes y callar (C). La policía no tiene pruebas suficientes como para que sean condenados a más de un año de cárcel, por lo que les ofrecen a cada uno de ellos salir libres si colaboran para encerrar por 10 años a su compinche. Sin embargo hay un problema para ellos, ya que si los dos deciden colaborar con la justicia, ambos irán a la cárcel aunque sólo 5 años cada uno. Estas posibles condenas son los incentivos o costes de este juego y es el tercer elemento que hay que buscar al caracterizar un juego.

Toda esta información se puede concentrar en una tabla. Las filas representan las posibles acciones de uno de los jugadores y las columnas las del otro jugador. En las celdas ubicamos los incentivos correspondientes a cada uno de los escenarios. El resultado se conoce como juego en forma estratégica y, para el caso concreto del dilema del prisionero tiene esta pinta:

Acciones de los jugadores e incentivos en el dilema de los prisioneros

Prisoners Dilemma

Estrategia dominante

Ahora ya tenemos suficientes elementos como para analizar este juego. Para nuestro ejemplo, podemos aplicar un concepto muy sencillo llamado estrategia dominante, en otros casos hay que utilizar otros conceptos de solución (solution concepts, en inglés) más complicados. Las estrategias dominantes son aquellas que son la mejor respuesta a cualquier cosa que haga el otro jugador y, por definición, será la estrategia elegida por el jugador.

Para analizar las estrategias dominantes del ladrón azul, tenemos que ver qué le conviene hacer dependiendo de las acciones del ladrón naranja:

– Si su compinche decide callar (C), y el también calla (C) tendrá un año de prisión, pero si denuncia (D) saldrá libre. En este caso le conviene D.
– Si su compinche decide denunciar (D), preferirá hacer lo mismo para pasar 5 años a la sombra, en lugar los 10 que corresponden a callar.

Independientemente de lo que haga el otro jugador, la mejor respuesta es denunciar y como el juego y la tabla son simétricas esto sucede para ambos jugadores y se dice que hay un equilibrio en (D, D). Este juego y su solución resultan muy interesantes porque ayuda a entender por qué puede ser racional no colaborar en determinadas situaciones, a pesar de que se podría salir ganando.

Juegos en situaciones cotidianas

Hay muchas situaciones a nuestro alrededor que pueden ser expresadas mediante juegos cuyos incentivos tienen distintos valores, pero con las mismas relaciones entre ellos y con el mismo resultado práctico. Esto nos ayuda a entender por qué es racional no informarse antes de votar (ignorancia racional), o por qué es tan difícil cuidar del medio ambiente (tragedia de los comunes), entre otras situaciones.

Pero volvamos a la cinematográfica situación inicial del intercambio de bitcoins en Coinffeine: está claro que hay jugadores racionales, que tienen una serie de acciones que pueden tomar y que podemos concebir esta situación como un juego. Sin embargo, todavía no tenemos todas las piezas, tenemos que diseñar las acciones posibles de forma que, en lugar de que no haya colaboración como en el dilema del prisionero, sí que la haya, y que el camino a seguir por ambos jugadores sea la colaboración. Para ello aprenderemos en qué consiste la destrucción mutua asegurada y qué es arrancar el volante en la siguiente entrega.

Si te apetece profundizar en la teoría de juegos:

Teoría de juegos: https://es.wikipedia.org/wiki/Teor%C3%ADa_de_juegos
Buen libro introductorio: http://artofstrategy.net/
Curso introductorio en Coursera: http://online.stanford.edu/gametheory-wi13

Comprendiendo el protocolo Coinffeine (I)