¿Cuál es el dilema del prisionero? - Albert Tucker y la teoría de juegos

¿Quieres explorar más? 📂 Explorar Categorías 🔥 Tendencias 🎓 Cursos

Imagina que te acaban de arrestar junto con un cómplice. Os encierran en habitaciones separadas y un fiscal te susurra un trato diabólico: «Si traicionas a tu compañero y él no te traiciona, sales libre y él se pudre 10 años. Si ambos os traicionáis, los dos cumplís 5 años. Si ambos calláis, solo cumpliréis 1 año por un cargo menor». ¿Qué harías? Esta es la esencia del Dilema del Prisionero, un concepto que cambió para siempre nuestra comprensión de la estrategia y la cooperación humana. Lo que empezó como una simple anécdota creada por el matemático Albert Tucker se ha convertido en una de las ideas más influyentes de la teoría de juegos, con aplicaciones que van desde la economía hasta la biología evolutiva. Prepárate para descubrir por qué, a veces, la decisión más racional conduce al peor resultado colectivo.

Los orígenes de una idea revolucionaria: de la Guerra Fría a Stanford

Corría el año 1950. El mundo se tambaleaba entre las cenizas de la Segunda Guerra Mundial y el creciente pavor de la Guerra Fría. En los pasillos de la corporación RAND, un think tank estadounidense, dos matemáticos, Merrill Flood y Melvin Dresher, trabajaban en aplicaciones de la teoría de juegos que pudieran arrojar luz sobre las complejas estrategias nucleares entre Estados Unidos y la Unión Soviética. Fue en ese contexto donde diseñaron un experimento mental que exponía la cruda tensión entre el interés individual y el bien común.

Sin embargo, fue un matemático de Princeton, Albert W. Tucker, quien moldeó esa árida fórmula matemática y la transformó en la historia cautivadora y accesible que hoy conocemos. En un seminario para psicólogos de la Universidad de Stanford, Tucker buscaba explicar de forma sencilla los nuevos dilemas de la emergente teoría de juegos. Dejó a un lado las matrices de pagos y los complicados cálculos de utilidad, y en su lugar, contó la parábola de los dos prisioneros. Su intuición fue brillante: al personalizar la abstracción en una historia humana concreta, el dilema se volvió inolvidable y su estudio se popularizó inmediatamente.

El planteamiento del dilema: la matriz que decide tu destino

Para entender por qué este dilema es tan profundo, debemos desgranar su estructura lógica con precisión. El juego, en su versión clásica para dos jugadores, establece cuatro escenarios posibles, cada uno con sus consecuencias. Si llamamos a los prisioneros Jugador A y Jugador B, y sus opciones son «Cooperar» (C: guardar silencio) o «Delatar» (D: traicionar al otro), la situación se puede representar en una matriz de pagos. Los valores negativos representan los años en prisión, que es lo que buscamos minimizar:

Jugador A \ Jugador B	B Coopera (Silencio)	B Delata (Traiciona)
A Coopera (Silencio)	A: -1 año, B: -1 año	A: -10 años, B: 0 años
A Delata (Traiciona)	A: 0 años, B: -10 años	A: -5 años, B: -5 años

Analicemos la lógica individual de cada prisionero, que es el corazón del problema. Ambos están incomunicados, por lo que deben razonar sin saber qué hará el otro.

Tema relacionado:
Críticas a la teoría humanista en Psicología: Limitaciones científicas y cuestionamientos

Razonamiento del Jugador A: «No sé qué hará B, así que debo analizar ambos casos. Si B coopera y guarda silencio, a mí me conviene delatar: así salgo libre (0 años) en lugar de pasar 1 año en prisión. Si B me delata, también me conviene delatar: así cumplo 5 años en lugar de los 10 que me caerían si yo fuera el único leal. En cualquier caso, delatar es mi mejor opción individual».
Razonamiento del Jugador B: «Siguiendo la misma lógica que A, si A coopera, me conviene delatar para salir libre. Si A delata, me conviene delatar para cumplir 5 años en lugar de 10. Sin importar lo que haga A, mi mejor opción es delatar».

Esta conclusión es demoledora. La estrategia de «Delatar» es lo que en teoría de juegos se denomina una estrategia estrictamente dominante: produce el mejor resultado para un jugador sin importar la acción que elija el otro. El resultado inevitable de seguir esta lógica es que ambos se delatan mutuamente y terminan con una condena de 5 años cada uno. Aquí reside la paradoja: el resultado de la racionalidad individual es un fracaso colectivo, pues si ambos hubieran cooperado, habrían obtenido un resultado mucho mejor (solo 1 año de condena).

¿Por qué es una «no-cero-suma» y qué es el Equilibrio de Nash?

Para apreciar la singularidad del dilema, es crucial contrastarlo con otro tipo de juegos. Un juego de suma cero es aquel donde la ganancia de un jugador es exactamente la pérdida del otro, como en el ajedrez o el póker. La suma total de beneficios es siempre cero.

El Dilema del Prisionero, en cambio, es un juego de no-cero-suma. Las ganancias y pérdidas de los jugadores no se compensan de forma simétrica. La cooperación puede crear valor (reduciendo la condena total de 10 años a solo 2) o la deserción puede destruirlo (aumentando la condena conjunta a 10 años). No se trata de un simple «yo gano, tú pierdes», sino de una interdependencia estratégica donde la colaboración puede generar un mejor resultado global.

El resultado de la traición mutua no solo es el producto de la lógica dominante, sino que constituye el único Equilibrio de Nash del juego en su versión simple. Este concepto, desarrollado por el matemático John Nash, describe una situación en la que ningún jugador puede mejorar su resultado cambiando unilateralmente su estrategia, asumiendo que los demás mantienen la suya. Partiendo del punto en que ambos se traicionan, si un prisionero decidiera por sí solo cooperar, su castigo aumentaría a 10 años. Por tanto, a pesar de ser un resultado pésimo para ambos, el equilibrio es estable.

La clave temporal: Cuando un juego se convierte en muchos

Hasta ahora, hemos hablado de un dilema con una sola ronda. Pero la vida real rara vez funciona así. Las relaciones comerciales, las amistades o las treguas militares implican interacciones repetidas una y otra vez con los mismos actores. Cuando el Dilema del Prisionero se juega de forma repetida, nace el Dilema del Prisionero Iterado, y su dinámica cambia por completo.

Tema relacionado:
Mentalidad Progresista: Qué es, características y ejemplos

En un juego iterado, la estrategia no se limita a una decisión aislada, sino que se convierte en una política de respuesta a las acciones del otro. La traición egoísta en una ronda puede generar represalias en la siguiente, haciendo que la estrategia puramente egoísta de «siempre delatar» deje de ser la más rentable a largo plazo. Un famoso torneo informático organizado por el politólogo Robert Axelrod demostró que la estrategia más exitosa no era la más agresiva, sino una sorprendentemente simple y cooperativa llamada «Tit for Tat» («Ojo por ojo»), que empezaba cooperando y luego simplemente copiaba en cada ronda la jugada anterior de su oponente. De este modo, premiaba la cooperación y castigaba la deserción, fomentando la cooperación mutua.

El dilema en la vida real: ratas, empresas y el calentamiento global

La genialidad del dilema reside en su aplicabilidad universal. No es solo una curiosidad matemática; es un patrón que emerge en multitud de fenómenos.

En la biología, experimentos con ratas han demostrado que estos animales pueden resolver dilemas de cooperación en escenarios iterados. En un estudio, dos ratas en jaulas separadas debían decidir si presionar una palanca para cooperar y recibir una recompensa moderada (bolitas de azúcar) o no hacerlo. Si una presionaba y la otra no, la primera se llevaba una recompensa mayor y la segunda nada. Si ambas cooperaban, ambas recibían una recompensa. Con el tiempo, la frecuencia de la cooperación mutua aumentó, demostrando que incluso los cerebros más simples pueden encontrar el camino hacia la colaboración cuando el juego se repite. Otros investigadores han observado comportamientos similares en intercambios de servicios entre animales, como el acicalamiento a cambio de comida, conocidos como «reciprocidad directa».

En la economía, el dilema explica por qué dos empresas competidoras en un oligopolio pueden enzarzarse en una guerra de precios destructiva. Si ambas mantienen precios altos (cooperan), obtienen grandes beneficios. Sin embargo, la tentación de una de ellas de bajar ligeramente los precios (delatar) para ganar cuota de mercado puede llevar a la otra a responder de igual modo, resultando en precios bajos y menores beneficios para ambas (el peor resultado colectivo).

En la política internacional, la carrera armamentística o la incapacidad para frenar el cambio climático son ejemplos colosales. Todos los países se beneficiarían de reducir sus emisiones de CO2 (cooperar), pero el incentivo individual para no hacerlo y aprovecharse del esfuerzo ajeno sin asumir los costes (delatar) es enorme. Si todos ceden a ese incentivo, el resultado es una catástrofe climática que perjudica a todos. El concepto de «tragedia de los comunes» está íntimamente ligado a esta dinámica.

Tema relacionado:
¿Qué es la psicología cualitativa? Definición y características

Resultados de Aprendizaje

Al finalizar la lectura de este artículo, deberías ser capaz de:

Identificar a Albert Tucker como el creador de la parábola del Dilema del Prisionero y a Merrill Flood y Melvin Dresher como los autores del modelo matemático original en RAND.
Explicar la estructura básica del dilema, incluyendo las opciones de cooperar y delatar, y los cuatro escenarios de pago resultantes.
Definir con precisión por qué la estrategia de «delatar» se considera una estrategia estrictamente dominante y cómo esto conduce a un resultado subóptimo para ambos jugadores.
Distinguir entre un juego de suma cero y uno de no-cero-suma, ubicando el Dilema del Prisionero en esta última categoría.
Describir el concepto de Equilibrio de Nash y aplicarlo al resultado de «traición mutua» del dilema en su versión simple.
Reconocer cómo la repetición del juego (Dilema del Prisionero Iterado) cambia la dinámica estratégica y permite la emergencia de la cooperación, identificando ejemplos en biología, economía o política.

Twittear

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo Editor y fundador

¿Cuál es el dilema del prisionero? – Albert Tucker y la teoría de juegos