Entendiendo la Distancia Nash

Una de las preguntas más comunes al estudiar con solvers relacionadas con la distancia Nash es: “¿Por qué el solver toma esta acción cuando aquella acción tiene un EV más alto?”. Por ejemplo, en el siguiente escenario podemos ver que hacer check tiene un EV más alto que apostar, sin embargo, la solución quiere apostar esta mano:

ejemplo de distancia nash
Ejemplo de ruido de solver

Para entender por qué ocurre esto, primero debemos comprender un principio fundamental de la teoría de juegos:

La ley de acciones mixtas

En el equilibrio perfecto, las acciones mixtas siempre deberían tener el mismo valor esperado (EV, por sus siglas en inglés). Es decir, cuando una mano combina dos o más acciones, esas acciones deben tener el mismo EV. Piénsalo; ¿por qué elegirías intencionalmente una estrategia peor? Una estrategia verdaderamente perfecta nunca “sacrificaría el EV por el equilibrio”, por así decirlo. Esta es una ley fundamental del Equilibrio de Nash.

En el ejemplo anterior vemos que el solver mezcla su estrategia con A7o entre hacer check, apostar un 27%, 73% y 127%. Sin embargo, estas acciones no tienen el mismo EV. Entonces, ¿por qué vemos que esto ocurre en nuestras soluciones? ¿Por qué hacer check con A7o se considera una “inexactitud” cuando es la acción de mayor EV? Todo ello está relacionado con la distancia Nash como veremos ahora:

Ruido del solver

Las soluciones GTO no son perfectas. En la práctica, las soluciones GTO no se resuelven con una precisión perfecta, se resuelven hasta cierto umbral de explotabilidad.

Cuanto menos explotable sea toda la solución, mayor será su precisión. Definimos la precisión de una solución con una métrica llamada “Distancia Nash” o dEV. Como referencia, GTO Wizard generalmente se resuelve hasta aproximadamente un 0,2%-0,3% del bote. ¿Qué tan explotable es esto?

Imaginemos que tenemos un escenario de BTN vs BB, el bote es de 5,5BB. Eso significa que la mejor estrategia posible puede explotar esta solución como máximo en un 0,3% de 5,5, es decir, 0,017BB por mano. Esto está mucho más allá del nivel de juego humano.

Esto es lo que llamamos “ruido del solver”. Las manos no siempre toman la acción de mayor EV. Si se resolviera con una precisión perfecta, este ruido desaparecería. Todas las acciones mixtas tendrían el mismo EV.

En situaciones en las que se toma una línea que literalmente nunca se juega, es posible que notes discrepancias de EV masivas. Esto se debe a que el solver deja de calcular líneas dominadas (0%) temprano durante el proceso de resolución para aumentar la eficiencia. Esto es normal, aunque las estrategias y los EV en esas líneas son menos precisos.

Explotabilidad y distancia Nash

Entonces, ¿esto significa que la acción de mayor EV siempre es la mejor jugada?

No necesariamente. Contra esta estrategia específica, resulta ser la mejor jugada. Sin embargo, si siempre haces check con A7o, teóricamente el BB podría ajustar su estrategia de manera que hacer check se convierta en un EV más bajo. Recuerda, el solver mezcla para permanecer inexplotable.

¿Qué sucedería si resolviéramos el ejemplo anterior con una precisión perfecta? ¿Hacer check seguiría siendo la jugada de mayor EV?

Una de las dos cosas sucederá con A7o:

Hacer check convergerá hacia un EV más bajo y nunca se usará; o Hacer check convergerá hacia el mismo EV que las otras opciones de apuesta y podría seguir usándose con cierta frecuencia. No hay forma de saberlo con certeza sin resolver con una precisión perfecta. En términos generales, las acciones de baja frecuencia desaparecerán y tendrán un EV más bajo, mientras que las acciones tomadas con una frecuencia razonable seguirán siendo parte de la estrategia. Por eso las acciones tomadas con una frecuencia inferior al 3,5% se marcan como una “inexactitud”.

Echemos un vistazo a otro ejemplo:

Ejemplo de distancia Nash

ejemplo de distancia nash

Ejemplo 2: A7o mezclando calls a pesar de que hacer call tiene un EV más alto

Aquí vemos que A7o combina hacer call y foldear; sin embargo, hacer call parece tener un EV significativamente más alto que foldear. Hacer call tiene aproximadamente 1,7BB más de EV que foldear. Entonces, ¿por qué hace calls mezclados?

Bueno, necesitamos poner esto en perspectiva. El bote después de hacer call será de 200,05BB. Entonces, un error de 1,8BB es solo aproximadamente el 0,9% del bote. En realidad, esto está mucho más cerca de lo que parece. Un margen de error del 1% parece mucho más grande cuando el bote se vuelve más grande.

El problema de hacer call en todas las situaciones es que te volverías explotable. Imagina hacer call con todos estos límites entre bluff-catchers. De repente estarías haciendo overcalling y podrías ser explotado por un oponente con muchas manos de valor.

¿Por qué no resolver con una precisión perfecta?

Las soluciones perfectamente precisas simplemente no son factibles a escala de producción en masa. El problema es que los solvers convergen mucho más lentamente a medida que se acerca al equilibrio. Toma aproximadamente el mismo tiempo pasar de completamente sin resolver a una distancia Nash del 0,5% de dEV que pasar de un 0,5% a un 0,25% de dEV.

Duplicar la precisión duplica el tiempo necesario para resolver. Y hay rendimientos decrecientes. Una solución precisa hasta un 0,3% de dEV es casi idéntica a una solución resuelta hasta un 0,15% de dEV, y ambas seguirían teniendo ruido del solver.

La alternativa es crear árboles de juego muy simples que sean más fáciles de resolver. Esto crea sus propios problemas, ya que simplificar demasiado tu árbol de juego conduce a distorsiones artificiales causadas por el solver que explota las limitaciones de ese árbol.

Entonces, al final, no tiene mucho sentido obsesionarse con una precisión increíblemente alta y un EV microscópico. De todas formas, la solución está mucho más allá de los niveles de explotabilidad humana.

Aquí tienes un ejemplo de una de nuestras resoluciones. Como puedes ver, el progreso ocurre rápidamente al principio, luego se vuelve más lento a medida que se acerca al equilibrio. Esta se resolvió hasta un 0,3% del bote.

gráfica de distancia nash

Lo que debes recordar sobre la distancia Nash

Cuando ves que el solver mezcla entre acciones, en lugar de buscar la acción de mayor EV, debes mirar las acciones de mayor frecuencia. Esto se debe a que cualquier discrepancia de EV que veas se debe al ruido en la solución.

Trata las acciones mixtas como si tuvieran el mismo EV. Cualquier discrepancia que veas puede considerarse como el margen de error (todas las manos tienen aproximadamente ese EV).

El objetivo de GTO es encontrar la estrategia de mayor EV que no pueda ser explotada. Los errores marginales que ves se encuentran en cada solución del solver. Tu objetivo es abstraer una estrategia de nivel más alto y desarrollar un razonamiento GTO, no memorizar frecuencias.

Fuente: GTO Wizard

Deja un comentario