Trallero Reiser: El día de las máquinas

Trallero Reiser: El día de las máquinas 0001

Se armó un jolgorio enorme: un grupito de tipos gritaban enfervorizados, mientras que otros bajaban la cabeza, conscientes de su derrota. Estamos en julio de este año, en un stand del Las Vegas Convention Center, y lo que acaba de ocurrir, puede ser algo crucial para el desarrollo de la inteligencia artificial. En la Gaming Life Expo del Rio All-Suite Hotel & Casino, un programa informático, llamado Polaris gana a todo un equipo de jugadores de póquer de primera línea mundial. Cada uno de los seleccionados para jugar contra la máquina, había acreditado un mínimo de ganancias de un millón de dólares.

Es posible que algunos vean la victoria como un paso agigantado que demuestra la superioridad de las máquinas sobre los humanos, y otros quizá lo vean tan sólo como un avance de lo que está por venir en los próximos años. Sea cual sea el caso, da que pensar.

Echando la vista atrás, al deporte del ajedrez, en 1997, la Deep Blue, el juguetito desarrollado por IBM, se convirtió en la primera máquina capaz de derrotar a todo un campeón mundial de ajedrez, Gary Kasparov. Y el año pasado, unos desarrolladores anunciaron el desarrollo de un software imbatible en el juego de las damas. Estos dos juegos tienen un factor determinante en común: pueden encarar a sus oponentes con toda su habilidad matemática y potencia de proceso para calcular dónde desembocarán cada uno de los posibles movimientos que pueden realizar, y de ese modo siempre escoger el mejor, así que no es de extrañar que las maquinas puedan imponerse a los humanos en este ámbito.

Pero amigos, el póquer es completamente diferente. Es un juego donde se necesita astucia, saber farolear y engañar, lo cuál no es que esté asociado tradicionalmente a un hierro relleno de puertas lógicas. Así que el éxito del Polaris aún no significa que de momento pueda imponerse a jugadores de la talla de Negreanu o Ivey. Al menos, de momento.

La modalidad de póquer en la que Polaris es todo un hacha es limit Holdem heads up, una modalidad sin tantos matices psicológicos, de farol o factor humano como el no limit, sino puramente más matemáticos. Vamos, que el cacharrito no está programado para ponerse en all in de farol en no limit, pero aún así, la pura matemática le ha ayudado a imponerse en la modalidad de limit a aunténticos cracks de mundillo. Pero tranquilos, tiempo al tiempo, están preparando una nueva versión del software que le permita jugar en heads up a no limit, esperando obtener los exitosos resultados de la versión de limit.Y tienen previsto tenerlo listo para el año que viene, así que en cuestión de 6-7 meses quizá podamos asistir a un acontecimiento que puede ser histórico: Polatis versus un equipo de gurús de no limit Holdem.

El responsible del proyecto, Michael Bowling, de la Universidad de Alberta, en Canadá, está seguro de que llegará a verlo con sus propios ojos en algún momento, aunque no sabe si sucederá en 5 años o en 50: Polaris podrá ganar a cualquiera de las figuras mundiales del póquer.

¿Y cómo funciona la maquinita? Bien, como ya sabeis, a no ser que tengais un superusuario o cartas marcadas, los jugadores de póquer no pueden ver las cartas de sus oponentes, y deben hacer sus jugadas en función de la observación del juego, cálculos en función de odds, outs, pot odds... Esto es algo mucho más complicado para el ordenador que no el ajedrez o las damas, donde todas las piezas están en el tablero cuando se toman las decisiones. Así que si hay una buena potencia de procesador, la estrategia óptima se puede desarrollar creando un "árbol de decisiones", es decir, un mapa con todas las posibles futuras jugadas, donde cada rama del árbol representa una jugada. De este modo se pueden evaluar todas las opciones para llegar a la victoria. Pero, ¿y en el póquer? No tenemos una información completa de todo lo que ocurre. Resulta un problema porque aparte de la gran cantidad de permutaciones posibles de combinaciones de cartas y apuestas, uno de los problemas fundamentales es que la mejor estrategia no siempre es la misma, ya que depende en gran medida del estilo de juego de tu oponente. Y se entra en un terreno donde la información puede ser poco fiable, puede ser imperfecta, ser el resultado de un engaño deliberado por parte del oponente.

De hecho, cuantas más situaciones se puedan dar en un juego, más memoria necesita un ordenador para ejecutar sus cálculos. En el 2005, el grupo de la Universidad de Alberta desarrolló nuevos algoritmos, capaces de manejar hasta 10.000 millones de estados de juego. Pero es que en un heads up de limit holdem se puden dar, y agarraos a la sila, hasta 10 elevado a la 18 situaciones de juego diferentes. Para solventar eso, se puede enseñar al software a actuar de manera idéntica si recibe dos cartas inferiores a 6 que no son del mismo palo, no son consecutivas o no son una pareja. Pero a medida que se mejora el algoritmo, ya no hace falta que se den estas reglas, y se reducen de este modo los errores potenciales.

La nueva versión del software no limit del Polaris puede manejar apuestas de diferente tamaño, así que por ejemplo puede reaccionar igual con una apuesta de 9 u 11 chips, por ejemplo, simplificando el trabajo computacional. El programita ha aprendido las estrategias de juego óptimas gracias a una base de datos proviniente de la simulación de 800 millones de manos de juego heads up. Estas estrategias están introducidas en toda una serie de bots, llamados Sr. Rubio, Sr. Rosa o Agente Naranja (¿les gustará Tarantino?), y cada uno de ellos está adaptado a contrarrestar unos estilos de juego determinados.

Toda esta investigación ha atraido un enorme interés, ya que se espera que en un futuro los ordenadores puedan resolver problemas que tienen un incertidumbre similar a la que se encuentra en una mesa de póquer. Para que os hagais una idea, hay grandes empresas que han contratado a expertos en teoría del juego para tareas como la licitación de contratos o fijar precios para sus productos, e incluso los biólogos han usado un enfoque similar para estudiar la adopción de decisiones en el mundo animal. ¿Pero por qué despierta esto tanto interés? Pues porque en el mercado financiero, las cosas son más parecidas al póquer que al ajedrez, no tienes la información completa del estado del juego en un momento determinado.

Y poniendo los pies en el suelo, ¿qué hay de los bots en el póquer on line? Bien, según los expertos que asesoran a las salas on line, sólo 1 de cada 10 hace dinero para su amo y señor, el resto pierden en el juego. Aunque a un modo más casero, y con unos medios limitados y domésticos, los hay que afirman que ganan de 30 a 35.000 dólares anuales con sus bots. Quizá esté llegando ya el día de las máquinas.

Más historias

¿Qué opinas?