Libratus: la inteligencia artificial acaba de derrotar a 4 expertos en una partida de póquer

Libratus: la inteligencia artificial acaba de derrotar a 4 expertos en una partida de póquer

La inteligencia artificial Libratus acaba de derrotar a 4 maestros del juego de póquer, gracias a un nuevo método de entrenamiento de IA , en lugar de las técnicas convencionales actuales.

Durante casi tres semanas, Dong Kim se sentó en un casino de Pittsburgh y jugó al póquer con una máquina. Sin embargo, Dong Kim no es sólo un jugador de póquer común y corriente y la máquina en la que está jugando no es una máquina de póquer común y corriente como las demás.

Dong Kim , de 28 años, es uno de los mejores jugadores de póquer del mundo. Mientras tanto, la otra máquina de póquer, Libratus, creada por dos investigadores en informática de la Universidad Carnegie Mellon, no es más que un sistema de inteligencia artificial que se ejecuta en una supercomputadora de Pittsburgh . Durante 20 días consecutivos, cuatro maestros del póquer lucharon contra Libratus en Texas Hold'Em sin límite , una forma de póquer particularmente compleja que incluye estrategias de apuestas para ayudar a los jugadores a superar docenas de cartas.

Libratus: la inteligencia artificial acaba de derrotar a 4 expertos en una partida de póquer

A mitad del partido, Dong Kim comenzó a sentir que la máquina de póquer Libratus podía ver sus cartas. " No creo que sea trampa. Simplemente creo que es muy bueno ", dijo Dong Kim. Eso es genial, de hecho, Libratus no sólo venció a Dong Kim, sino que también venció a otros tres mejores jugadores de póquer del mundo: la primera vez que una inteligencia artificial ha podido hacerlo.

Durante toda la competencia, los creadores de Libratus se mostraron reacios a compartir cómo funciona este sistema de inteligencia artificial: cómo tiene tanto éxito, cómo se puede imitar directamente y cómo percibe a los humanos de una manera que ninguna máquina ha podido hacerlo jamás. Sin embargo, según revelaron los investigadores, Libratus ha alcanzado el nivel de ser más que una simple IA, sino que se basa en tres sistemas distintos que funcionan juntos.

Tenga en cuenta que las IA modernas de hoy funcionan mediante múltiples tecnologías al mismo tiempo, no una sola tecnología. Las redes neuronales profundas están recibiendo mucha atención en los últimos días, y por una buena razón: " Impulsan todo, desde el reconocimiento de imágenes hasta la traducción de idiomas y la búsqueda. Encuentra productos clave de las empresas tecnológicas más grandes del mundo. Sin embargo, el éxito de las redes neuronales artificiales también aporta un soplo de aire fresco a muchas otras técnicas de IA, ayudando a las computadoras a imitar o incluso superar el talento humano ".

Sin embargo, Libratus no utiliza esta red neuronal artificial. Libratus se basa principalmente en otra forma de IA, también conocida como " aprendizaje por refuerzo ", un método extremadamente riguroso de prueba y error. Básicamente, la máquina de póquer Libratus juega contra sí misma una y otra vez.

Libratus: la inteligencia artificial acaba de derrotar a 4 expertos en una partida de póquer

El Deep Mind Lab de Google utilizó el aprendizaje por refuerzo para crear AlphaGo, el sistema que venció al jugador mundial Lee Sedol a principios del año pasado. Sin embargo, existe una diferencia importante entre estos dos sistemas. AlphaGo aprendió a jugar Go analizando 30 millones de movimientos humanos, antes de moldear sus habilidades jugando contra sí mismo. Pero Libratus es todo lo contrario, aprende a jugar al póquer completamente desde cero.

A través de un algoritmo llamado Counterfactual Regret Minimization , comenzó jugando aleatoriamente y finalmente, después de meses de práctica con billones de manos de póquer, alcanzó el nivel que no solo desafía a los mejores jugadores, sino que también juega de una manera que los mejores jugadores no pueden jugar. con una gama más amplia de apuestas y aleatorizar estas apuestas. Por lo tanto, será más difícil para los oponentes adivinar las cartas que sostiene Libratus.

" Le damos a la IA una descripción del juego. No le decimos cómo jugar. Luego desarrolla una estrategia que es completamente independiente del juego humano y puede ser muy diferente a la forma en que los humanos juegan este juego ", dijo Noam. Brown, estudiante de maestría en la Universidad Carnegie Mellon - CMU, quien creó este sistema de IA con su profesor, Tuomas Sandholm.

Libratus: la inteligencia artificial acaba de derrotar a 4 expertos en una partida de póquer

Sin embargo, esa es sólo la primera etapa. Durante el partido en Pittsburgh, un segundo sistema analiza el estado del partido y se centra en la atención del primer sistema. Con la ayuda de este segundo sistema, un " final del juego " que se detalla en un documento de Sandholm and Brown, el primer sistema no tiene que recorrer todos los escenarios que puede explorar. Y sólo necesita recorrer algunos de esos escenarios. Lo especial es que Libratus no sólo aprende antes del juego, sino que continúa aprendiendo incluso mientras juega.

Aunque estos dos sistemas por sí solos son más que suficientes para jugar al póquer de forma eficaz. Pero Dong Kim y otros jugadores todavía encontraron patrones en el juego de la computadora y los explotaron. Por eso Brown y Sandholm crearon un tercer sistema. Todas las noches, Brown ejecutará un algoritmo que puede identificar esos patrones y eliminarlos. " Puede hacer este cálculo durante la noche y todo estará listo al día siguiente ", dijo Brown.

Libratus: la inteligencia artificial acaba de derrotar a 4 expertos en una partida de póquer

Si crees que esto te parece injusto, aun así tienes que aceptarlo, porque así es como funciona la IA. Sin embargo, no solo la IA lo hace, sino que los humanos a menudo también pueden combinar procesos, mejorando, ejecutando y mejorando activamente la IA. En resumen, Libratus es verdaderamente un hito, ya que nos muestra cómo un nuevo tipo de IA podría desempeñar un papel importante en todo, desde las operaciones en Wall Street hasta la seguridad cibernética, las subastas y las negociaciones políticas.

" El póquer es uno de los juegos más difíciles de penetrar para la IA, porque solo se ve información parcial sobre el estado del juego. No existe un único movimiento óptimo. En cambio, la IA tendrá que aleatorizar sus acciones para que los adversarios no estén seguros de cuándo los engaña ", dijo Andrews Ng, quien apoyó el laboratorio central de inteligencia artificial de Google y ahora es científico jefe de Baidu.

Libratus ha hecho esto mejor. Aleatoriza sus apuestas a un nivel que está más allá del pensamiento incluso de los mejores jugadores. Y si eso no funciona, el algoritmo de toda la noche de Brown llenará los vacíos. Un operador financiero puede trabajar de la misma manera. Lo mismo ocurre con un diplomático. Así que Libratus está haciendo una declaración contundente: una máquina puede engañar a un ser humano.

Consulte algunos artículos más:

¡Divirtiéndose!


Europa establecerá el grupo de trabajo ChatGPT

Europa establecerá el grupo de trabajo ChatGPT

El organismo que une a los organismos nacionales de vigilancia de la privacidad de Europa dijo el jueves que había creado un grupo de trabajo dedicado a ChatGPT.

La IA predice la hora de la muerte humana con un 78% de precisión

La IA predice la hora de la muerte humana con un 78% de precisión

Científicos daneses y estadounidenses han colaborado para desarrollar un sistema de inteligencia artificial llamado life2vec, capaz de predecir el momento de la muerte humana con gran precisión.

La IA predice enfermedades urinarias sólo por el sonido de la orina

La IA predice enfermedades urinarias sólo por el sonido de la orina

Un algoritmo de inteligencia artificial llamado Audioflow puede escuchar el sonido de la micción para identificar de manera efectiva y exitosa los flujos anormales y los correspondientes problemas de salud del paciente.

Bartenders, cuidado: este robot puede preparar un cóctel en sólo 1 minuto

Bartenders, cuidado: este robot puede preparar un cóctel en sólo 1 minuto

El envejecimiento y la disminución de la población de Japón han dejado al país sin un número significativo de trabajadores jóvenes, especialmente en el sector de servicios.

Cientos de personas se desilusionaron al saber que la chica que amaban era producto de la IA.

Cientos de personas se desilusionaron al saber que la chica que amaban era producto de la IA.

Un usuario de Reddit llamado u/LegalBeagle1966 es uno de los muchos usuarios enamorados de Claudia, una chica con apariencia de estrella de cine que a menudo comparte seductores selfies, incluso desnudos, en esta plataforma.

12 empresas potenciales más se unen a la alianza de IA de Microsoft.

12 empresas potenciales más se unen a la alianza de IA de Microsoft.

Microsoft acaba de anunciar que 12 empresas tecnológicas más participarán en su programa AI for Good.

La IA recrea personajes de Dragon Ball en carne y hueso

La IA recrea personajes de Dragon Ball en carne y hueso

El usuario @mortecouille92 ha puesto a trabajar el poder de la herramienta de diseño gráfico Midjourney y ha creado versiones excepcionalmente realistas de personajes famosos de Dragon Ball como Goku, Vegeta, Bulma y el anciano Kame. .

7 técnicas para mejorar las respuestas de ChatGPT

7 técnicas para mejorar las respuestas de ChatGPT

Con solo agregar algunas condiciones o configurar algunos escenarios, ChatGPT puede brindar respuestas más relevantes a sus consultas. Veamos algunas formas en que puede mejorar la calidad de sus respuestas de ChatGPT.

Maravíllate ante las hermosas pinturas dibujadas por inteligencia artificial

Maravíllate ante las hermosas pinturas dibujadas por inteligencia artificial

Midjourney es un sistema de inteligencia artificial que recientemente ha causado "fiebre" en la comunidad en línea y en el mundo de los artistas debido a sus pinturas extremadamente hermosas que no son inferiores a las de artistas reales.

Este modelo de IA fue uno de los primeros expertos en descubrir noticias sobre el brote de neumonía de Wuhan.

Este modelo de IA fue uno de los primeros expertos en descubrir noticias sobre el brote de neumonía de Wuhan.

Días después de que China anunciara el brote, con acceso a datos mundiales de ventas de billetes de avión, el sistema de inteligencia artificial de BlueDot siguió prediciendo con precisión la propagación del virus Wuhan Corona a Bangkok, Seúl, Taipei y Tokio.