Libratus - inteligența artificială tocmai a învins 4 experți într-un joc de poker

Libratus - inteligența artificială tocmai a învins 4 experți într-un joc de poker

Inteligența artificială Libratus tocmai a învins 4 maeștri în jocul de poker, datorită unei noi metode de antrenament AI , în locul tehnicilor convenționale actuale.

Timp de aproape trei săptămâni, Dong Kim a stat la un cazinou din Pittsburgh și a jucat poker cu o mașină. Cu toate acestea, Dong Kim nu este doar un jucător de poker obișnuit și mașina pe care o joacă nu este o mașină de poker obișnuită ca celelalte.

Dong Kim , în vârstă de 28 de ani, este unul dintre cei mai buni jucători de poker din lume. Între timp, cealaltă mașină de poker - Libratus, creată de doi cercetători în informatică de la Universitatea Carnegie Mellon, este doar un sistem de inteligență artificială care rulează pe un supercomputer din Pittsburgh . Timp de 20 de zile consecutiv, patru maeștri de poker s-au luptat cu Libratus în Texas Hold'Em no-limit , o formă deosebit de complexă de poker care include strategii de pariere pentru a ajuta jucătorii Jucătorii trebuie să depășească zeci de cărți.

Libratus - inteligența artificială tocmai a învins 4 experți într-un joc de poker

La jumătatea meciului, Dong Kim a început să simtă că aparatul de poker Libratus îi poate vedea cărțile. „ Nu cred că înșală. Cred doar că este foarte bine ”, a spus Dong Kim. Este grozav, de fapt, Libratus nu numai că l-a învins pe Dong Kim, dar a învins și alți trei jucători de poker de top din lume - pentru prima dată când o inteligență artificială a reușit să facă acest lucru.

Pe tot parcursul competiției, creatorii Libratus au rămas reticenți în a împărtăși modul în care funcționează acest sistem de inteligență artificială – cum are atât de mult succes, cum poate fi imitat în mod direct, percep oamenii într-un mod în care nicio mașină nu a putut să-l facă vreodată. Cu toate acestea, conform a ceea ce au dezvăluit cercetătorii, Libratus a atins nivelul de a fi mai mult decât o simplă IA, dar se bazează pe trei sisteme distincte care lucrează împreună.

Rețineți că IA-urile moderne de astăzi sunt operate de mai multe tehnologii în același timp, nu de o singură tehnologie. Rețelele neuronale profunde au atras multă atenție în ultimele zile și din motive întemeiate: „ Ele alimentează totul, de la recunoașterea imaginilor la traducerea limbilor și la căutare. găsiți produse cheie ale celor mai mari companii de tehnologie din lume. Cu toate acestea, succesul rețelelor neuronale artificiale, de asemenea aduce o gură de aer proaspăt multor alte tehnici AI, ajutând computerele să imite sau chiar să depășească talentul uman ”.

Cu toate acestea, Libratus nu folosește această rețea neuronală artificială. Libratus se bazează în primul rând pe o altă formă de IA, cunoscută și sub numele de „ Învățare prin consolidare ”, o metodă extrem de riguroasă de încercare și eroare. În esență, aparatul de poker Libratus joacă jocul împotriva lui însuși iar și iar.

Libratus - inteligența artificială tocmai a învins 4 experți într-un joc de poker

Deep Mind Lab de la Google a folosit învățarea prin consolidare pentru a construi AlphaGo, sistemul care l-a învins pe jucătorul mondial Lee Sedol la începutul anului trecut. Cu toate acestea, există o diferență importantă între aceste două sisteme. AlphaGo a învățat să joace Go analizând 30 de milioane de mișcări umane, înainte de a-și modela abilitățile jucând împotriva lui însuși. Dar Libratus este opusul, el învață să joace poker complet de la zero.

Printr-un algoritm numit Counterfactual Regret Minimization , a început prin a juca aleatoriu și, în cele din urmă, după luni de antrenament cu trilioane de mâini de poker, a atins Nivelul nu numai că îi provoacă pe cei mai buni jucători, ci și joacă într-un mod în care cei mai buni jucători nu pot – juca cu o gamă mai largă de pariuri și randomizați aceste pariuri. Prin urmare, va fi mai dificil pentru adversari să ghicească cărțile pe care le deține Libratus.

Oferim AI o descriere a jocului. Nu îi spunem cum să joace. Apoi dezvoltă o strategie care este complet independentă de jocul uman și poate fi foarte diferită de modul în care oamenii joacă acest joc” , a spus Noam. Brown, student la master la Universitatea Carnegie Mellon - CMU, care a creat acest sistem AI împreună cu profesorul său, Tuomas Sandholm.

Libratus - inteligența artificială tocmai a învins 4 experți într-un joc de poker

Cu toate acestea, aceasta este doar prima etapă. În timpul meciului de la Pittsburgh, un al doilea sistem analizează starea meciului și se concentrează asupra atenției primului sistem. Cu ajutorul acestui al doilea sistem, un detaliu „ endgamer ” într-o lucrare Sandholm and Brown, primul sistem nu trebuie să parcurgă toate scenariile pe care le poate explora. a izbucnit în trecut. Și trebuie doar să parcurgă câteva dintre aceste scenarii. Ceea ce este special este că Libratus nu învață doar înainte de joc, ci continuă să învețe chiar și în timpul jocului.

Deși numai aceste două sisteme sunt mai mult decât suficiente pentru a juca poker eficient. Dar Dong Kim și alți jucători au găsit în continuare modele în jocul computerului și le-au exploatat. De aceea Brown și Sandholm au creat un al treilea sistem. În fiecare seară, Brown va rula un algoritm care poate identifica acele modele și le poate elimina. „ Poate face acest calcul peste noapte și totul va fi gata a doua zi ”, a spus Brown.

Libratus - inteligența artificială tocmai a învins 4 experți într-un joc de poker

Dacă simți că asta pare nedrept, trebuie totuși să-l accepți, pentru că așa funcționează AI. Cu toate acestea, nu numai AI face acest lucru, ci și oamenii pot combina adesea procesele, îmbunătățind, rulând și îmbunătățind activ AI. Pe scurt, Libratus este cu adevărat o piatră de hotar, arătându-ne cum un nou tip de IA ar putea juca un rol important în orice, de la tranzacționarea pe Wall Street până la securitatea cibernetică, licitații și negocieri politice.

Pokerul este unul dintre cele mai greu jocuri în care AI să pătrundă, pentru că vezi doar informații parțiale despre starea jocului. Nu există o singură mișcare optimă. În schimb, AI-ul va trebui să-și randomizeze acțiunile pentru a face adversarii nesiguri când va îi înșeală ”, a spus Andrews Ng, care a susținut laboratorul central de inteligență artificială al Google și este acum om de știință șef la Baidu.

Libratus a făcut asta cel mai bine. Își randomizează pariurile la un nivel care depășește gândirea chiar și a celor mai buni jucători. Și dacă asta nu funcționează, algoritmul lui Brown va umple golurile. Un comerciant financiar poate lucra în același mod. Același lucru se întâmplă și cu un diplomat. Așadar, Libratus face o declarație puternică: O mașină poate păcăli un om.

Consultați mai multe articole:

A te distra!


Grupul de lucru ChatGPT va fi înființat de Europa

Grupul de lucru ChatGPT va fi înființat de Europa

Organismul care reunește organele naționale de supraveghere a vieții private din Europa a declarat joi că a înființat un grup operativ dedicat ChatGPT

AI prezice ora morții umane cu o precizie de 78%.

AI prezice ora morții umane cu o precizie de 78%.

Oamenii de știință danezi și americani au colaborat pentru a dezvolta un sistem AI numit life2vec, capabil să prezică ora morții umane cu mare precizie.

AI prezice bolile urinare doar prin sunetul urinei

AI prezice bolile urinare doar prin sunetul urinei

Un algoritm AI numit Audioflow poate asculta sunetul urinării pentru a identifica eficient și cu succes fluxurile anormale și problemele de sănătate corespunzătoare ale pacientului.

Barmani, atenție: acest robot poate amesteca un cocktail în doar 1 minut

Barmani, atenție: acest robot poate amesteca un cocktail în doar 1 minut

Îmbătrânirea și scăderea populației din Japonia a lăsat țara lipsită de un număr semnificativ de tineri lucrători, în special în sectorul serviciilor.

Sute de oameni au fost dezamăgiți când au aflat că fata pe care o iubeau este un produs al inteligenței artificiale

Sute de oameni au fost dezamăgiți când au aflat că fata pe care o iubeau este un produs al inteligenței artificiale

Un utilizator Reddit numit u/LegalBeagle1966 este unul dintre mulți utilizatori îndrăgostiți de Claudia, o fată asemănătoare vedetei de cinema care deseori împărtășește selfie-uri seducătoare, chiar și nud, pe această platformă.

Încă 12 companii potențiale se alătură „alianței AI” a Microsoft.

Încă 12 companii potențiale se alătură „alianței AI” a Microsoft.

Microsoft tocmai a anunțat că alte 12 companii de tehnologie vor participa la programul său AI for Good.

AI recreează personajele Dragon Ball în carne și oase

AI recreează personajele Dragon Ball în carne și oase

Utilizatorul @mortecouille92 a pus în funcțiune puterea instrumentului de design grafic Midjourney și a creat versiuni realiste unice ale personajelor celebre Dragon Ball precum Goku, Vegeta, Bulma și bătrânul Kame. .

7 tehnici pentru a îmbunătăți răspunsurile ChatGPT

7 tehnici pentru a îmbunătăți răspunsurile ChatGPT

Doar prin adăugarea unor condiții sau configurarea unor scenarii, ChatGPT poate oferi răspunsuri mai relevante la întrebările dvs. Să vedem câteva modalități prin care puteți îmbunătăți calitatea răspunsurilor dvs. ChatGPT.

Minunați-vă de tablourile frumoase desenate de inteligența artificială

Minunați-vă de tablourile frumoase desenate de inteligența artificială

Midjourney este un sistem de inteligență artificială care a provocat recent o „febră” în comunitatea online și în lumea artiștilor din cauza picturilor sale extrem de frumoase, care nu sunt inferioare celor ale artiștilor adevărați.

Acest model AI a fost unul dintre primii „experți” care au descoperit știri despre focarul de pneumonie din Wuhan.

Acest model AI a fost unul dintre primii „experți” care au descoperit știri despre focarul de pneumonie din Wuhan.

La câteva zile după ce China a anunțat focarul, având acces la datele globale despre vânzările de bilete de avion, sistemul AI al BlueDot a continuat să prezică cu exactitate răspândirea virusului Wuhan Corona la Bangkok, Seul, Taipei și Tokyo.