AI programm võitis esmakordselt Texas Hold'emis mitut mängijat korraga

Copy
Inimesed mängimas No-Limit Texas Hold'emit 24. juunil Las Vegases ühel pokkeriturniiril.
Inimesed mängimas No-Limit Texas Hold'emit 24. juunil Las Vegases ühel pokkeriturniiril. Foto: John Locher / AP / Scanpix

Tehisintellekti programm suutis esmakordselt võita pokkeri No-Limit Texas Hold'emis mitme mängijaga korraga toimunud mängu, teatasid teadurid eile.

Tehisintellekti programmid on seljatanud inimesi kabes, males, Go-s ja kahe mängijaga pokkeris, kuid mitme vastasega mängu peeti senini käeulatusest väljas olevaks.

Nüüd aga teatasid Facebooki tehisintellekti algatusega koostööd tegevad Carnegie Melloni ülikooli teadurid, et nende programm suutis väljuda võitjana kuue mängijaga No-Limit Texas Hold'emi mängust.

Programmi nimega Pluribus ja selle ajaloolist võitu kirjeldati USA ajakirjas Science.

«Pluribus tegi üliinimliku etteaste mitme mängijaga pokkerimängus, mis on tunnustatud teetähis tehisintellektis ja mänguteoorias,» ütles Carnegie Melloni arvutiteaduse professor Tuomas Sandholm.

Sandholm töötas koos Noam Browniga, kes töötab Facebook AI-s ning on lõpetamas oma doktorikraadi Pittsburghis asuvas ülikoolis.

«Seni olid üliinimlikud AI teetähised strateegilises arutlemises piiratud kahe osapoolega võistlustega,» ütles Sandholm.

Pluribuse loojate sõnul saab kasutatud tehnoloogiaga lahendada hulgaliselt pärismaailma probleeme, kus sarnaselt pokkerile on pooled, kes blufivad või varjavad tähtsat infot.

Programm seljatas algselt kaks suurt pokkeritšempioni - Darren Eliase ja Chris Fergusoni. Mõlemad mängisid programmi vastu 5000 kätt.

Seejärel võttis Pluribus teises katses ette 13 proffi, kes mängisid viiekesi korraga. Programm oli kuues mängija. Pärast 10 000 kätt läks võit programmile, ütlesid uurijad.

Esmalt harjutas programm mängimist iseenda vastu ning õppis tasapisi ära, kuidas saada ühest või teisest käigust kõige suurem eelis. Selle käigus selgus üllatuslikult, et «üks tema suuri tugevusi on võime kasutada segastrateegiaid», lausus Elias.

«Täpselt sedasama üritavad teha ka inimesed. Selle tegemine täiuslikult juhuslikul moel ja järjepidevalt - enamik inimesi lihtsalt ei suuda seda.»

Üks üllatustest oli see, et Pluribus kasutas nn donk betti - check-raise'i asemel panustamine mängija poolt, kes ei olnud eelmises mängutänavas agressor - palju rohkem kui profid, kes üldiselt peavad seda nõrgaks käiguks.

Brown julges väita, et mõned programmi strateegiad «võivad isegi muuta viisi, kuid profid seda mängu mängivad».

Kommentaarid
Copy
Tagasi üles