https://frosthead.com

Ovaj AI za igranje pokera zna kada ih treba držati i kada ih saviti

Računalni program nazvan Pluribus pobijedio je poker profesije u nizu šest igrača bez ograničenja Texas Hold'em igara, postigavši ​​prekretnicu u istraživanju umjetne inteligencije. To je prvi bot koji je pobijedio ljude u složenom višestrukom natjecanju.

Kako su istraživači iz Facebook laboratorija AI i Sveučilišta Carnegie Mellon objavili u časopisu Science, Pluribus se pojavio pobjednički u mečevima u kojima dominiraju ljudi i u algoritmu. U početku, Merrit Kennedy piše za NPR, pet verzija robota suočeno je s jednim profesionalnim igračem pokera; u sljedećem krugu eksperimenata, jedan je bot igrao protiv pet ljudi. Po postu na blogu na Facebooku, AI je osvojio prosječno oko 5 dolara po ruci, ili 1.000 dolara po satu, igrajući protiv pet ljudskih protivnika. Ova stopa se smatra „odlučujućom maržom pobjede“ među poker profesionalcima.

U razgovoru s Kennedyjem, četverostruki prvak World Poker Tour Darren Elias objašnjava da je pomogao treniranju Pluribusa natjecajući se protiv četiri stola suparničkih botova i upozorio znanstvenike kada je AI pogriješio. Ubrzo, bot se „vrlo brzo poboljšavao, [prešavši] od osrednjeg igrača do u osnovi poker igrača na svjetskoj razini u nekoliko dana i tjedana.“ Iskustvo, kaže Elias, bilo je „prilično zastrašujuće.“

Prema Vergeovom Jamesu Vincentu, Pluribus - iznenađujuće jeftin AI obučen s manje od 150 USD resursa za računalstvo u oblaku - dodatno je savladao poker strategiju igrajući protiv sebe kopije i učeći putem pokušaja i pogreške. Kao što Jennifer Ouellette napominje za Ars Technica, bot je brzo shvatio da je njezin najbolji postupak akcije kombinacija igranja i nepredvidivih poteza.

Većina ljudskih prognanika izbjegava "klađenje na donk", pri čemu igrač pronalazi igrače koji završava jedan krug, a sljedeći započinje s okladom, ali Pluribus je lako prihvatio nepopularnu strategiju. Istovremeno, izvijestio je Ouellette, AI je također ponudio neobične veličine uloga i pokazao bolju randomizaciju od protivnika.

"Njegova glavna snaga je sposobnost korištenja miješanih strategija", rekao je Elias, prema izjavi CMU-a. "To je ista stvar koju ljudi pokušavaju učiniti. Za ljude je stvar egzekucije - to raditi na savršeno nasumičan način i to činiti dosljedno. Većina ljudi jednostavno ne može. "

Pluribus nije prvi AI koji igraju poker koji su pobijedili ljudske profesionalce. U 2017. godini, tvorci robota, Noam Brown i Tuomas Sandholm, razvili su raniju iteraciju programa pod nazivom Libratus. Ovaj AI odlučno je porazio četiri poker profesionalaca u 120 000 ruku dvo igrača Texas Hold'ema, ali kao što objašnjava Facebook blog, bio je ograničen činjenicom da se suočio s jednim protivnikom istovremeno.

Prema Knight MIT Technology Review -u, poker je AI izazov jer uključuje više igrača i mnoštvo skrivenih podataka. Za usporedbu, igre poput šaha i goa uključuju samo dva sudionika, a pozicije igrača vidljive su svima.

Da bi prevladali ove prepreke, Brown i Sandholm kreirali su algoritam osmišljen kako bi predvidio naredna dva ili tri poteza protivnika, a ne da mjeri njihove korake do kraja igre. Iako se može činiti da ova strategija daje prednost kratkoročnom dobitku nad dugoročnim dobicima Verge 's Vincent piše da je "kratkotrajna incizivnost zaista sve što vam treba."

Naprijed, multiplayer programi poput Pluribusa mogli bi se koristiti za dizajniranje lijekova koji se mogu boriti protiv bakterija otpornih na antibiotike, kao i poboljšati cyber-sigurnost i vojne robotske sustave. Kao Napominje Orslette iz tvrtke Ars Technica, druge potencijalne aplikacije uključuju nadgledanje pregovora s više stranaka, cjenovne proizvode i strategiju nadmetanja za brainstorming.

Za sada, kaže Brown, za Knight, algoritam će ostati u velikoj mjeri - uglavnom radi zaštite online poker industrije od nanošenja razarajućih financijskih gubitaka.

Istraživač zaključuje, "To bi moglo biti vrlo opasno za poker zajednicu."

Ovaj AI za igranje pokera zna kada ih treba držati i kada ih saviti