https://frosthead.com

AI uče timski rad dominirajući u video igrama za više igrača

Računala već desetljećima dominiraju ljudima u igrama jedan na jedan poput šaha, ali dobivanje umjetne inteligencije (AI) za suradnju sa suigračima malo je zamršenije. Sada su istraživači Googleovog projekta DeepMind naučili AI igrače da rade zajedno u timovima s ljudima i drugim računalima kako bi se natjecali u videoteci Quake III Arena iz 1999. godine.

Edd Gent iz Science-a izvijestio je da kada AI ima samo jednog protivnika, obično djeluje prilično dobro jer samo predviđa moguće poteze jednog uma. No timski je rad posve drugačija stvar, jer uključuje radnje u kojima računala nisu uobičajeno dobra, poput predviđanja kako će se ponašati grupa suigrača. Da bi AI bio zaista koristan, mora naučiti kako surađivati ​​s drugim inteligencijama.

Googleov tim DeepMind u postu na blogu objašnjava:

"Milijarde ljudi naseljavaju planetu, svaki sa svojim individualnim ciljevima i akcijama, ali još uvijek sposoban za okupljanje kroz timove, organizacije i društva u impresivnim prikazima kolektivne inteligencije. Ovo je postavka koju nazivamo učenjem s više agencija: mnogi pojedinačni agenti moraju djelovati neovisno, a opet naučiti komunicirati i surađivati ​​s drugim agentima. To je neizmjerno težak problem - jer se s agentima koji se prilagođavaju svijet se neprestano mijenja. "

Multiplayer, video igre za prvu osobu u kojima timovi igrača trče po virtualnim svjetovima, obično pucajući iz jednog oružja ili iz bacača granata, savršeno je mjesto za AI kako bi naučili sitnice timskog rada. Svaki igrač mora ponašati se ponaosob i donositi odluke koje će koristiti cijelom timu.

Za istraživanje, tim je trenirao AI za igranje hvatanja zastave na platformi Quake III Arena . Pravila su prilično jednostavna: dvije se ekipe suočavaju s bojnim poljem poput labirinta. Cilj je uhvatiti što više virtualnih zastava ostalih timova, istovremeno štiteći vlastitu, a bilo koja momčad osvoji najviše zastava u pet minuta pobjede. U praksi se, međutim, stvari mogu vrlo komplicirati.

Tim DeepMind stvorio je 30 algoritama neuronske mreže i borio se međusobno na nizu nasumično generiranih igara karata. Botovi su postizali bodove hvatajući zastave i zapomažući ostale igrače, vraćajući ih na ponovno postavljeno područje gdje se njihov lik ponovno pokrenuo. U početku su se radnje robota činile nasumičnim. Međutim, što su više igrali, bolji su postali. Sve neuronske mreže koje su neprestano gubile eliminirane su i zamijenjene modificiranim verzijama pobjede AI Na kraju 450 000 igara, tim je okrunio jednom neurološkom mrežom - nazvanom For the Win (FTW) - kao prvakom.

Grupa DeepMind igrala je algoritam FTW protiv zrcala botova, kojima nedostaju AI vještine učenja, a zatim i protiv ljudskih timova. FTW je srušio sve izazivače.

Grupa je tada održala turnir na kojem je 40 ljudi igralo nasumično podređeno kao suigrači i protivnici bot. Prema postu na blogu, ljudski igrači otkrili su da su roboti suradniji od svojih suigrača iz stvarnog života. Ljudski igrači upareni s agentima FTW-a uspjeli su pobijediti cyber ratnike u oko 5 posto utakmica.

Kako su saznali, botovi su otkrili neke strategije koje su dugo prigrlili ljudski igrači, poput druženja u blizini točke na kojoj je zastava ponovo odjevena kako bi je zgrabili kada se ponovo pojavi. Timovi FTW-a također su pronašli bugu koju bi mogli iskoristiti: ako su upucali vlastitog suigrača u leđa, to im je povećalo brzinu, nešto što su koristili u svoju korist.

„Ono što je tijekom razvoja ovog projekta bilo zadivljujuće jest pojava nekih od tih ponašanja na visokoj razini“, kaže Gent istraživač i vodeći autor DeepMind-a. "To su stvari sa kojima možemo biti povezani kao ljudski igrači."

Jedan glavni razlog što su momčadi bili bolji od ljudskih igrača je taj što su bili brzi i precizni strelci, što ih čini bržim na izvlačenju od njihovih ljudskih protivnika. Ali to nije bio jedini faktor njihovog uspjeha. Prema blogu, kada su istraživači ugradili u četvrtini sekunde odgodjeno vrijeme reakcije na robote-strijelce, najbolji ljudi su ih i dalje mogli pobijediti s oko 21 posto vremena.

Od ove početne studije, FTW i njegovi potomci oslobođeni su na punom bojnom polju Quake III Arene i pokazali su da mogu savladati još složeniji svijet s više opcija i nijansi. Također su stvorili robota koji odlikuje ultra složenu strategijsku svemirsku igru Starcraft II.

Ali istraživanje nije samo u izradi boljih algoritama za video igre. Učenje o timskom radu moglo bi na kraju pomoći AI-u da radi u voznim parkovima automobila koji voze samostalno ili možda jednog dana postanu robotski asistenti koji pomažu u predviđanju potreba kirurga, javlja Science 's Gent.

Međutim, ne misle svi da botovi sa arkadnim zvijezdama predstavljaju pravi timski rad. AI istraživač Mark Riedl iz Georgia Tech-a kaže za New York Times da su roboti tako dobri u igri, jer svaki od njih razumije dublje strategije. Ali to nije nužno suradnja jer AI timovima nedostaje jedan ključni element ljudskog timskog rada: komunikacija i intencionalna suradnja.

A naravno, nedostaje im i drugi znak zajedničkog iskustva s video igrama: smeće razgovarajući s drugim timom.

AI uče timski rad dominirajući u video igrama za više igrača