https://frosthead.com

Najnoviji AI uči kako igrati bez ikakve ljudske pomoći

Prošle godine program umjetne inteligencije pod nazivom AlphaGo koji je stvorio Googleov tim DeepMind pobijedio je ljudskog prvaka u Go-u, drevnoj kineskoj strategijskoj igri koja je u mnogočemu složenija od šaha. Kako je Emily Matchar izvijestila za Smithsonian.com u to vrijeme, to je bilo zapanjujuće postignuće, jer su već 1997. neki ljudi predviđali da će trebati 100 godina da bi računalo na Gou pretuklo čovjeka.

Iako je podvig impresivan, AlphaGo je naučio igrati igru ​​analizirajući prethodne igre koje su igrali ljudi. No, kako izvještava Merrit Kennedy iz NPR-a, nova verzija umjetne inteligencije pod nazivom AlphaGo Zero smislila je kako samostalno ovladati igrom, bez ljudskog doprinosa ili manipulacija - napredak koji ima velike posljedice za budući razvoj AI.

Prema priopćenju za javnost DeepMind-a, prethodne verzije AlphaGo-a naučile su igrati igru ​​proučavanjem mečeva između profesionalnih i jakih amaterskih igrača, upijajući pravila igre i uspješne strategije igre. AlphaGo Zero, međutim, nije gledao niti jednu igru ​​koju su igrali ljudi. Umjesto toga, dobili su pravila igre, a zatim igrali protiv sebe, koristeći pojačanje kako bi se naučio ispravnim i pogrešnim potezima i dugoročnim strategijama. Dok je AI igrao igru, ažurirao je svoju naprednu neuronsku mrežu kako bi bolje predvidio poteze svog protivnika.

Istraživači su gledali kako AI savladava igru ​​u stvarnom vremenu. Nakon tri dana uspio je pobijediti prethodnu verziju pod nazivom AlphaGo Lee, koja je u 4 od 5 igara 2016. pobijedila korejskog gospodara Leeja Sedola u 4 od 5 igara. Nakon 21 dana pobijedio je AlphaGo Master, verziju koja je pobijedila 60 najboljih igrača Go igara na mreži i Najbolji igrač svijeta Ke Jie početkom ove godine. Najnovija verzija AlphaGo Master 100 pobijedila je na 0. Nakon 40 dana dostigla je razinu igre koju još nitko nije vidio. Istraživanje se pojavljuje u časopisu Nature.

"U kratkom vremenu AlphaGo Zero je razumio sve znanje o Go-u koje su ljudi sakupili tijekom tisuća godina igranja", rekao je glavni istraživač David Silver iz Google-ovog DeepMind-a u Youtube videu. "Ponekad je zapravo izabrano prijeći to i otkriti nešto što ljudi u ovom vremenskom razdoblju još nisu ni otkrili i otkrili nove dijelove znanja koji su na mnogo načina kreativni i novi."

Kako izvještava Agence France-Presse, AlphaGo Zero dostigao je ovu razinu majstorstva mnogo učinkovitije od svojih prethodnika. Dok je prethodna iteracija imala 48 jedinica za obradu podataka i igrala je 30 milijuna trening treninga tijekom nekoliko mjeseci, Zero je imao samo 4 procesne jedinice i igrao je 4, 9 milijuna trening treninga tijekom tri dana. "Ljudi imaju tendenciju pretpostaviti da je strojno učenje sve o velikim podacima i velikim količinama računanja, ali zapravo ono što smo vidjeli s AlphaGo Zero-om je da su algoritmi mnogo više", rekao je Silver za AFP.

Ali istraživanje je više od samo savladavanja igre na ploči. Kao što Ian Sample izvijesti u The Guardianu, ova bi vrsta tabula rase ili praznog škriljevca, učenje moglo dovesti do nove generacije umjetne inteligencije opće namjene koja bi mogla pomoći u rješavanju problema u poljima koja se mogu dobro simulirati u računalu, poput sastava lijekova, savijanje proteina ili fizika čestica. Izgrađujući svoje znanje iz temelja bez ljudskih pristranosti ili ograničenja, algoritmi bi mogli krenuti u pravcima u kojima ljudi još nisu razmišljali.

Dok mnogi ljudi u AI zajednici vide AlphaGo Zero kao veliko dostignuće, Gary Marcus, profesor psihologije na Sveučilištu New York koji se specijalizirao za umjetnu inteligenciju, kaže za NPR Kennedy da ne misli da je algoritam uistinu tabula rasa jer je prije ljudskog znanja u konstrukciju algoritma. On također ne misli da je tabula rasa AI toliko bitna koliko se čini. "[U] biologiji, stvarni ljudski mozak nije tabula rasa ... Ne vidim glavni teorijski razlog zašto biste to trebali učiniti, zašto biste se trebali odreći mnogih znanja koja imamo o svijetu", kaže on.

Unatoč tome, brzo gospodarenje igre Alpha Go je impresivno - i pomalo zastrašujuće.

Najnoviji AI uči kako igrati bez ikakve ljudske pomoći