GOOGLEOV NOVI AI MOŽE POBIJEDITI LJUDSKE PRVAKE U IGRI GO | | INOVACIJA | SMITHSONIAN - ČLANCI, INOVACIJA, TEHNOLOGIJA

Gotovo točno prije 20 godina IBM računalo Deep Blue pobijedio je svjetskog prvaka u šahu Garryja Kasparova u vlastitoj igri. Bio je to presudni trenutak u povijesti umjetne inteligencije - prvi put kad je računalo nakostruko pobijedilo ljudskog prvaka u šahu.

Ali svima onima koji su to shvatili kao znak da je revolucija AI propala, kritičari su rekli "ne tako brzo." Šah je bio relativno jednostavan za pucanje, kažu. Pravi test AI bio bi računalo koje može pobijediti ljudskog prvaka u Go-u, složena drevna kineska strateška igra za koju se mislilo da uključuje intuiciju i razumijevanje estetike. A taj dan malo je vjerojatno da će uskoro doći.

„Možda će proći stotinu godina prije nego što kompjuter pobije ljude na Go-u - možda i duže“, rekao je astrofizičar i ljubitelj filma Piet Hut za New York Times 1997. „Ako bi razumna inteligentna osoba naučila igrati Go, u nekoliko mjeseci mogao je pobijediti sve postojeće računalne programe. Ne moraš biti Kasparov. "

Ako je računalo poraženo od prvaka Goa, mišljenja je Times, to bi bio "znak da umjetna inteligencija uistinu počinje postati dobra kao prava stvar."

Pa, ljudi, taj trenutak je stigao, stotinu i više godina prije rasporeda. AlphaGo, program koji je razvio Googleov tim za umjetnu inteligenciju DeepMind, pobijedio je Europskog prvaka Go Go Fan Hui 5 na 0.

Otkrića su objavljena danas u časopisu Nature .

Go start počinje jednostavno, s mrežom od 19 do 19 i dvije boje komada (zvanim kamenje), crnom za jednog igrača, bijelom za drugog. Igrači se izmjenjuju stavljajući svoje kamenje na prazna raskrižja - točke prijelaza dviju linija mreže. Polako, svaki igrač pokušava okružiti kamenje drugog igrača, u tom trenutku ih zarobljavaju i premještaju sa ploče. Na ploči može u bilo kojem trenutku biti nekoliko opkoljenja, a često je teško reći tko će koga uhvatiti.

"Igra Go je dugo smatrana najizazovnijom klasičnom igrom za umjetnu inteligenciju zbog ogromnog prostora pretraživanja i poteškoće u procjeni položaja i poteza ploče", pišu autori rada.

AlphaGo "uči" i kroz obuku ljudskih stručnjaka i kroz praksu igrajući protiv sebe. Budući da Go ima previše previše mogućih poteza za računalo da jednostavno zdrobi podatke prilikom donošenja sljedeće odluke - glavna prekretnica za prethodne AI napore go-igranja - AlphaGo umjesto toga koristi dvije različite „duboke neuronske mreže.“ Jedna mreža naziva se „Mreža mreža“ - to računalu daje pregršt obećavajućih poteza koje treba razmotriti, na temelju prošlih igara, tako da ne mora probijati se kroz svaki mogući potez. "Vrijednosna mreža" smanjuje dubinu pretraživanja - to jest, umjesto da pretražujete do kraja igre, stotine poteza dalje, program može pogledati samo nekoliko poteza kako bi napravio svoj izbor.

To je velika stvar: pored toga što je bio test AI-ovih sposobnosti, stvaranje Go-play programa koji bi mogao pobijediti ljudske prvake bilo je nešto od trke u naoružanju. Godinama su se razni programeri i tvrtke kladili stvoriti Go verziju Deep Blue-a. Neki su se zbližili. Francuski program zvan Ludi kamen pobijedio je 2013. petostrukog prvaka Japana Gosha Yoshia Ishida, iako je Crazy Stone dobio hendikep (AlphaGo nije) i Ishida se nije smatrala najboljim igračem već nekoliko desetljeća. Do sada je AlphaGo pobijedio ostale Go programe u 99, 8 posto vremena.

Samo nekoliko sati prije nego što je Google službeno objavio njihove vijesti, Facebook je, bez sumnje, zavirio u udarce do udara, odbacio objavu da se njihov vlastiti AI "približio" premlaćivanju ljudskih prvaka Go.

Pa zašto se Go smatra tako močnim testom AI? Bilo bi suvišno reći da je Go lakše od šaha.

„Igra odražava vještine igrača u balansiranju napada i obrane, čineći kamenje efikasnim radom, ostajući fleksibilnim u odgovoru na promjenjive situacije, vremenski raspored, precizno analiziranje i prepoznavanje snaga i slabosti protivnika“, objašnjava British Go Association o njihovoj web mjesto, što govori za složenu žalbu Goa.

Dok šah ima u prosjeku 35 legalnih poteza po potezu, Go ima prosječno 200. I dok ima nekih 10⁴³ moguće konfiguracije šahovske ploče, Go Board ima najmanje 2, 08 X 10 0 - više konfiguracija nego što ima atoma u svemiru. Za razliku od šaha, gdje je broj komada na ploči vrlo dobar pokazatelj tko pobjeđuje, teško je znati tko je naprijed u Go-u.

"Ne postoji dobra heuristika za utvrđivanje je li neka pozicija za igrača dobra ili loša", objašnjava predsjednik britanske udruge Go Jon Diamond. "To je dijelom analiza, a dijelom je prepoznavanje obrasca. Procjenjujete ploču na neki kompliciran način što nismo razradili kako kopirati u računala. "

Diamond kaže da se prilično iznenadio kad je čuo uspjeh AlphaGo-a. "Pretpostavljam da ovo nisam očekivao otprilike između pet i deset godina kao iskreno", kaže on. "Odlično su obavili dobar posao."

Uspjeh AlphaGo-a može značiti da smo mnogo bliži nego što se prije mislilo da imamo AI-e koji mogu djelovati na ljudskoj razini u drugim područjima. AlphaGo može biti "odskočni kamen" drugim vrstama inteligencija, kažu njegovi programeri. AI koji može donositi vrste složenih, intuitivno naizgled odluka potrebnih za pobjedu Go mogao bi, na primjer, dijagnosticirati bolesnog pacijenta i propisati individualizirani tijek liječenja, kako tvrde programeri.

U ožujku će AlphaGo ponovno testirati svoje poteze, kada se krene „head-to-head“ s Korejcem Leejem Sedolom, koji se smatra najboljim svjetskim igračem Go.

"Bez obzira na rezultat, bit će to značajan događaj u povijesti baduka (Idi)", kaže Lee u priopćenju za javnost. "Čuo sam da je Google DeepMind AI iznenađujuće jak i sve jači, ali uvjeren sam da mogu ovaj put pobijediti."