TURINGOV TEST NEŠTO MJERI, ALI TO NIJE "INTELIGENCIJA"

Alan Turing, jedan od očeva kompjuterskog doba, bio je izuzetno pametan čovjek. U stvari je toliko pametan da je shvatio da je izraz "strojna inteligencija" gotovo besmislen. Bolje je, zaključio je, razgovarati o tome što stroj zapravo može: Može li razgovarati? Može li zadržati razgovor? Barem to možemo pokušati proučiti. Turing je na kraju predložio ono što je postalo poznato kao "Turingov test": Ako sudac ne može reći koji je od dva skrivena entiteta čovjek, a koji je umjetnost, stroj je "prošao" test - što je točno ono priča se da se to dogodilo prošle subote u Londonu.

Povezani sadržaj

Silicijska dolina duguje svoj uspjeh ovom tehnološkom geniju za kojeg nikad niste čuli
60-godišnja predviđanja Alana Turinga o uzorcima u prirodi pokazala su se istinitim

"Ponosni smo što možemo reći da je test Alana Turinga položen prvi put", rekao je jedan od organizatora, Kevin Warwick sa Sveučilišta u Readingu, nakon što su rezultati objavljeni. Pobjednički chatbot naziva se „Eugene Goostman“, računalnim programom koji oponaša ličnost 13-godišnjeg ukrajinskog dječaka. "Eugene" je uspio uvjeriti 33 posto sudaca da je to čovjek na subotnjoj priredbi, održanoj u uredima Kraljevskog društva u Londonu na 60. obljetnicu Turingove smrti. (Homoseksualac Turing, osuđen je za grubu nepristojnost 1952. godine, a naređeno mu je da se podvrgne hormonskom liječenju kao dio sporazuma o priznanju krivnje. Dvije godine kasnije umro je od trovanja cijanidom u očiglednom samoubojstvu.)

Ali na oprezu je red. "Inteligencija" je uvijek bila klizav predmet, a Turingov test posebno je davno prepun kontroverzi. Turing je opisao kako će to funkcionirati u dokumentu iz 1950. pod naslovom „Računalni strojevi i inteligencija.“ Ideju je preuzeo iz tradicionalne viktorijanske igre za salon, gdje pokušavate shvatiti je li osoba skrivena iza zavjese muškarac ili žena, samo postavljanjem pitanja. (Odgovori na pitanja morali su se zapisati, jer bi glas bio predaja.) Evo kako bi funkcionirala Turingova verzija: Imali biste suca, sjedeći ispred dvije zavjese, bez načina da znate šta je iza njih, Iza jedne zavjese je čovjek; iza drugog je računalo. Sudac može postavljati pitanja bilo kojem od dva skrivena entiteta. Na temelju odgovora sudac pokušava otkriti je li skriveni entitet čovjek ili stroj. (Turing je zamislio da su razgovori posredovani teletipskim strojevima; danas možemo koristiti bilo koju vrstu elektroničkog, tekstualnog sučelja, poput vrste koja se koristi u internetskim chat sobama ili trenutačnim porukama.)

Turing je nagađao da do 2000. godine "prosječni ispitivač neće imati više od 70 posto šanse da isprave ispravnu identifikaciju" - tj. Da bi računalni programi 30-posto vremena umirivali suce - nakon pet minuta ispitivanja. Važno je pet minuta Turing nije govorio o vremenskom ograničenju kao sastavnom dijelu testa, i moglo bi se tvrditi da bi stroj mogao zaista proći test, trebao bi biti u mogućnosti nositi se s bilo kojom količinom ispitivanja. Vjerojatno je petominutni kriterij bio proizvoljno, ali nužno ograničenje. 2000. godina je dolazila i prolazila, s chatbotovima su samo zaustavili napredak. (U trezvenijem trenutku, odgovarajući na pitanje BBC-evog anketara iz 1952., Turing je rekao da će proći 100 godina prije nego što stroj položi test.)

U 2012., bio sam sudac u "Turingovom testnom maratonu", najvećem dosad provedenom Turingovom testu; Održan je u Bletchley Parku u Engleskoj, mjestu Turingova vitalnog rada na razbijanju koda tijekom posljednjih godina Drugog svjetskog rata. (Organizirao ga je isti tim koji je vodio subotnje događanje, a ranije je bila i pobjednica Eugenea.) Postavljanje subotnjeg događaja bilo je isto kao i 2012. godine: Suci su upisali svoja pitanja na računalo, a zatim pričekali da se odgovori pojave na njihovim ekranima; chatboti su zajedno sa "skrivenim ljudima" bili u drugoj sobi, iz vida.

Prvo čega sam se postao hiper-svjestan jest da kad ste sudac na Turingovom testu, pet minuta prođe prilično brzo. I što je kraći razgovor, to je veća prednost računala; što je duže ispitivanje, veća je vjerojatnost da će se računalo odreći. Volio bih to nazvati učinkom manekenke: Jeste li se ikad izvinili manekenstvu u robnoj kući, pretpostavljajući da ste upravo naletjeli na živo ljudsko biće? Ako susret traje samo djelić sekunde, dok ste okrenuti obrnuto, možete zamisliti da ste upravo nasrnuli na čovjeka. Što je susret duži, to je očiglednija manekenska manekenka.

Isto je i s chatbotovima. Razmjena helloda ne otkriva ništa - ali što dalje uđete u to, javlja se više problema. Otkrili smo da su chatboti skloni promjeni teme bez ikakvog razloga. Često ne mogu odgovoriti na jednostavna pitanja. U opasnosti da zvuče nejasno, jednostavno ne zvuče ljudski . U jednom od mojih razgovora 2012. godine upisao sam jednostavnu šalu - i entitet s kojim sam razgovarao odmah je promijenio temu u hamburger. (Računalski znanstvenik Scott Aaronson nedavno je imao slično iskustvo kada je razgovarao s Eugeneom putem botova web mjesta. Aaronson je pitao Eugenea koliko nogu ima deva; on je odgovorio: "Nešto između 2 i 4. Možda, tri ?:-)))" Kasnije, kad je Aaronson pitao koliko nogu ima mrav, Eugene je iskašljao točno isti odgovor, trostruki smiješak i sve.)

Napominjemo i da Eugene ne oponaša odraslu osobu koja govori engleski jezik; pretvara se da je mlad i pomalo prozračan ukrajinski tinejdžer, koji razgovara na razmjerno dobrom (ali daleko od savršenog) engleskog. Kao što je Vladimir Veselov, jedan od programera programa, rekao za Mashable.com : "Proveli smo dosta vremena razvijajući lik s vjerodostojnom osobnošću." Iako će Eugene u bilo koju temu angažirati bilo koga, njegova dob "čini potpuno razumnim da on ne zna "Ne znam sve." Eugene ne izlazi odmah i ne objavljuje svoju dob i nacionalnost; ali otkrit će ga ako ga zatraže - i krajnji rezultat može biti određena popustljivost sudaca, posebno u vezi s engleskom gramatikom i uporabom riječi. (Pretpostavljam da je većina sudaca u subotu bila izvorni engleski jezik, mada to sigurno ne znam.) Stolovi bi se vjerojatno pretvorili da je Eugene ikad naišao na izvornog ukrajinskog govornika kao suca.

Borba za izgradnju govornog stroja naglašava koliko je složeni jezik. To nije samo pitanje razgovora - o nečemu morate razgovarati, a ono što kažete ima smisla - i mora imati smisla u kontekstu onoga što je druga osoba upravo rekla. Za nas je lako; za računala, ne toliko. I tako se chatboti oslanjaju na niz trikova: Memoriranje megabajta konzerviranih odgovora ili traženje Interneta za dijalog koji bi mogao približiti razgovoru u kojem se trenutno nalaze. Drugim riječima, ono što stroju nedostaje inteligencije moglo bi se nadoknaditi u sirovoj računalnoj snazi. Zbog toga nam se Google ili Siri (iPhone osobni asistent) mogu činiti toliko pametnima: Siri možda nema „pamet“, ali ima pristup tako velikoj bazi podataka, može djelovati kao da se čini. Upravo je takav način brutalne sile omogućio da IBM-ov „Watson“ pobijedi u Jeopardyju! u 2011.

Sve ovo postavlja ključno pitanje: Šta je točno, Turingov test mjeri? Neki kritičari sugeriraju da je nagrada lukavstvo, a ne inteligencija. Psiholog s NYU-a Gary Marcus, pišući na NewYorker.com-u, kaže da je Eugene uspio „izvršiti niz„ ploys “dizajniranih da prikriju ograničenja programa.“ Steven Harnad, psiholog i računalni znanstvenik na Sveučilištu u Quebecu u Montrealu, bio je još više skeptičan, rekavši Guardianu da je "potpuna glupost" tvrditi da je Eugene prošao Turingov test. (Za njegovu zaslugu, Turing je bio vrlo svjestan ovog pitanja; svoju je ideju nazvao „imitacijskom igrom“, a o inteligenciji je govorio tek rijetko.) Još je nespretnije što je računalo, za razliku od ljudskog, primorano na zavaravanje. "Turingov test je zaista test uspješnog lažljivca", rekla mi je Pat Hayes, informatičarka Instituta za ljudsku i strojnu spoznaju u Pensacoli, Florida, nakon Turingovog testnog maratona 2012. godine. "Da imate nešto što bi zaista moglo proći Turingovu igru oponašanja, bila bi to vrlo uspješna 'ljudska mimika'."

A "ljudska" je druga ključna točka: nije li moguće da na svijetu postoje i druge vrste inteligencije, izvan vrste kakvu pokazuje naša vrsta? Doista inteligentan stroj imao bi bezbroj praktičnih primjena, ali zašto se fokusirati na stvaranje više "ljudi"? Napokon, već imamo dosta ljudi. Kao što je jezikoslovac Noam Chomsky naglasio, kad nastojimo izgraditi stroj koji se kreće pod vodom, ne zahtijeva od njega da "pliva" - a podmornica nije ništa manje od postignuća zbog svoje nesposobnosti da napravi leđni udarac.

Da, Eugene je impresivan, barem u malim rafalima. Pa ipak, čak i najbolji chatboti smetaju pitanjima s kojima bi dijete koje je bilo napola Eugeneova pretisna godina lako moglo podnijeti. Možda nije iznenađujuće, većina istraživača AI provodi malo vremena opsjednuta Turingovim testom. Strojna inteligencija se, naime, kreće naprijed i to prilično brzo. Softver za prevođenje glasa u tekst, koji je bio prilično patetičan prije samo nekoliko godina, brzo se poboljšava, kao i programi za prevođenje jezika. Amazon često ima prilično dobru ideju o tome što želite kupiti čak i prije nego što to učinite. A Google-ov samovozeći automobil prije desetak godina bio je puka fantazija. Ali razgovor, dok stalno otkrivamo, zaista je težak i nije vjerojatno da će biti granica na kojoj AI najjače svijetli. Za sada, ako tražite nekoga s kime biste mogli razgovarati, preporučujem pravog čovjeka.

Dan Falk je znanstveni novinar sa sjedištem u Torontu.