Svi su čuli za novi napredak umjetne inteligencije, a posebno strojnog učenja. Čuli ste i utopijska ili apokaliptična predviđanja o tome što znače ti pomaci. Preuzeli su ih za predosjećanje ili besmrtnost ili kraj svijeta, a o obje su mogućnosti napisane mnogo. No, najsofisticiranije AI još uvijek nisu daleko od toga da mogu riješiti probleme koje ljudski četverogodišnjaci ostvaruju s lakoćom. Unatoč impresivnom nazivu, umjetna inteligencija velikim dijelom sastoji se od tehnika za otkrivanje statističkih obrazaca u velikim skupima podataka. Ljudskom učenju je puno više.
Kako uopće možemo znati toliko o svijetu oko nas? Mi naučimo ogromne količine čak i kad smo mala djeca; četverogodišnjaci već znaju za biljke i životinje i strojeve; želje, uvjerenja i emocije; čak i dinosaura i svemirskih brodova.
Znanost je proširila naše znanje o svijetu do nezamislivo velikih i beskonačno malih, do ruba svemira i početka vremena. I mi koristimo to znanje za izradu novih klasifikacija i predviđanja, zamišljanje novih mogućnosti i stvaranje novih stvari u svijetu. Ali sve što dopire od bilo koga od nas iz svijeta toka fotona koji udaraju u naše mrežnice i smetnje zraka na našim bubnjevima. Kako naučimo toliko o svijetu kada su dokazi koje imamo toliko ograničeni? I kako to sve činiti s nekoliko kilograma sive google koja sjedi iza naših očiju?
Najbolji odgovor do sada je da naš mozak obavlja proračune na konkretnim, neurednim podacima koji nam dolaze na pamet, a ta izračunavanja daju precizne reprezentacije svijeta. Čini se da su prikazi strukturirani, apstraktni i hijerarhijski; oni uključuju percepciju trodimenzionalnih predmeta, gramatike koje su osnova jezika i mentalne sposobnosti poput "teorije uma", što nam omogućava da razumijemo što drugi ljudi misle. Ti prikazi omogućuju nam da napravimo širok raspon novih predviđanja i zamislimo mnoge nove mogućnosti na izrazito kreativan ljudski način.
Ova vrsta učenja nije jedina vrsta inteligencije, ali je posebno važna za ljudska bića. A upravo je ona vrsta inteligencije specijalnost male djece. Iako su djeca dramatično loša u planiranju i odlučivanju, oni su najbolji učenici u svemiru. Veliki dio procesa pretvaranja podataka u teorije događa se prije nego što imamo pet godina.
Od Aristotela i Platona postojala su dva osnovna načina rješavanja problema kako znati što znamo, a oni su i dalje glavni pristupi u strojnom učenju. Aristotel je problemu pristupio odozdo prema gore: Počnite s osjetilima - strujom fotona i vibracijama zraka (ili piksela ili zvučnih uzoraka digitalne slike ili snimke) - i pogledajte možete li iz njih izvući uzorke. Taj su pristup prenijeli i klasični asocijacionisti poput filozofa Davida Humea i JS Mill-a, a kasnije i psihologa ponašanja, poput Pavlova i BF Skinnera. Prema ovom mišljenju, apstraktnost i hijerarhijska struktura reprezentacija nešto je privida ili barem epifenomen. Sve se poslove može obaviti udruživanjem i otkrivanjem uzoraka - posebno ako ima dovoljno podataka.
Mogući umovi: 25 načina gledanja na AI
John Brockman iz svijeta znanosti okuplja dvadeset i pet najvažnijih znanstvenih umova, ljude koji su većinu svoje karijere razmišljali o polju umjetne inteligencije, za neusporediv okrugli stol o mišljenju, razmišljanju, inteligenciji i što to znači budi čovjek.
KupitiVremenom je došlo do prepucavanja između ovog pristupa odozdo prema gore misteriju učenja i Platonove alternative, odozdo prema gore. Možda dobijemo apstraktno znanje iz konkretnih podataka jer već znamo puno, a posebno zato što već imamo niz osnovnih apstraktnih pojmova, zahvaljujući evoluciji. Poput znanstvenika, možemo koristiti te koncepte za formuliranje hipoteza o svijetu. Zatim, umjesto da pokušavamo izvući uzorke iz neobrađenih podataka, možemo predvidjeti kako bi podaci trebali izgledati jesu li te hipoteze u pravu. Uporedo s Platonom, takav "racionalistički" filozofi i psiholozi poput Descartesa i Noama Chomskog bili su u ovom pristupu.
Evo svakodnevnog primjera koji ilustrira razliku između dvije metode: rješavanje neželjene pošte. Podaci se sastoje od dugog neortoriranog popisa poruka u pristigloj pošti. Realnost je da su neke od ovih poruka originalne, a neke neželjene. Kako možete koristiti podatke da biste ih razlikovali?
Prvo razmotrimo tehniku odozdo prema gore. Primjećujete da neželjene poruke imaju određene značajke: dugačak popis adresa, podrijetlo iz Nigerije, reference na nagrade od milijun dolara ili Viagru. Problem je u tome što savršeno korisne poruke mogu imati i ove značajke. Ako ste pogledali dovoljno primjera neželjene pošte i neželjene pošte, možda ćete vidjeti ne samo da spam adrese e-pošte obično imaju te značajke, već i da značajke zajedno idu na posebne načine (Nigerija plus milijun dolara pravi probleme). Zapravo, možda postoje neke suptilne korelacije više razine koje diskriminiraju neželjenu poštu od korisnih - recimo određeni obrazac pogrešno napisanih i IP adresa. Ako otkrijete te obrasce, možete filtrirati neželjenu poštu.
Tehnike strojnog učenja odozdo prema gore rade upravo to. Učenik dobiva milijune primjera, a svaki ima neki skup značajki i svaki je označen kao neželjena pošta (ili neka druga kategorija) ili ne. Računalo može izdvojiti obrazac značajki koje ih razlikuju, čak i ako je prilično suptilno.
Kako o pristupu odozgo prema dolje? Dobivam e-poštu od urednika časopisa Journal of Clinical Biology . Odnosi se na jedan od mojih radova i kaže da bi željeli objaviti članak od mene. Nema Nigerije, nema Viagre, nema milijuna dolara; e-pošta nema nijednu značajku neželjene pošte. Ali koristeći se onim što već znam i apstraktno razmišljam o procesu koji stvara neželjenu poštu, mogu shvatiti da je ova e-pošta sumnjiva:
1. Znam da spameri pokušavaju izvući novac od ljudi apelirajući na ljudsku pohlepu.
2. Znam i da su legitimni časopisi „otvorenog pristupa“ počeli pokrivati svoje troškove naplaćujući autore umjesto pretplatnika i da ja ne praktikujem ništa poput kliničke biologije.
Stavite sve to zajedno i mogu proizvesti dobru novu hipotezu o tome odakle dolazi ta e-pošta. Osmišljen je tako da usisava akademce u plaćanje da "objave" članak u lažnom časopisu. E-pošta je bila rezultat istog sumnjivog postupka kao i ostala neželjena pošta, iako nije izgledalo poput njih. Ovaj zaključak mogu izvući iz samo jednog primjera, i dalje mogu testirati svoju hipotezu, osim ičega u samoj e-pošti, gurkajući "urednika".
U računalnom smislu, započeo sam s „generativnim modelom“ koji uključuje apstraktne koncepte poput pohlepe i obmane i opisuje postupak koji stvara prevare putem e-pošte. To mi omogućuje prepoznavanje klasične nigerijske neželjene pošte, ali također mi omogućuje da zamislim više različitih vrsta moguće neželjene pošte. Kad dobijem e-poštu za časopis, mogu raditi unatrag: "Ovo se čini kao samo vrsta pošte koja bi nastala iz postupka generiranja neželjene pošte."
Novo uzbuđenje zbog AI dolazi zbog toga što su istraživači AI nedavno stvorili snažne i učinkovite verzije obje ove metode učenja. Ali, o samim metodama nema ništa novo.
Duboko učenje odozdo prema gore
U 1980-im, računalni znanstvenici smislili su genijalan način kako privući računala da otkriju uzorke podataka: konekcionistička ili neuronska mreža, arhitektura ("neuralni" dio bio je i još uvijek je metaforičan). Pristup je pao u probleme tijekom 1990-ih, ali je nedavno oživljen snažnim metodama „dubokog učenja“ poput Googleovog DeepMind.
Na primjer, možete dati programu dubokog učenja gomilu internetskih slika s oznakom "mačka", druge s oznakom "kuća", i tako dalje. Program može otkriti obrasce razlikovanja dva skupa slika i pomoću tih informacija pravilno označiti nove slike. Neke vrste strojnog učenja, koje se nazivaju nenadzirano učenje, mogu otkriti obrasce u podacima bez ikakvih naljepnica; jednostavno traže nakupine značajki - ono što znanstvenici nazivaju faktorskom analizom. U strojevima za duboko učenje ti se procesi ponavljaju na različitim razinama. Neki programi čak mogu otkriti relevantne značajke iz neobrađenih podataka u pikselima ili zvukovima; računalo bi moglo započeti otkrivanjem obrazaca u sirovoj slici koji odgovaraju rubovima i linijama, a zatim će pronaći one u obrascima koji odgovaraju licima i tako dalje.
Još jedna tehnika odozdo prema gore s dugom poviješću je učvršćivanje učenja. Pedesetih godina prošlog stoljeća, BF Skinner, radeći na djelu Johna Watsona, slavno je programirao golubove da izvode složene akcije - čak i usmjeravajući zračne rakete do svojih ciljeva (uznemirujući odjek nedavnog AI) dajući im određeni raspored nagrada i kazni, Bitna ideja bila je da se radnje koje su nagrađene ponavljaju, a one koje se kažnjavaju neće, dok se ne postigne željeno ponašanje. Čak i u vrijeme Skinnera, ovaj jednostavan postupak, koji se ponavljao iznova i iznova, mogao bi dovesti do složenih ponašanja. Računala su dizajnirana za izvođenje jednostavnih operacija iznova i iznova na ljestvici koja dvoji ljudsku maštu, a računski sustavi mogu naučiti nevjerojatno složene vještine na ovaj način.
Na primjer, istraživači Google-ovog DeepMind koristili su kombinaciju učenja dubokog i učvršćivanja kako bi naučili računalo da igra Atari video igre. Računalo nije znalo ništa o tome kako igre funkcioniraju. Započelo je djelovanjem nasumično i dobivalo je informacije samo o tome kako je izgledao ekran u svakom trenutku i koliko je dobar učinak postigao. Duboko učenje pomoglo je tumačenju značajki na zaslonu, a pojačano učenje nagradilo je sustav za veće rezultate. Računalo je postalo jako dobro u igranju nekoliko igara, ali je u potpunosti bombardiralo i druge koje su ljudi jednostavno savladali.
Slična kombinacija učenja dubokog učenja i pojačanja omogućila je uspjeh DeepMind-ovog AlphaZero-a, programa koji je uspio pobijediti ljudske igrače u šahu i Go-u, a koji je opremljen samo osnovnim znanjem o pravilima igre i nekim mogućnostima planiranja. AlphaZero ima još jednu zanimljivu značajku: djeluje tako što stotine milijuna igara igra protiv sebe. Kad to učini, obrezuje pogreške koje su dovele do gubitaka, te ponavlja i razrađuje strategije koje su dovele do pobjede. Takvi sustavi i drugi koji uključuju tehnike zvane generativne protivničke mreže generiraju podatke i promatraju podatke.
Kada imate računsku moć primjene tih tehnika na vrlo velike skupove podataka ili milijune poruka e-pošte, Instagram slike ili glasovne snimke, možete riješiti probleme koji su vam se prije činili vrlo teškim. To je izvor najvećeg uzbuđenja u računalnoj znanosti. Ali vrijedi se prisjetiti da su ti problemi - poput prepoznavanja da je slika mačka ili izgovorena riječ Siri - trivijalni za ljudsko dijete. Jedno od najzanimljivijih otkrića informatike je da su problemi koji su nam lako (poput identificiranja mačaka) teški za računala - puno teže nego igrati šah ili Go. Računala trebaju milijune primjera za kategorizaciju objekata koje možemo kategorizirati sa samo nekoliko. Ovi sustavi odozdo prema gore mogu se generalizirati na nove primjere; mogu novu sliku označiti kao mačku prilično precizno po svim. Ali to čine na načine posve različite od načina na koji ljudi generaliziraju. Neke slike gotovo identične slici mačke uopće nas neće identificirati kao mačke. Ostali koji izgledaju kao slučajno zamagljivanje bit će.
Bayesijevi modeli odozgo-dolje
Pristup odozdo prema gore igrao je veliku ulogu u ranom AI, a 2000-ih je i on doživio oživljavanje, u obliku vjerojatnih ili bajezijskih generativnih modela.
Rani pokušaji korištenja ovog pristupa suočili su se s dvije vrste problema. Prvo, većina obrazaca dokaza u principu se može objasniti mnogim različitim hipotezama: Moguće je da je moja e-mail poruka originalna, ali ne čini se vjerojatnom. Drugo, odakle uopće dolaze pojmovi koje koriste generativni modeli? Platon i Chomsky rekli su da ste rođeni s njima. Ali kako objasniti kako učimo najnovije koncepte znanosti? Ili kako čak i mala djeca razumiju dinosauruse i raketne brodove?
Bayesovi modeli kombiniraju generativne modele i testiranje hipoteza s teorijom vjerojatnosti i bave se tim dvama problemima. Bayesov model omogućuje vam izračunavanje koliko je vjerojatno da je određena hipoteza istinita s obzirom na podatke. A čineći male, ali sustavne prilagodbe modelima koje već imamo i testirajući ih na temelju podataka, ponekad možemo iz starih napraviti nove koncepte i modele. Ali ove prednosti nadoknađuju se drugim problemima. Bayesove tehnike mogu vam pomoći da odaberete koja je od dvije hipoteze vjerojatnija, ali gotovo uvijek postoji ogroman broj mogućih hipoteza i nijedan sustav ih ne može efikasno razmotriti. Kako u prvom redu odlučujete koje hipoteze vrijedi testirati?
Brenden Lake iz NYU-a i njegove kolege koristili su ove vrste metoda odozdo prema gore kako bi riješili još jedan problem koji je jednostavan za ljude, ali izuzetno težak za računala: prepoznavanje nepoznatih rukopisnih znakova. Pogledajte lik na japanskom svitku. Čak i ako ga nikada prije niste vidjeli, vjerojatno možete otkriti je li sličan liku na drugom japanskom svitku ili se razlikuje od njega. Vjerojatno ga možete nacrtati i čak dizajnirati lažni japanski lik na temelju onog koji vidite - onaj koji će izgledati sasvim drugačije od korejskog ili ruskog.
Metoda odozdo prema gore za prepoznavanje rukopisnih znakova je dati računalu tisuće primjera svakog od njih i omogućiti mu da izvadi vidljive značajke. Umjesto toga, Lake i sur. programu su dali opći model kako crtati lik: Udarac ide desno ili lijevo; nakon što dovršite jedno, započnete drugo; i tako dalje. Kad je program vidio određeni lik, mogao je zaključiti slijed udaraca koji su ga najvjerojatnije doveli - baš kao što sam i zaključio da je postupak neželjene pošte doveo do moje sumnjive e-pošte. Tada bi se moglo prosuditi je li novi lik vjerojatno rezultat tog slijeda ili neki drugi, a može li i sam stvoriti sličan niz poteza. Program je djelovao mnogo bolje od programa dubokog učenja primijenjenog na točno iste podatke, a usko je odražavao performanse ljudi.
Ova dva pristupa strojnom učenju imaju komplementarne snage i nedostatke. U pristupu odozdo prema gore, programu za početak nije potrebno mnogo znanja, ali treba veliku količinu podataka i može se generalizirati samo na ograničeni način. U pristupu odozdo prema gore, program može naučiti iz samo nekoliko primjera i napraviti mnogo šire i raznolike generalizacije, ali za početak trebate ugraditi mnogo više. Brojni istražitelji trenutno pokušavaju kombinirati dva pristupa, koristeći duboko učenje za provođenje Bayesovih zaključaka.
Nedavni uspjeh AI djelomično je rezultat proširenja tih starih ideja. Ali to ima više veze s činjenicom da, zahvaljujući internetu, imamo puno više podataka, a zahvaljujući Mooreovom zakonu imamo mnogo više računske moći da se primijenimo na te podatke. Štoviše, neprihvaćena činjenica je da su podaci koje imamo već razvrstani i obrađeni od strane ljudskih bića. Slike mačaka objavljene na Internetu kanonske su slike mačaka - slike koje su ljudi već odabrali kao "dobre" slike. Google Translate funkcionira jer koristi milijune ljudskih prijevoda i generalizira ih na novi dio teksta, a ne istinski razumijevanje samih rečenica.
Ali uistinu izvanredna stvar kod ljudske djece je da na neki način kombiniraju najbolje značajke svakog pristupa i onda nadilaze preko njih. Tijekom posljednjih petnaestak godina, razvojni stručnjaci istražuju način na koji djeca uče strukturu iz podataka. Četverogodišnjaci mogu učiti uzimanjem samo jednog ili dva primjera podataka, kao što to čini sustav odozdo prema dolje i generaliziranjem na vrlo različite koncepte. Ali oni također mogu naučiti nove koncepte i modele iz samih podataka, kao što to čini odozdo prema gore.
Na primjer, u našem laboratoriju dajemo maloj djeci "detektor blicket-a" - novi stroj za shvatiti, onaj kakav nikada ranije nisu vidjeli. To je okvir koji svijetli i pušta glazbu kada na njega stavite određene predmete, ali ne i druge. Dajemo djeci samo jedan ili dva primjera kako stroj radi, pokazujući im da, recimo, dva crvena bloka to čine, dok zelena i žuta kombinacija to ne čine. Čak i djeca od osamnaest mjeseci odmah otkrivaju opće načelo da dva objekta moraju biti jednaka da bi se mogla pokrenuti i to načelo generaliziraju na nove primjere: Na primjer, oni će odabrati dva predmeta koja imaju isti oblik da naprave rad stroja. U drugim smo eksperimentima pokazali da djeca mogu shvatiti da neko skriveno nevidljivo svojstvo tjera stroj ili da stroj radi na nekom apstraktnom logičkom principu.
To možete pokazati i u svakodnevnom učenju djece. Mala djeca brzo uče apstraktne intuitivne teorije biologije, fizike i psihologije na gotovo isti način kao što to čine odrasli znanstvenici, čak i uz relativno malo podataka.
Izvanredna dostignuća strojnog učenja nedavnih AI sustava, odozdo prema gore i odozdo, odvijaju se u uskom i dobro definiranom prostoru hipoteza i koncepata - precizan set djelova i pokreta igre, unaprijed određeni skup slika, Suprotno tome, djeca i znanstvenici katkad mijenjaju svoje koncepte na radikalne načine, izvodeći promjene paradigme, a ne jednostavno mijenjajući koncepte koje već imaju.
Četverogodišnjaci mogu odmah prepoznati mačke i razumjeti riječi, ali također mogu stvoriti kreativne i iznenađujuće nove zaključke koji mnogo nadilaze njihovo iskustvo. Nedavno je moj unuk objasnio da, ako odrasla osoba želi ponovo postati dijete, treba pokušati ne jesti zdravo povrće, jer zdravo povrće dijete odrasta u odraslu osobu. Ova vrsta hipoteze, uvjerljiva ona koju nikad odrasli nikad neće zabavljati, karakteristična je za malu djecu. U stvari, moji kolege i ja sustavno smo pokazali da je predškolcima bolje doći do hipoteza koje su malo vjerojatnije od starije djece i odraslih. Gotovo da nemamo pojma kako su mogući takvi kreativni načini učenja i inovacija.
Međutim, gledanje onoga što djeca rade, programerima može pružiti korisne savjete o uputama za učenje putem računala. Dvije značajke učenja djece posebno su upečatljive. Djeca su aktivni polaznici; oni ne pasivno upijaju podatke kao što to čine AI. Kao što znanstvenici eksperimentiraju, djeca su intrinzično motivirana za dobivanje informacija iz svijeta koji ih okružuje svojim beskrajnim igrama i istraživanjem. Nedavna istraživanja pokazuju da je ovo istraživanje sustavnije nego što izgleda i dobro je prilagođeno za pronalaženje uvjerljivih dokaza koji bi podržali stvaranje hipoteza i izbor teorije. Izgraditi znatiželju u strojeve i omogućiti im da aktivno komuniciraju sa svijetom moglo bi biti put do realnijeg i širokoga učenja.
Drugo, djeca su, za razliku od postojećih AI-ja, socijalni i kulturni polaznici. Ljudi ne uče izolirano, nego se koriste akumuliranom mudrošću proteklih generacija. Nedavna istraživanja pokazuju da čak i predškolci uče kroz oponašanje i slušanjem svjedočenja drugih. Ali oni se ne pasivno pokore svojim učiteljima. Umjesto toga, oni preuzimaju informacije od drugih na nevjerojatno suptilan i osjetljiv način, čineći složene zaključke o tome odakle informacije dolaze i koliko su pouzdani te sustavno integrirajući vlastita iskustva s onim što slušaju.
"Umjetna inteligencija" i "strojno učenje" zvuče zastrašujuće. I na neki način jesu. Na primjer, ovi se sustavi koriste za kontrolu oružja i stvarno se trebamo plašiti zbog toga. Ipak, prirodna glupost može donijeti mnogo pustoš od umjetne inteligencije; mi ljudi morat ćemo biti puno pametniji nego što smo bili u prošlosti da bismo pravilno regulirali nove tehnologije. Ali nema mnogo osnova ni za apokaliptičnu ni za utopijsku viziju AI koji zamjenjuju ljude. Dok ne riješimo osnovni paradoks učenja, najbolje umjetne inteligencije neće se moći natjecati s prosječnim ljudskim četverogodišnjakom.
Iz nadolazeće zbirke MOGUĆA MJESTA: 25 načina gledanja na AI, uredio John Brockman. Objavljeno prema dogovoru s Penguin Pressom, članom Penguin Random House LLC. Copyright © 2019 John Brockman.