https://frosthead.com

Softver stvara jednu sliku koja kaže sve

Svakog dana korisnici prenose više od 350 milijuna fotografija na Facebook. Taj priliv slika doveo je analitičare do procjene da je u prošloj godini napravljeno 10 posto svjetskih 3, 5 trilijuna fotografija. Svi ti podaci koji preplavljuju Internet znači da ako tražite određenu sliku ili objekt - na primjer, kako izgleda narančasta tabby mačka - pozitivno ste preplavljeni rezultatima pretraživanja.

Prošli mjesec, istraživači sa Sveučilišta u Kaliforniji, Berkeley su predstavili novi softver, AverageExplorer, koji će korisnicima omogućiti da vide “prosječnu” sliku koja predstavlja ono što traže. Umjesto da slika vrijedi tisuću riječi, ona je slika vrijedna tisuću ili više slika.

"Kada uđete u Googleovo pretraživanje slika, prosijat ćete stranice i stranice slika", objašnjava Jun-Yan Zhu, diplomski student UC Berkeleyja i glavni autor rad, predstavljen na ovogodišnjoj Međunarodnoj konferenciji i izložbi računalne grafike i Interaktivne tehnike u Vancouveru. "To je ogromno i teško je sažeti; ne možete shvatiti što se događa. "

Za svoju početnu ponudu, Zhu i njegov tim prikupljali su fotografije putem pretraživanja slika Flickr, Google i Bing. Softver je nedovoljne snage za pokretanje na prosječnoj radnoj površini i može istovremeno crtati oko 10 000 slika.

Korisnici preciziraju svoje pretrage na nekoliko različitih načina. Oni mogu skicirati i obojati oblik, slično crtanju u Adobe Photoshopu ili Illustratoru, kako bi izoštrili rezultat prosječne slike. Na primjer, bojanje pozadine prosječne slike Eiffelovog tornja samo će odabrati prosječnu sliku za izvlačenje samo snimaka snimljenih noću. Ili možete nacrtati kutne linije za kontrolu orijentacije leptira u kompozitu.

Most uzdaha, iz dana u noć Pročišćavanjem boja na slici AverageExplorer Bridge of Sighs možete promijeniti scenu iz dana u sumrak do noći. (Ljubaznošću UC Berkeley)

Jednom kada se stvori prosječna slika, proces koji može potrajati do jedne minute, korisnici mogu dodatno pročistiti rezultat pomoću onoga što tim naziva Explorer Mode. U ovom će modu klikom na određeni dio slike - recimo, mačji nos - otkriti druge uobičajene opcije ili preciziranja za to mjesto - možda plavi ili crni nosevi ili zaobljeni umjesto kutnih. Na primjer, u demo videu tim je pročistio sliku djece u Djed Božićnjacima odabirom samo slike na kojima Djeda Božićnjaka ima jedno dijete na svakoj ruci.

Zhu će sustav postati posebno moćan, kaže Zhu, kao alat za treniranje algoritama računalnog vida, poput onih koji se koriste u Google Goggles ili Amazon Firefly aplikacijama, koji mogu prepoznati na što kamera cilja. "Na području računalnog vida ljudi troše puno novca na napomenu za objekte", objašnjava on. "Sada možete primijeniti napomenu na prosječnu sliku. Ideja je da trebate raditi samo na jednoj slici kako biste propagirali sve slike u skupu podataka. "

Pronalaženje pasmina mačaka Rafinirajući načine rezultata pretraživanja, istraživači mogu pronaći određene pasmine mačaka, uključujući (s lijeva na desno) Ragdola, Sijamku, Maine Coon i Sphinx. (Ljubaznošću UC Berkeley)

Stvaranje umjetničkih djela je plod niskog visjenja za AverageExplorer. Tim je inspiraciju crpio iz umjetnika novih medija poput Jason Salavona, koji je marljivo stvarao prosječne fotografije rukom. Također bi se mogao koristiti za izradu dodatka za Facebook koji omogućuje korisnicima da se usreće sa prosječnom slikom o sebi.

Težnja istraživača još je široka i snažnija. Sociolozi bi mogli koristiti sustav za otkrivanje i istraživanje društvenih trendova; na primjer, prosječna slika mogla bi dokazati kako mladenke najčešće stoje desno od mladoženje u vjenčanim portretima. AverageExplorer bi također mogao biti koristan alat za analitičare medija koji pokušavaju secirati televizijsku pokrivenost - mijenja li se položaj Stephena Colberta kad govori o Georgeu W. Bushu u odnosu na Baracka Obamu?

Omogućujući korisnicima da intuitivno komuniciraju s vizualnim podacima, umjesto da se trude ući u ispravan niz ključnih riječi, korisnici će moći premostiti ono što Zhuov savjetnik i suosnivač AverageExplorer, Aleksej Efros, naziva "jezičnim uskim grlom".

Tim zamisli skup prilagođenih alata dizajniranih za specifične, teško artikulirajuće zadatke. Primjena za kupovinu, na primjer, omogućila bi korisniku da se pakira po internetu za par potpetica s točnom bojom, oblikom pete i visinom koju prati. Zhu predviđa alat koji se integrira u tijek rada policijskih skica umjetnika, omogućavajući svjedoku da pretražuje baze podataka lica kako bi pronašao značajke koje odgovaraju počinitelju i konstruira složeni portret.

Osnovna verzija AverageExplorera bit će objavljena ove jeseni.

Softver stvara jednu sliku koja kaže sve