VELIKI PODACI ILI PREVIŠE PODATAKA? | INOVACIJA | SMITHSONIAN - ČLANCI, BLOGOVI, INOVACIJE, INOVACIJE, ZNANOST, TEHNOLOGIJA I PROSTOR

Svi znamo da u našim svjetovima postoji puno više informacija nego što je to bilo prije. Što se tiče toga koliko, više, većina nas je prilično nejasna.

Povezani sadržaj

Infografika kroz stoljeća ističu vizualnu ljepotu znanosti
Zašto Google Raširenost gripe ne može pratiti gripu (još)

Evo neprocjenjive nuge o svim tim informacijama, komplimenti Davea Tureka, momka zaduženog za razvoj superračunala u IBM-u: Od 2003. godine i rada unazad do početka ljudske povijesti, prema IBM-ovim proračunima, generirali smo pet egzabajata - to je pet milijardi gigabajta informacija. Do prošle godine izlučivali smo toliko podataka svaka dva dana. Do iduće godine, predviđa Turek, radit ćemo to svakih 10 minuta.

Ali kako je to moguće? Kako su podaci postali takav digitalni kudzu? Jednostavno rečeno, svaki put kada vaš mobitel pošalje svoju GPS lokaciju, svaki put kad na internetu kupite nešto, svaki put kad na Facebooku kliknete gumb Like (Like), u digitalnu poruku stavite još jednu digitalnu poruku. A sada su oceani prilično prekriveni njima.

I to je samo dio priče. Tekstualne poruke, podaci o kupcima, transakcije na bankomatima, slike sigurnosnih kamera ... popis se nastavlja i nastavlja. Zvučna riječ koja ovo opisuje je "Veliki podaci", iako to jedva da ima pravo na razmjere čudovišta koje smo stvorili.

To je najnoviji primjer tehnologije koja je nadmašila našu sposobnost korištenja. U ovom slučaju nismo započeli sustizavati našu sposobnost prikupljanja informacija, zbog čega je omiljena grupa menadžera ovih dana da budućnost pripada tvrtkama i vladama koje mogu imati smisla za sve podatke koje posjeduju sakupljanje, po mogućnosti u stvarnom vremenu.

Tvrtke koje mogu protumačiti svaku digitalnu mrvicu koju njihovi kupci ostavljaju iza sebe imat će prednost, razmišljanja idu - ne samo o tome tko je kupio što gdje u proteklih sat vremena - već jesu li to tvitovali ili objavili fotografiju negdje u vrtlogu društvenih mreža. Isto vrijedi i za gradove koji mogu prikupiti podatke s tisuća senzora koji sada preslikavaju urbane krajolike i pretvore gradske živote, poput prometnog toka, pretvoriti u znanost.

Nije iznenađujuće da političke kampanje već zabijaju, bijesno rudajući podatke, kao dio svog fokusiranja na „nano-ciljanje“ birača, tako da oni znaju kako da ih ocijene za svoj glas i novac. Među zaključcima koji su analitičari izvukli, prema kolumnistu New York Timesa Thomasu Edsallu, jest i to što republikanci pokazuju sklonost restoranima "The Office" i Cracker Barrel, dok će demokrati vjerojatnije gledati "Late Night with David Letterman" i jesti u Chuck E .Sira.

Ovaj žur za tumačenje digitalnog flotsama objašnjava zašto je Google prošlog tjedna najavio da će započeti s prodajom proizvoda koji naziva BigQuery, softvera koji može u nekoliko sekundi skenirati terabajte podataka. I zašto je pokretač pod nazivom Splunk, koji posjeduje tehnologiju koja može analizirati ogromne količine podataka o klijentima i transakcijama, vidio da je vrijednost njegovih dionica porasla gotovo 90 posto onog dana kada je prošlog mjeseca izašla u javnost. To je za tvrtku koja je lani izgubila 11 milijuna dolara.

Uspon znanstvenika s podacima

Ali čak i pristup najboljim alatima za dešifriranje podataka nije jamstvo velike mudrosti. Vrlo malo tvrtki ima ljude koji rade na obuci ne samo da procjenjuju planinu podataka - uključujući mnoštvo nestrukturiranih sitnica s milijuna Facebook stranica i pametnih telefona - već i da stvarno nešto učine s njom.

Prošle je godine McKinsey Global Insitute objavio izvješće u kojem je opisao „Big Data“ kao „sljedeću granicu za inovacije“, ali također predviđajući da će tvrtke u SAD-u do 2018. imati ozbiljan nedostatak talenta kada su u pitanju potrebne analitičke vještine - čak 190.000 ljudi. A tvrdi da će trebati biti obučeno još 1, 5 milijuna menadžera za donošenje strateških odluka s bujicom podataka koji im dolaze na put.

Nisu svi, međutim, vjernici u magiju Big Data-a. Peter Fader, profesor marketinga na Penn's Wharton School of Business, nije uvjeren da je više podataka bolje. Nije da misli da tvrtka ne bi trebala pokušavati naučiti što više o svojim kupcima. Samo što se sada toliko fokusira na objedinjavanje svakog pojedinog broja podataka za koji misli da se volumen vrednuje u odnosu na istinsku analizu.

Evo Faderove slike iz nedavnog intervjua s MIT-ovog tehnološkog pregleda: „Čak i uz beskonačno znanje o prošlom ponašanju, često nećemo imati dovoljno informacija za smislena predviđanja o budućnosti. Zapravo, što više podataka imamo, to ćemo imati lažnije samopouzdanje ... Važan dio je razumjeti koja su naša ograničenja i upotrijebiti najbolju moguću znanost za popunjavanje praznina. Svi podaci u svijetu za nas nikada neće postići taj cilj. "

Tko su vaši podaci?

Evo uzorka kako se Veliki podaci koriste za rješavanje velikih problema:

Oni znaju kada su bili loši ili dobri: Iako se većina tvrtki fokusira na analizu svojih kupaca, Amazon skuplja bodove koristeći Big Data kako bi pomogao njihovim.
Studija rodica: Želite znati koji bikovi rađaju najproduktivnije mliječne krave? Mliječna industrija je osmislila način smanjenja broja.
Dijagnoza prema podacima: Istraživači u SUNY Buffalo analiziraju ogromne skupove podataka u nastojanju da utvrde postoji li veza između multiple skleroze i okolišnih čimbenika, poput nedovoljne izloženosti suncu.
Tražite probleme: Tvrtka pod nazivom Recorded Future rudi informacije s društvenih mreža i vladinih i financijskih stranica kako bi predvidjela kako rast stanovništva, nestašica vode i ekstremni vremenski uvjeti mogu dovesti do budućih političkih nemira i terorizma.

Video bonus: snimanje podataka jedna je stvar. Čini se da to izgleda privlačno i razumljivo je sasvim drugi izazov. David McCandless u ovom TED govoru osvaja snagu „informativnih karata“.