https://frosthead.com

Tweeti mogu predvidjeti kada ćete dobiti gripu

1854. godine, kao odgovor na razornu epidemiju kolere koja se proširila Londonom, britanski liječnik John Snow predstavio je ideju koja će revolucionirati polje javnog zdravlja: epidemiološku kartu. Snimajući slučajeve kolere u različitim gradskim četvrtima i crtajući ih na karti na temelju prebivališta pacijenata, otkrio je da je jedna kontaminirana vodena pumpa odgovorna za velik dio infekcija.

Karta ga je uvjerila - a na kraju i javne vlasti - da je teorija o miasmi bolesti (koja je tvrdila da se bolesti šire štetnim plinovima) bila lažna i da je teorija klica (koja je ispravno tvrdila da su mikroorganizmi krivi) bila istinita. Stavili su bravu na dršku pumpe koja je odgovorna za ispadanje, signalizirajući promjenu paradigme koja je trajno promijenila način na koji se nosimo s zaraznim bolestima i samim tim sanacijom.

Tehnologija kartiranja je posve drugačija, kao i bolest, ali postoji određena sličnost između Snowhove karte i novog projekta koji je provela grupa istraživača pod vodstvom Henryja Kautza sa Sveučilišta u Rochesteru. Stvaranjem algoritama koji mogu uočiti trendove gripe i predviđanja koja se temelje na ključnim riječima u javno dostupnim tvitovima s geografskim oznakama oni uzimaju novi pristup proučavanju prijenosa bolesti - onaj koji bi mogao promijeniti način proučavanja i praćenje kretanja bolesti u društvu,

"Mi možemo misliti o ljudima kao senzorima koji gledaju svijet oko sebe, a zatim izvještavaju o onome što vide i proživljavaju na društvenim mrežama", objašnjava Kautz. "To nam omogućuje detaljna mjerenja na populacijskoj razini i ne zahtijeva aktivno sudjelovanje korisnika."

Drugim riječima, kada potvrdimo da nas je upravo spuzao bolni kašalj i groznica, nenamjerno pružamo bogate podatke za ogroman javnozdravstveni eksperiment, informacije koje istraživači mogu upotrijebiti za praćenje kretanja bolesti poput gripe u visokoj rezoluciji i u realnom vremenu.

Kautzov projekt, nazvan SocialHealth, koristio je tweetove i druge vrste društvenih medija za praćenje različitih javnozdravstvenih problema - nedavno su počeli koristiti tweetove za nadziranje slučajeva trovanja hranom u restoranima u New Yorku tako što su zabilježili sve koji su objavili Geografski označeni tweetovi iz restorana, a zatim praćenje njihovih tvita sljedećih 72 sata, provjeravanje spominjanja povraćanja, proljeva, bolova u trbuhu, groznice ili zimice. Radeći to, otkrili su 480 vjerojatnih slučajeva trovanja hranom.

No kako se sezona mijenja, njihov posao praćenja virusa gripe najviše privlači oči. Google Raširenost gripe na sličan je način nastojala koristiti Google pretraživače za praćenje kretanja gripe, ali taj je model uvelike precijenio prošlogodišnju epidemiju, možda zato što je medijska pokrivenost gripom potaknula ljude da započnu upite vezane uz gripu. Twitter analiza predstavlja novi skup podataka s nekoliko kvaliteta - veću geografsku razlučivost i mogućnost hvatanja kretanja korisnika tijekom vremena - koji mogu dati bolje prognoze.

Da bi započeli svoj projekt praćenja gripe, istraživači SocialHealth-a posebno su pogledali New York, prikupivši oko 16 milijuna geo označenih javnih tweetova mjesečno od 600.000 korisnika tijekom tri mjeseca. Ispod je vremenski tijek jednog njujorškog dana na Twitteru, s različitim bojama koje predstavljaju različitu frekvenciju tvita na toj lokaciji (plavi i zeleni znače manje tweetova, narančasti i crveni znače više):

Kako bi iskoristio sve ove podatke, njegov tim razvio je algoritam koji određuje predstavlja li svaki tweet izvještaj simptoma nalik gripi. Ranije su drugi istraživači to jednostavno radili tražeći ključne riječi u tvitovima (na primjer "bolesni"), ali njegov je tim otkrio da taj pristup vodi do lažnih pozitivnih rezultata: Mnogo više korisnika tvitne da su bolesni od domaćih zadataka nego što su osjećati se bolesno.

Da bi to objasnio, algoritam njegovog tima traži tri riječi zaredom (umjesto jedne) i smatra koliko često određeni niz ukazuje na bolest, na temelju niza tweetova koji su ručno označeni. Na primjer, izraz "bolestan od gripe" snažno je povezan s bolešću, dok je "bolestan i umoran". Neke određene riječi - glavobolja, groznica, kašalj - snažno su povezane s bolešću bez obzira na niz riječi od tri riječi koje čine.

Jednom kada su ovi milijuni tweetova kodirani, istraživači su mogli učiniti nekoliko intrigantnih stvari s njima. Za početak su pregledali promjene u tvitovima povezanim s gripom i uspoređivali ih s razinom gripe kako je izvijestio CDC, potvrđujući da su tweetovi točno zabilježili ukupni trend stope gripe. Međutim, za razliku od podataka o CDC-u, dostupni su u gotovo stvarnom vremenu, a ne tjedan ili dva nakon toga.

Ali oni su također zašli dublje, gledajući interakcije između različitih korisnika - kao što ih predstavljaju dva korisnika koji cvrkuću s iste lokacije (GPS rezolucija otprilike pola gradskog bloka) u istom satu - kako bi modelirali koliko je vjerovatno da je zdrava osoba razbolio bi se nakon stupanja u kontakt s nekim gripom. Očito je da dvoje ljudi koji cvate iz istog bloka 40 minuta odvojeno ne moraju se osobno sastati, no izgledi da su se sreli nešto su veći od dva slučajna korisnika.

Kao rezultat, kad pogledate dovoljno veliki skup interakcija, nastaje slika prijenosa. Otkrili su da ako se zdrav korisnik susreće s 40 drugih korisnika koji se prijavljuju kao oboljeli od simptoma gripe, njegove izgledi za dobivanje simptoma gripe sljedeći dan povećavaju se s manje od jedan posto na 20 posto. Sa 60 interakcija taj se broj povećava na 50 posto.

Tim je također pogledao interakcije na samom Twitteru, izolirajući parove korisnika koji slijede jedni druge i nazivajući ih prijateljima. Iako mnogi Twitter odnosi postoje samo na webu, neki odgovaraju interakcijama u stvarnom životu i otkrili su da korisnik koji ima deset prijatelja koji se prijavljuju kao bolesni imaju 28 posto veću vjerojatnost da se razbole sljedeći dan. Sve u svemu, koristeći obje ove vrste interakcija, njihov je algoritam bio u stanju predvidjeti hoće li se zdrava osoba razboljeti (i cvrkutati o tome) s 90 postotnom točnošću.

Još smo u ranim fazama ovog istraživanja, a tu su i mnoga ograničenja: većina ljudi i dalje ne upotrebljava Twitter (da, zaista), pa čak i ako ih ima, možda neće pljesnuti zbog bolesti.

No ako bi se takav sustav mogao dalje razvijati, lako je zamisliti sve vrste primjena. Na primjer, vaš pametni telefon mogao bi vas automatski upozoriti da biste proveli previše vremena na mjestima koja su zauzela gripa, a to će vas natjerati da odete kući da se prestanete stavljati na put zaraze. Stanovnici čitavog grada čak su mogli biti upozoreni da je na rubu epidemije.

Unatoč 150 godina koliko smo uklonjeni iz proboja Johna Snow-a, mapiranje bolesti, jasno je da još uvijek postoje aspekti informacija o bolesti koje ne razumijemo u potpunosti. Kao i tada, mapiranje podataka moglo bi pomoći u pronalaženju odgovora.

Tweeti mogu predvidjeti kada ćete dobiti gripu