Tweeti iz cijelog svijeta koji su crtani po lokaciji kao dio nove studije. Klikni za veću sliku Slika preko prvog ponedjeljka / Leetaru et. dr.
Teško je procijeniti koliko je brzo i temeljito Twitter preuzeo svijet. Prije samo sedam godina, 2006. godine, to je bila ideja nacrtana na papiru. Sada uslugu koristi oko 554 milijuna korisnika - broj koji čini gotovo 8 posto svih ljudi na planeti - a poslano je procijenjeno 170 milijardi tweetova, a taj se broj povećava za otprilike 58 milijuna svakog dana,
Svi ti tweetovi pružaju neprocjenjiv izvor vijesti, zabave, razgovora i povezanosti među ljudima. Ali za znanstvenike su vrijedni i kao nešto poprilično drugačiji: neobrađeni podaci.
Budući da Twitter ima otvoreni API (koji omogućava da se tweetovi preuzimaju kao neobrađeni, analizirani podaci), a mnogi tweetovi imaju geografsku oznaku, istraživači mogu upotrijebiti milijarde tih tvita i analizirati ih po lokaciji kako bi saznali više o geografiji ljudi širom planete. Prošle jeseni, kao dio Global Twitter Heartbeat-a, tim sa Sveučilišta u Illinoisu analizirao je jezik i lokaciju više od milijardu tweeta iz cijelog SAD-a kako bi stvorio sofisticirane mape stvari poput pozitivnih i negativnih emocija izraženih tijekom uragana Sandy ili podršku Baracku Obama ili Mitt Romney tijekom predsjedničkih izbora.
Kao što je Joshua Keating napomenuo na blogu Vanjske politike vanjske politike, članovi iste skupine, na čelu s Kalevom Leetaruom, nedavno su otišli korak dalje. Kako je objavljeno u novoj studiji ranije ovog tjedna u internetskom časopisu Prvi ponedjeljak, oni su analizirali lokacije i jezike 46.672.798 tweetova objavljenih između 23. listopada i 30. studenog prošle godine kako bi stvorili zadivljujući portret ljudske aktivnosti oko planete, prikazan na vrh posta. Iskoristili su Twitter decahose, tok podataka koji u bilo kojem trenutku bilježi slučajnih 10 posto svih tweeta širom svijeta (što je za vremensko razdoblje iznosilo 1.535.929.521) i jednostavno su se fokusirali na tweetove s pripadajućim geografskim podacima.
Kao što istraživači napominju, geografska gustoća tweeta u mnogim regijama - posebno u zapadnom svijetu gdje se računala, mobilni uređaji i Twitter koriste na najvišoj razini - u potpunosti odgovara stopama elektrifikacije i upotrebe rasvjete. Kao rezultat, karte tviteraša (poput detaljnog prikaza kontinentalnog dijela SAD-a, dolje) noću nalikovaju nalik satelitskim slikama umjetnog svjetla.
Klikni za veću sliku Slika preko prvog ponedjeljka / Leetaru et. dr.
Kao test da vidimo kako se tweetovi podudaraju s korištenjem umjetne svjetlosti, stvorili su dolje kompozitnu kartu na kojoj su tweetovi prikazani kao crvene točkice, a noćna rasvjeta prikazana kao plava. Područja u kojima se podudaraju po učestalosti (i učinkovito se međusobno isključuju) prikazana su kao bijela, a područja gdje jedan nadmašuje drugi ostaju crveni ili plavi. Mnoga područja izgledaju prilično bijelo, uz neke ključne iznimke: Iran i Kina, gdje je Twitter zabranjen, osjetno su plavi, dok se u mnogim zemljama s relativno niskom stopom naelektrifikacije (ali u kojima je Twitter još uvijek popularan) pojavljuju crvene boje.
Klikni za veću sliku Slika preko prvog ponedjeljka / Leetaru et. dr.
Projekt je postao još zanimljiviji kada su istraživači koristili automatizirani sustav za razvrstavanje tweeta po jeziku. Najčešći jezik na Twitteru je engleski koji je zastupljen u 38, 25 posto svih Tweeta. Nakon toga slijedili su Japanci (11, 84 posto), Španjolci (11, 37 posto), Indonežanke (8, 84 posto), Norvežanke (7, 74 posto) i Portugalci (5, 58 posto).
Tim je sastavio kartu svih tweetova napisanih na 26 najpopularnijih jezika, a svaki je predstavljen drugačijom bojom, ispod:
Klikni za veću sliku Slika preko prvog ponedjeljka / Leetaru et. dr.
Iako tweetovi većine zemalja dominiraju na njihovim službenim jezicima, otkriveno je da mnogi tweete uključuju na raznim drugim jezicima. Pogledajte dovoljno pažljivo i vidjet ćete dugu boju koja suptilno iskače iz sivih točkica (engleski tweetovi) koji pokrivaju SAD:
Klikni za veću sliku Slika preko prvog ponedjeljka / Leetaru et. dr.
Između ostalih analiza, istraživački tim je čak proučavao i zemljopisno osvježavanje i referenciranje - prosječnu udaljenost između korisnika i nekoga ko je retweets, kao i prosječnu udaljenost između tog korisnika i nekoga koga on ili ona jednostavno navodi u tweetu. U prosjeku je udaljenost za retweet iznosila 1, 115 milja i 1, 118 za referencu. No, kontratuktivno, postojao je pozitivan odnos između broja puta kad je neki korisnik ponovno upotrijebio ili uputio drugog korisnika i njihove udaljenosti: Parovi korisnika sa samo nekoliko interakcija u cjelini su vjerovatnije bili bliže (500- Udaljenost 600 milja) od onih s desetak tweetova i referenci između njih.
To ukazuje da korisnici koji žive daleko jedan od drugih imaju veću vjerojatnost da će Twitter redovito komunicirati. Jedno bi objašnjenje moglo biti da su entiteti s najviše sljedbenika - a time i najviše reference i retweeta - često poznate ličnosti, organizacije ili korporacije, korisnici s kojima su ljudi upoznati, ali zapravo nemaju osobni odnos. Globalna karta retweets između korisnika nalazi se u nastavku:
Klikni za veću sliku Slika preko prvog ponedjeljka / Leetaru et. dr.
U radu se detaljnije raspravljalo o drugim podacima povezanim s tvitovima: omjer između praćenja vijesti i broja tviteraša u nekoj zemlji (Europa i SAD dobivaju nerazmjernu pokrivenost u medijima, dok su Latinska Amerika i Indonezija previdjene), mjesta koja Twitter ima dodali su najviše korisnika u posljednje vrijeme (Bliski Istok i Španjolska) i mjesta na kojima korisnici u prosjeku imaju najviše sljedbenika (Južna Amerika i Zapadna obala).
Na sve ove podatke postoji nekoliko upozorenja. Za jedan, iako je broj tweeta analiziran u desecima milijuna, još uvijek je samo 0, 3 posto svih poslanih tweeta, pa možda neće adekvatno zastupati sve Twitter obrasce, posebno ako se korisnici koji omogućuju geografsko označavanje ponašaju drugačije od ostalih. Uz to, u svijetu koji se brzo mijenja, Twitter su se neki trendovi možda već značajno promijenili od prošle jeseni. No kako Twitter dalje raste i što više podataka postaje dostupno, razlog je da će ova vrsta analiza postati popularnija samo za demografe, računalne znanstvenike i druge istraživače.