https://frosthead.com

Korištenje matematike za ispitivanje iranskih izbornih rezultata

Statističari i politolozi održali su dan na terenu s rezultatima iranskih izbora početkom ovog mjeseca. Jesu li izbori bili lažni? Možda nikad nećemo znati, ali dovoljno je toga što je zakopano u matematici da bismo pomislili da bi to moglo biti tako. Čak i tada, ima nas i dovoljno da vjerujemo da je sve legalno. Evo nekoliko analiza koje su mi se učinile osobito zanimljivim:

Čisti podaci

Odmah nakon izbora pojavile su se sumnje u legitimnost podataka jer svaki put kada se objavi nova serija rezultata glasovanja (oni izlaze u komadima u Iranu, slično kao u Sjedinjenim Državama), postotak glasova odlazi predsjedniku Mahmudu Ahmadinedžadu bilo je isto: 67 posto. Podaci obično nisu čisti, a neki su se počeli pitati jesu li rezultati izrađeni.

Međutim, analiza profesora matematike na Sveučilištu Wisconsin, Jordana Ellenberga iz Slate, dublje je ušla u podatke kako bi se pokazalo da je zapravo mnogo mesiran nego što se moglo očekivati. Rezultati nisu izlazili grad po grad, već u velikim serijama koje su objedinjavale podatke iz nekoliko područja, što je značilo da su ukupni glasovi Ahmadinedžada bili prosječni. A zakon velikih brojeva diktira, kao što je Ellenberg napisao:

Prosjeci vrlo različitih količina mogu i obično daju rezultate koji izgledaju gotovo savršeno ujednačeno. S obzirom na dovoljno podataka, odmetnici obično jedan drugoga otkazuju.

Ellenberg zaključuje da su podaci "definitivno dovoljno zabrljani da su istiniti."

Benfordov zakon

Nekoliko analiza pregledalo je prve znamenke rezultata izbora u Iranu kako bi se vidjelo jesu li u skladu s Benfordovim zakonom, a to je:

U popisima brojeva iz mnogih (ali ne svih) stvarnih izvora podataka vodeća se znamenka distribuira na specifičan, neujednačen način. Prema ovom zakonu, prva znamenka je 1 gotovo trećina vremena, a veće znamenke pojavljuju se kao vodeća znamenka s nižom i nižom frekvencijom, do točke kada se 9 kao prva znamenka pojavljuje manje od jednog puta u dvadeset. Ova raspodjela prvih znamenki nastaje logički kad god se skup vrijednosti distribuira logaritamski.

Jedna analiza kojom je Boudewijn Roukema sa Sveučilišta Nicolaus Copernicus u Poljskoj koristio ovu zaključku zaključila je da je za Mehdi Karroubi bilo gotovo dvostruko više prebrojavanja glasova, nego što bi se očekivalo Benfordovim zakonom. Osim toga, Roukema je sumnjao da bi rezultati za Ahmadinedžada, u kojem je bilo manje 1 i više 2 i 3 od očekivanih, bili vjerojatni da bi netko odlučio manipulirati rezultatima promjenom vrijednosti 1 na početku glasovanja u 2 i 3s. To bi također dovelo do precjenjivanja Ahmedinedžadovih ukupnih iznosa od nekoliko milijuna glasova.

Walter Mebane, politolog i statističar sa Sveučilišta u Michiganu, također je koristio Benfordov zakon u svojoj analizi, u kojem također otkriva nekoliko nepravilnosti u rezultatima izbora u Iranu. Ali čak i priznaje da su iako njegovi rezultati "kompatibilni sa širokom prijevarom", također "kompatibilni s tim da je Ahmadinedžad zapravo pobijedio".

Posljednje dvije znamenke

Dva diplomirana studenta politologije na Sveučilištu Columbia uzela su još treće mjesto u podacima. U analizi koju su saželi u opciji Washington Post, oni su ispitali posljednje dvije znamenke prebrojanih glasova iz 29 pokrajina za svakog od četiri kandidata (npr. Ako je netko dobio 14.579 glasova, samo 7 i 9 smatraju se u analiza).

Posljednje dvije znamenke u izbornim rezultatima slučajni su šum, a raspodjela znamenki trebala bi biti prilično ujednačena - svaka znamenka trebala bi se pojaviti u vremenu od oko 10 posto. Ljudi su, doduše, loši generatori slučajnih brojeva i kad sastavljamo brojeve, skloni smo birati neke brojeve češće od drugih. U iranskim rezultatima, samo 4 posto brojeva završava u cifri 5, dok se brojka 7 pojavljuje u 17 posto vremena. Rezultati koji toliko odstupaju mogli bi se očekivati ​​na otprilike četiri od svakih 100 izbora.

Ljudi također imaju problema s stvaranjem brojeva koji nemaju susjedne znamenke (tj. Manje je vjerovatno da ćete ih imati 72 nego 23), ali bi ti brojevi trebali slijediti i slučajne obrasce, a oko 70 posto parova trebalo bi sastojati se od ne-susjednih znamenki. Međutim, u iranskim rezultatima, samo 62 posto to čini. Opet bi se ovi rezultati mogli očekivati ​​na otprilike 4 od svakih 100 izbora. Ali kombinacija dva rezultata očekivala bi se samo na svakih 200 izbora. Nemoguće, možda, ali nije nemoguće.

Gdje nas to ostavlja? Nikad nećemo znati jesu li prijavljeni rezultati stvarni ili ne. Moj osobni najdraži dio podataka iz svega ovoga ne zahtijeva nikakve kalkulacije koje bi dovele do pitanja legitimnosti izbora. Ovaj citat Abbas-Alija Kadkhodaeija, glasnogovornika iranskog vijeća gardistana, natjerao bi gotovo svakoga da dvaput razmisli:

Statistike koje je dao Mohsen Resaei u kojima on tvrdi da je više od 100% kvalificiranih glasača glasalo u 170 gradova nisu točni - incident se dogodio u samo 50 gradova.

(Više o analizama rezultata u izboru u Iranu potražite u Nate Silveru na petthirtyeight.com)

Korištenje matematike za ispitivanje iranskih izbornih rezultata