https://frosthead.com

Ovo je najveće obiteljsko stablo na svijetu

Porast DNA testiranja putem usluga poput 23andme pokazuje da postoji veliko tržište za obiteljsku povijest.

Sada su znanstvenici na tim podacima gradili tako što su objavili za što smatraju da je najveća rodoslovna baza na svijetu s obiteljskim stablom koja povezuje 13 milijuna ljudi i proteže se više od pet stoljeća.

Kako Jocelyn Kaiser izvještava za časopis Science, Yaniv Erlich, računski genetičar na Sveučilištu Columbia, smislio je projekt prije sedam godina nakon što je putem Geni.com-a stigao e-poštom od udaljenog rođaka, jednog od mnogih mjesta na kojima se traže obiteljske veze.

Erlich je, uz podršku glavnog tehnološkog službenika Gemi.com-a, preuzeo javne profile web-mjesta - deseci milijuna njih. Iako nije ponudio DNK podatke, podaci su uključivali ime, spol, datum i mjesto rođenja, datum smrti i neposrednu rodbinu.

Priroda je pisala o Erlichovom projektu u svojim ranim fazama još 2013., a prošle godine, atletičarka Atlantika, Sarah Zhang izvijestila je da su istraživači objavili otisak masivnog stabla. Sada, piše Kaiser, Erlichov tim objavio je studiju o njihovom radu u časopisu Science. Koristeći podatke, završili su s 5, 3 milijuna stabala, od kojih najveće povezuje oko 13 milijuna rođaka, uglavnom europskog porijekla.

Otkad je započeo projekt, Erlich je postao glavni znanstveni suradnik MyHeritage, tvrtke za genealogiju i DNK testiranje koja je vlasnik Geni.com-a. Prošli je petak, Reddit pitaj me o svim saznanjima, ispravljajući zablude i objasnio metodologiju koja stoji iza projekta. Također je napomenuo da je za njega najzanimljiviji dio iskustva bilo pronalaženje načina prenošenja svih dostupnih podataka u nešto osobno.

U intervjuu za Nicole Wetsman iz National Geographica, Erlich kaže da je smišljanje načina rada s tim podacima također bilo najzahtjevniji dio projekta. „Genomske skupove podataka imaju specifične alate, strukture podataka, metode, ali za to nismo imali ništa. Kolo smo izmišljali dok smo išli ", kaže on.

Konačno, istraživači su koristili teoriju matematičkih grafova za organiziranje i provjeru informacija, izvještava Laura Geggel za Live Science . Također su usporedili profile s oko 80.000 javno dostupnih smrtovnica iz Vermonta tijekom razdoblja od 25 godina kako bi osigurali da nisu samo bogati profili preneseni u Geni.com.

Tim je tada odlučio kakve informacije žele tražiti kako bi testirali bazu podataka, piše Wetsman.

Počeli su gledati obrasce i otkrili kolebanja u životnom vijeku, nešto što su i predvidjeli. Na primjer, vidjeli su pad mladića tijekom građanskog rata i svjetskog rata I i II, te porast preživljavanja u djetinjstvu u 1900-ima. Oni su također mogli pratiti migracije, poput dolaska Mayflower 1620. godine u sadašnji Massachusetts, nakon čega je uslijedilo povećanje nataliteta u tom području.

Istraživači su također otkrili da dugovječnost više ima veze s okolinom i ponašanjem nego s genetikom; u stvari, otkriveni podaci samo su 16 posto odgovorni za životni vijek. Paola Sebastiani, profesorica biostatistike na Sveučilištu za javno zdravstvo Sveučilišta u Bostonu, međutim, upozorava izvodeći zaključke oko ovih podataka u intervjuu s Wetsmanom. "Postoji puno zbrke u pogledu definicija dugovječnosti", kaže ona.

Genetičar Peter Visscher sa Sveučilišta u Queenslandu u Brisbaneu u Australiji kaže za Kaiser da podaci koje Erlichov tim ispunjava mogu pružiti uvid u genetiku uloge u bolestima ako su podaci povezani sa zdravstvenim podacima.

Istraživački tim već je počeo kombinirati stablo s podacima iz DNA.Land, koji skuplja DNK podatke, što bi moglo značiti da uskoro očekuje još veće stablo. Istraživači predviđaju da će baza podataka, ako se vrati u staro 65 godina, moći dovršiti.

Ovo je najveće obiteljsko stablo na svijetu