Min DNA-slumpmix − bra att veta om myOrigins

Den 6 maj 2014 sjösattes den nya versionen av Family Tree DNA:s jämförelsefunktion mot olika geografiskt avgränsade referensgrupper. Funktionen hette förut Population Finder, men har nu fått det nya namnet myOrigins. Det här är en bisak som man får fram när man har gjort ett autosomalt DNA-test hos det här företaget. (Huvudsaken för släktforskare är träfflistan på vilka andra testdeltagare som är ens släktingar, med släktskapsavståndsuppskattning för var och en.)

I funktionen myOrigins får man upp en världskarta som i rubriken sägs visa ens Ethnic Makeup. Båda benämningarna myOrigins och Ethnic Makeup är tyvärr förenklade på ett olyckligt sätt som gör att det blir lätt att missförstå det hela. Man kan nämligen inte sätta likhetstecken rakt av mellan sitt DNA-resultat och sina ”ursprung” eller sin ”etniska sammansättning”. Mer rättvisande benämningar hade varit myDNAmix och Genetic Makeup. Varför det?

Jo, det är ju så att ens autosomala DNA-mix har påverkats av en kraftig slump vid varenda generationsväxling. Eftersom varje individ har på pricken lika mycket arvsmassa behöver hälften från varje förälder försvinna när ett barn blir till. Vilka (autosomala) DNA-partier som ”går vidare” avgörs helt och hållet av slumpen. Det här medför att helsyskon bara har i genomsnitt 50 % likadant DNA jämfört med varandra. (Undantag gäller enäggstvillingar, som är 100 % likadana.) Kusiner har i genomsnitt 12,5 % likadant DNA (o.s.v.). Det här får man tankemässigt inte sammanblanda med att helsyskon ju har 100 % samma anor och kusiner 50 % (o.s.v.). Med andra ord är de anor som gett en individ dess DNA-slumpmix långtifrån samma sak som individens totala härstamning (alla anor).

antavla1

Varje individ har ett dubblerat antal anor för varje generationssteg bakåt. (Ett antal släktled bakåt i tiden har alla människor s.k. anförluster, d.v.s. att vissa historiska individer p.g.a. släktinggiften återkommer på flera olika positioner i anträdet.)

antavlaDNA

DNA-mässigt sett, så får ett anträd inte alls lika många positioner och ser olika ut från individ till individ på det sättet att anorna genom DNA-arvsslumpen fått olika betydelse. Redan i ca sjätte generationen före dig börjar det dyka upp en och annan ana som du inte har något DNA alls ifrån. Tio generationer bakåt från dig själv beräknas bara 12 % av anorna i det anledet ha lämnat något bidrag till ditt autosomala DNA. (Luke Josins, How Many Ancestors Share Our DNA?)

Det här är snyggt illustrerat av ett forskarteam på University of California i How many genetic ancestors do I have?

Efter ett tag bakåt i tiden kan inte ett generationsled bli mer finrandigt. En yttersta gräns för hur många anor i ett enskilt anled som kan ha lämnat DNA till dig går vid antalet 290 874, i det här sammanhanget. Det är nämligen antalet stickprovspunkter (SNP’s) som används i myOrigins. Det generationsled som det antalet anträdspositioner är högre före är det 18:e. I verkligheten är det ett fåtal anor i det anledet som du har något DNA ifrån och som regel är de segmenten större än bara minimalsmå bitar på 1 SNP (av sådana som används i myOrigins) styck. I verkligheten är det alltså inte nära före det 18:e utan väsentligt många generationer före det som ett visst förhållande gäller, nämligen det att antalet DNA-bidragsgivande anor inte längre ökar med antalet generationer bakåt i tiden.

Före den tidpunkten beskriver alltså de DNA-bitar som vandrat genom generationerna fram till dig långa smala trådar genom historien. Samma småsegment som fanns i en stenåldersindivid är detsamma som långt senare finns i en, låt säga, medeltidsana till dig. Först efter den sistnämnda anan blir ett segment då och då (slumpvis) större och större när det följs genom generationerna på vägen fram till dig.

myOrigins kan tänkas som att ett genomsnitt har skurits på det där knippet av långa smala trådar som ditt genetiska anträd långt tillbaka i tiden övergår till att bestå av. Varje tråd har sin koppling in på ditt närtidsanträd, men de inkopplingarna är inte alls jämnt fördelade över det. Din farmors fars andel av sådana gamla trådar kan exempelvis vara mycket högre än din morfars mors andel av sådana.

Dina SNP’s har hur som helst jämförts med vilka SNP’s som är vanligast förekommande i ett antal geografiskt avgränsade referensgrupper. Varje segment förpassas till den grupp som den har bästa statistiska likhet emot. Läs mer om hur det går till och vilka grupperna är i Razib Khans och Rui Hus text myOrigins.

Skärmklipp

Likheter gentemot de olika valda referensgrupperna som finns i din DNA-slumpmix anges i procent och representeras också genom färger på en karta. Som på bilden ser det ut för min del. Det jag får tänka mig är givetvis att mina anor under det tidsspann som här är aktuellt − uppemot flera tusentals år − självfallet har levt över en större del av världen. Men alla de delarna kan inte detekteras, utan bara de områden som mitt personliga slumpurval av långa smala historiska trådar råkar gå tillbaka till (så gott detta nu låter sig anas).

Färgläggningen visar bara fokusställena för respektive jämförelsepopulation, så man ska inte bry sig om i vilket land färgklickens centrum råkar ha hamnat på kartan eller sådana detaljer. Det handlar inte om länder, utan (grovt) om delar av världsdelar, eftersom jämförelse mellan befolkningsgrupper inte kan bli så noggrann. Den gula färgen står exempelvis för vad företaget valt att kalla ”Trans-Ural Peneplain”, vilket åsyftar ett bara vagt avgränsat område mellan Nordeuropas kustområden och mellersta Sibirien. I en tabell vid sidan av kartbilden ser jag att 9 % av min DNA-slumpmix närmast liknar genomsnittet hos personerna som utvalts att representera det området.

De som vill kan låta sina träffpersoner se ens andelar av likheter. Det underlättar inte för att identifiera gemensamma anor, om det inte råkar vara så att man själv och ens träffperson har likhet emot flera olika referensgrupper men bara förenas av en gemensam sådan. Ännu mindre praktisk nytta är detaljfunktionen i nedre högra hörnet som består i att man klickar på en orange och en grön knappnål. Då faller knappnålar av de två färgerna ned på kartan. De markerar vilka orter som ens träffpersoner har angett som äldsta kända hemvist för deras äldsta kända ana på rak fädernelinje respektive rak moderlinje. (Chansen är minimal att ens autosomala DNA-samband råkar ha funnits på just någon av de två linjerna.)

Att tänka på:

• Andelarna visar inte andelar av ditt ursprung eller andelar av anor, utan andelar av din personliga DNA-slumpmix. Den är bara i genomsnitt 50 % likadan hos ett helsyskon till dig. Till och med så nära släktingar som helsyskon kan alltså ha radikalt olika procentandelar och har ofta likhet mot sinsemellan olika referensgrupper. Dessa likheter kan ha kraftigt förstorats från (lagts ihop av) mindre andelar hos olika av dina anor, likaväl som kraftigt ha förminskats under bara de senaste generationerna. Proportioner kan alltså inte dras några växlar alls på, egentligen, utan det som kan vara intressant är vilka förekomster av likheter man har.

• Vissa reservationer finns dock även för bara förekomsterna av likheter i de fall de är relativt små. Möjliga felkällor finns nämligen i de avrundningstekniker som använts. Åtminstone har (i facebookgruppen DNA-anor 2014-05-07 och -09-07) nämnts exempel på att en angiven likhet på så mycket som 15 % respektive 9 % hos en individ inte gett utslag hos någon av dess föräldrar. Avrundningsfel hos en förälder respektive ett barn kan ha dragit åt olika håll. Man verkar alltså behöva tänka sig en möjlig felmarginal på i storleksordningen åtminstone 15 %. Att det inte är lätt att föra en DNA-följd till en viss jämförelsegrupp beror på att variationen inom en geografiskt avgränsad grupp kan vara stor, samtidigt som många likheter finns mellan olika grupper − helhetsbilden med all DNA-jämförelse ger ju framför allt hur närstående alla människor är varandra.

• Ett sådant här resultat av ett enskilt företags uträkningsmodell ska inte tas som någon sorts sanning. Andra företag, ibland enskilda programmerare, arbetar med referensgrupper sammansatta på andra sätt, och då blir utfallen annorlunda. Non-profit-projektet Genographic har sin modell. När man jämför hur olika resultaten kan bli utifrån ett och samma DNA-prov, så förstår man med vilka reservationer man måste ta sådana här resultat. Ett belysande exempel är Roberta Estes jämförelse av hur hennes DNA-resultat på det här området blev hos olika företag, se The Autosomal Me − Testing Company Results.