Stokastiska modeller av gen- och artträd
Forskningsprojekt, 2011
– 2013
Ett av de största globala problemen är den ökande förlusten av arter och ekosystem. Våra liv blir fattigare, både ekonomiskt och själsligt, utan denna biologiska mångfald. Det pågår intensiv forskning kring olika frågeställningar gällande bland annat genetisk mångfald både inom och mellan arter. De två respektive kunskapsområdena kallas Populationsgenetik och Systematisk Biologi (systematik). Inom populationsgenetik studerar man hur den genetiska sammansättningen av en population förändras över tid. Populationsgenetisk data kommer i form av DNA sekvenser tagna från stickprov av individer som representerar hela populationen. Sekvensernas variation sammanfattas i form av ett genträd som kopplar befintliga genkopior genom deras gemensamma föregångare. Med hjälp av genträdsanalys kan vi dra slutsatser om till exempel människans spridningsvägar från Afrika. En viktig klass av genträdsmodeller utvecklas och studeras inom koalescent teori. Den beskriver förhållandet mellan stickprovskopior av en gen som förändrats genom neutrala mutationer. Våra egna insatser i koalescent teorin har blivit väl uppmärksammade - två av våra uppsatser från 1999 respektive 2001 har blivit citerade knappt 200 gånger inom populationsgenetisk litteratur. Ytterligare 7 av våra artiklar har publicerats / ska publiceras i tidskrifter som Genetics, Theoretical Population Biology, Annals of Applied Probability samt Journal of Applied Probability. Modern systematik har sina rötter i Carl von Linnés system, där arterna grupperades enligt bland annat likhet i fortplantningsorgan hos växter. Dessa grupperingar sammanställdes i form av artträd eller så kallade fylogenetiska träd. Dagens metoder för att bilda artträd baseras på genetiska sekvenser samlade från olika artrepresentanter. Systematiker använder avancerade statistiska metoder, vars framgång beror på grundläggande stokastiska modeller för gen- och artträd. Som modeller för artträd har man hittills använt enkla förgreningsprocesser med exponentiellt fördelade grenlängder. Det har blivit väldigt aktuellt att införa mer avancerade trädmodeller med flexibla fördelningar för grenlängder. En lämplig klass av förgreningsprocesser heter Crump-Mode-Jagers (CMJ) processer. Här skiljer man mellan tre viktiga fall: superkritiska, kritiska och subkritiska förgreningsprocesser. Det kritiska fallet motsvarar en artbildningsprocess som stabiliserats över tiden, där varje art som försvinner ersätts i genomsnitt av precis en ny art. Vi har riklig erfarenhet med analys av kritiska CMJ processer men våra resultat, publicerade i ett antal artiklar, har varit mindre uppmärksammade jämfört med våra publikationer inom koalescent teori. Vi tror att tiden är mogen att tillämpa våra metoder för att hantera problem kring artträd, problem som är högst aktuella för dagens systematiker. Syftet med detta projekt är att vidareutveckla koalescentmodeller för genträd och CMJ-modeller för artträd, genom att lägga till nya lämpliga egenskaper till de befintliga modellerna. Våra matematiska frågeställningar var delvis inspirerade av diskussionerna med ledande svenska systematiker Bengt Oxelman och Per Sundberg (båda är professorer vid Göteborgs Universitet). Med genträdsmodeller är vi intresserade av koalescent-approximation för åldersberoende populationer i slumpmässig miljö. Tidigare har vi framgångsrikt studerat det åldersberoende fallet i konstant miljö samt det geografiskt strukturerade fallet i slumpmässig miljö. En annat problem som vi vill studera handlar om koalescent processer för populationer med upprepade flaskhalseffekten. En rad frågor gällande artträd kommer att behandlas inom ramen av CMJ processer där vi, förutom andra metoder, kommer att använda vår egen teknik för studerandet av asymptotiskt beteende hos kritiska CMJ processer med stokastiska system av individräkning. För en speciell klass av CMJ-processer hoppas vi att genomföra flera viktiga explicita beräkningar.
Deltagare
Serik Sagitov (kontakt)
Chalmers, Matematiska vetenskaper, Tillämpad matematik och statistik
Finansiering
Vetenskapsrådet (VR)
Projekt-id: 2010-5623
Finansierar Chalmers deltagande under 2011–2013