Empirische Codonmodelle für comparative Sequenzdaten

Kurzbezeichnung
Empirical codon models
Art der Forschung
Grundlagenforschung
Laufzeit
01.09.2012 - 31.08.2017
Projektkategorie
Einzelprojekt
Abstract
Evolutionäre Neuerungen und die Entstehung von neuen Arten sind häufig die Folge von positiver darwinischer Selektion. Dabei ist der Selektionsdruck aufschlussreich für die biologische Funktion und die Evolutionsgeschichte eines Proteins. Eine Vielzahl von Methoden wurde deshalb entwickelt, die die Identifizierung von positiver Selektion ermöglichen und einige dieser Methoden benutzen Sequenzunterschied zwischen den Arten und basieren auf comparativen Analysen oder Phylogeny. Zum Beispiel werden Likelihood-Ratio-Tests, die Codonsubstitutionsmodelle voraussetzen, nun standardmässig für diesen Zweck verwendet. Die Leistungsfähigkeit dieser Tests zur Identifizierung von positiver Selektion ist jedoch eingeschränkt, wenn die Arten, wie zum Beispiel die Primaten, evolutionär sehr eng verwandt sind, und so wurden bisher nur wenige arten-spezifischen Gene unter positiver Selektion identifiziert. Die Hinzunahme von zusätzlichen biologischen Daten, insbesondere Polymorphismen, ist vielversprechend für die Inferenz von positiver Selektion. Durch neue Sequenzierungstechnologien ist eine Vielzahl dieser Daten nun vorfügbar, insbesondere für den Menschen, Drosophila und Arabidopsis werden bald 1000 Genome sequenziert sein. Es ist jedoch nicht klar, dass die Methoden die zuvor in der Phylogeny oder in der Populationsgenetik entwickelt wurden, geeignet für die Analyse dieser Daten sind. Das Projekt enhält sowohl einen theoretische wie auch einen angewandte Teile, in denen neue bioinformatischen Werkzeuge und biologisches Wissen geschaffen werden. Im theoretischen Teil werden wir neue empirische Codonmodelle entwickeln. Wir beabsichtigen das Aufstellen neuer Algorithmen, die in der Lage sind die substanziellen Ratenvariation die in comparativen Polymorphismen (Sequenzen von mehren Arten und mehreren Individuen) auftreten. Dieser Teil hat die Entwicklung und Implementierung der neuer Codonmodelle und das Testen der Modelle mit simulierten und rellen Daten zum Ziel. Im angewandten Teil werden wir die empirischen Modelle verwenden, um die evolutionaren Prozessen zwischen verschiedenen Drosophila-Arten zu vergleichen. Wegen der Verfügbarkeit von 12 Drosophila Genome und des 1000 D. melanogaster Genome Projektes, werden wir zuerst die Melanogaster-Untergruppe analysieren. Dann re-sequenzieren wir weitere D. ananassae Populationen und studieren den unterschiedlichen Selectionsdruck in dieser Untergruppe. Für beide Arten führen wir genomeweite Analysen zum Auffinden von darwinistischer Selektion durch.

Weitere Details