Détection de la signature de la sélection naturelle dans les génomes

Michel Veuille
UMR 7625, UPMC, Jussieu

1. Le modèle neutre

Dans les régions du génome non-soumises à sélection, la variation neutre s'équilibre à une valeur moyenne qui dépend du taux de mutation et de la taille de la population. L'âge moyen d'une mutation entre deux séquences données est de 2Ne générations, et l'âge moyen d'une mutation repérée parmi n séquences est de 4Ne générations. La génétique des populations peut donc être rétrospective: tout génome emporte avec lui une information sur son histoire au cours des 4 Ne dernières générations.

2. Le balayage sélectif

Lorsqu'une mutation avantageuse apparaît dans un génome, elle parvient généralement à fixation, c'est-à-dire qu'elle remplace toute autre variation présente à ce locus. La région où elle est apparue se retrouve ainsi dépourvue des mutations neutres qui s'accumulent normalement aux sites silencieux de l'ADN. Ce phénomène s'appelle le "balayage sélectif" (selective sweep ).
Les régions voisines du chromosome se retrouvent également dépourvues d'une part de leur variation neutre comme simple conséquence de leur liaison génétique. C'est le phénomène "d'entraînement génétique". A plus longue distance, l'effet de balayage s'estompe progressivement, jusqu'à ne plus être repérable.
La sélection laisse donc un "trou" de variation neutre dans le génome (figure 1). C'est la signature moléculaire de la sélection naturelle.

La longueur de la région affectée fournit de l'information. L'amplitude de l'effet d'auto-stop augmente avec la force de la sélection. Elle décroit avec celle du taux de recombinaison, qui tend à découpler l'association entre régions voisines. Si l'on connait le taux de recombinaison, on peut en déduire l'intensité de la sélection.

Le retour progressif de la variation neutre nous renseigne sur l'âge de l'événement. En effet, le balayage sélectif est surtout sensible juste après la survenue de l'événement sélectif. Ensuite, les mutations recommencent à s'accumuler sur le chromosome et restaurent progressivement la variabilité. Par la suite, l'équilibre mutation-dérive est atteint de nouveau, en moyenne, après un intervalle de 4 Ne générations, et l'épisode sélectif n'est plus perceptible.

Fig 1 . La diversité nucléotidique (polymorphisme neutre) décroit là où la sélection a amené à fixation un nouvel allèle avantageux. Cette décroissance de la variabilité permet d'identifier les régions touchées par la sélection naturelle

2. Systèmes étudiés

"L'homme est une grosse drosophile qui a perdu ses ailes" (Theodosius Dobzhansky)

La Drosophile est un petit animal plein de d'intérêt pour le généticien, avec son génome entièrement séquencé, son niveau de polymorphisme neutre dix fois plus élevé que chez l'homme, l'existence de cartes chromosomiques donnant le taux de recombinaison mégabase par mégabase, la facilité d'échantillonner des populations entières sans autorisation sanitaire ou clause de confidentialité. Nous l'utilisons comme système de référence, sachant que ce modèle a les mêmes propriétés (des chromosomes, des gènes, des populations) que les autres organismes sur l'évolution desquels il nous renseigne. Le GDR nous permet de collaborer avec des généticiens travaillant sur d'autres systèmes.

3. Références

[1] Depaulis, S. Mousset et M. Veuille. 2001. Haplotype tests using coalescent simulations conditional on the number of segregating sites. Molecular Biology and Evolution 18: 1136-1138.

[2] Depaulis, F., L. Brazier, S. Mousset, A. Turbé, et M. Veuille 2000. Selective sweep near the In(2L)t inversion breakpoint in an African population of Drosophila melanogaster. Genetical research 76 :149-158.

[3] Depaulis, F., L. Brazier, et M. Veuille 1999. Selective sweep at the Drosophila melanogaster Suppressor of Hairless locus, and its association with the In(2L)t inversion polymorphism. Genetics 152 : 1017-1024.

[4] Bénassi, V., F. Depaulis, G. K. Meghlaoui, et M. Veuille 1999. Partial sweeping of variation at the Fbp2 locus, in a highly recombining region of the Drosophila melanogaster genome. Molecular Biology and Evolution 16 : 347-353.