Je fournirai une analyse complète de la génétique des populations à partir de données vcf
À propos de ce service
Je fournirai une analyse complète de la génétique des populations à partir de données VCF, en utilisant des méthodes robustes et reproductibles pour caractériser la diversité génétique, les patterns de neutralité et la structure des populations.
L’analyse standard comprend :
- Statistiques de base du VCF et vérifications des données
- Hétérozygotie observée et attendue (Ho/He)
- Coefficient de consanguinité
- Diversité en nucléotides (π ; à l’échelle du génome)
- Tajima D (fenêtres fixes, non chevauchantes)
Option supplémentaire 1 : Niveau population
Permet des analyses au niveau de la population en utilisant un fichier de correspondance échantillon-population fourni par le client. Inclut des métriques stratifiées par population, PCA (LD-élaguée), ADMIXTURE (K=210, 3 réplicats par K, validation croisée), et F_ST pairwise (à l’échelle du génome).
Option supplémentaire 2 : Fenêtres glissantes
Étend l’analyse avec des métriques en fenêtres glissantes à l’échelle du génome pour détecter des patterns locaux et des fenêtres aberrantes. Inclut π en fenêtres glissantes (avec taille de pas) et Tajima D dans des fenêtres fixes, avec graphiques et résultats tabulés.
Bonus : Si les deux options supplémentaires sont sélectionnées, F_ST pairwise est également calculé dans des fenêtres glissantes.
Notes : Le VCF doit contenir les génotypes des échantillons. Les analyses au niveau de la population nécessitent un fichier de correspondance. La taille du dataset (variants, échantillons, populations) est limitée par le package choisi. Outliers refe
