Je fournirai une analyse complète de la génétique des populations à partir de données vcf

Certaines informations ont été traduites automatiquement.

Portugal

Je parle Portugais, Anglais
Je suis un chercheur en bioinformatique en cours de doctorat, spécialisé en génomique fonctionnelle et des populations. Mon travail consiste à analyser des données génomiques, à écrire des scripts et ...
À propos de ce service

Je fournirai une analyse complète de la génétique des populations à partir de données VCF, en utilisant des méthodes robustes et reproductibles pour caractériser la diversité génétique, les patterns de neutralité et la structure des populations.


L’analyse standard comprend :

  • Statistiques de base du VCF et vérifications des données
  • Hétérozygotie observée et attendue (Ho/He)
  • Coefficient de consanguinité
  • Diversité en nucléotides (π ; à l’échelle du génome)
  • Tajima D (fenêtres fixes, non chevauchantes)


Option supplémentaire 1 : Niveau population

Permet des analyses au niveau de la population en utilisant un fichier de correspondance échantillon-population fourni par le client. Inclut des métriques stratifiées par population, PCA (LD-élaguée), ADMIXTURE (K=210, 3 réplicats par K, validation croisée), et F_ST pairwise (à l’échelle du génome).


Option supplémentaire 2 : Fenêtres glissantes

Étend l’analyse avec des métriques en fenêtres glissantes à l’échelle du génome pour détecter des patterns locaux et des fenêtres aberrantes. Inclut π en fenêtres glissantes (avec taille de pas) et Tajima D dans des fenêtres fixes, avec graphiques et résultats tabulés.

Bonus : Si les deux options supplémentaires sont sélectionnées, F_ST pairwise est également calculé dans des fenêtres glissantes.


Notes : Le VCF doit contenir les génotypes des échantillons. Les analyses au niveau de la population nécessitent un fichier de correspondance. La taille du dataset (variants, échantillons, populations) est limitée par le package choisi. Outliers refe

Balises associées