Je vais construire un classificateur ML pour la prédiction du sous-type de cancer à partir de données d'expression génique

Certaines informations ont été traduites automatiquement.

Zambie

Je parle Anglais

Développeur de pipelines bioinformatiques

Je crée des pipelines bioinformatiques reproductibles pour l’analyse NGS, en me spécialisant dans l’expression différentielle RNA-seq et la génomique du cancer. Projet récent : pipeline RNA-seq sur l...

Plus d’infos

À propos de ce service

Avez-vous des données d'expression génique étiquetées et besoin

d'un classificateur d'apprentissage automatique pour prédire les sous-types de cancer

ou les résultats des patients ?

Je vais créer une pipeline de classification ML complète

adaptée à votre jeu de données génomiques.

CE QUE VOUS OBTENEZ :

- Prétraitement et normalisation des données

- Sélection de caractéristiques pour identifier les gènes les plus informatifs

- Comparaison de plusieurs algorithmes (Random Forest, SVM,

Gradient Boosting, KNN)

- Évaluation de la précision par validation croisée

- Matrice de confusion et rapport de classification

- Visualisation de l'importance des caractéristiques

- Modèle prêt pour la production, sauvegardé

MON EXPÉRIENCE :

J'ai construit un classificateur de sous-types de cancer du sein à partir de données d'expression génique avec une précision de 85,2 % en validation croisée en utilisant SVM. J'ai classé 4 sous-types :

LuminalA, LuminalB, HER2, TripleNégatif.

Pipeline complet disponible sur GitHub.

CE QUE J'ATTENDS DE VOUS :

- Matrice d'expression génique (échantillons x gènes)

- Étiquettes de sous-type ou de résultat pour chaque échantillon

- Nombre de classes à prédire

- Gènes ou voies importantes connues

OUTILS : Python, scikit-learn, Pandas, numpy,

matplotlib, seaborn, joblib, Linux, Git

Plus d’infos

build ml classifier for cancer subtype prediction from gene expression data

Plein écran

Expertise:

Classification

•

regroupement

•

Analyse prédictive

Langage de programmation:

Python

•

Frameworks:

Scikit-learn

•

Panda

APIs:

Autres

Outils:

Jupyter Notebook

•

RStudio

Besoin d'activer votre créativité ?

Vous cherchez un expert en technologie ?

Prêt à atteindre et convertir les consommateurs ?

Vous cherchez des rédacteurs ?

Faites fonctionner votre entreprise plus intelligemment

Je vais construire un classificateur ML pour la prédiction du sous-type de cancer à partir de données d'expression génique

À propos de ce service

Balises associées