Je vais créer des modèles de classification et de régression pour votre jeu de données
Scientifique des données
À propos de ce service
Vous avez un ensemble de données sans savoir quoi en faire ? Je vais construire pour vous un modèle d'apprentissage automatique propre et bien documenté, allant des données brutes aux prédictions finales.
Je me spécialise dans les problèmes de classification et de régression supervisée. Que vous ayez besoin de prédire le comportement des clients, de détecter la fraude ou de diagnostiquer des conditions médicales, je fournirai un modèle performant adapté à votre ensemble de données.
Pourquoi moi : J'ai obtenu un ROC-AUC de 0,947 lors d'une compétition Kaggle en utilisant XGBoost et LightGBM, et j'ai créé des modèles prédictifs dans les domaines de la santé, de la finance et du sport. Chaque livraison comprend un code propre, commenté, que vous pouvez comprendre et réutiliser.
Mon processus de travail :
- Comprendre vos données et votre objectif commercial
- Nettoyer et prétraiter les données
- Créer des caractéristiques significatives
- Entraîner et comparer plusieurs modèles
- Optimiser pour de meilleures performances
- Livrer avec une documentation complète
Ce que vous recevrez toujours :
- Un notebook Jupyter propre avec tout le code source
- Des visualisations d'EDA
- Des métriques d’évaluation du modèle (ROC-AUC, F1, précision)
- Un résumé des résultats en langage simple
Outils : Python, Scikit-learn, XGBoost, LightGBM, Pandas, NumPy, Matplotlib, Seaborn
Contactez-moi avant de commander — je m'assurerai que votre projet correspond parfaitement à mes compétences.
Langage de programmation:
Python
•
SQL
Frameworks:
Scikit-learn
•
Panda
•
Autres
APIs:
Autres
Outils:
Jupyter Notebook
•
Colab
FAQ
Traduction automatique
Quels formats de fichiers acceptez-vous ?
CSV ou Excel (.xlsx). L’ensemble de données doit idéalement faire moins de 50 Mo.
Que vais-je recevoir ?
Un notebook Jupyter propre avec tout le code, des visualisations d'EDA, des métriques d’évaluation du modèle, et un résumé des résultats en langage simple.
Pouvez-vous gérer des jeux de données déséquilibrés ?
Oui — j’utilise des techniques de rééchantillonnage et j’évalue correctement avec ROC-AUC et F1-score sur des données déséquilibrées.
Dois-je connaître l'apprentissage automatique pour travailler avec vous ?
Pas du tout. Partagez simplement votre ensemble de données et indiquez ce que vous souhaitez prédire — je m’occupe de tout et j’explique les résultats en langage clair.
Pouvez-vous garantir un score précis de précision ou ROC-AUC ?
Non — la performance du modèle dépend de la qualité et de la taille des données. Ce que je garantis, c’est un modèle propre, bien optimisé, avec des métriques d’évaluation honnêtes et une transparence totale sur les résultats.

