Je vais construire un modèle de machine learning pour la classification ou la prédiction de risque
Ingénieur en IA et ML, Data Scientist, spécialiste en LLM et Deep Learning
À propos de ce service
Vous avez besoin d’un modèle de machine learning qui fonctionne réellement sur vos données réelles ? Je crée des pipelines ML de bout en bout, pas seulement des scripts.
Je suis ingénieur en IA & ML (B.Tech CSE, IA & Robotique, VIT Chennai) avec un stage de recherche au DRDO SAG (Ministère de la Défense, Gouvernement de l’Inde). J’ai réalisé :
- Classificateur de risque de crédit : précision de 93 % (XGBoost)
- Pipeline de détection de fraude : ROC-AUC > 0,90 avec SMOTE
- Système de prédiction de maladies : précision de 97,22 %
- Recherche présentée à la conférence internationale ICIPRRDAC '25
Ce que je fournis :
- Modèles de classification, régression et risque
- Analyse exploratoire complète (EDA) et prétraitement des données
- Comparaison de modèles (Logistic Reg, RF, XGBoost, SVM)
- Importance des caractéristiques et explicabilité du modèle
- Gestion des données déséquilibrées (SMOTE, pondération des classes)
- Rapport d’évaluation : précision, F1, ROC-AUC, rappel
- Code source Python propre et documenté
Cas d’utilisation : détection de fraude, scoring de crédit, prédiction de churn, diagnostic médical et segmentation de clientèle.
Outils : Python, Scikit-Learn, XGBoost, Pandas, Matplotlib
Contactez-moi d’abord, je vais examiner votre dataset et confirmer la meilleure approche de modèle avant que vous passiez commande.
Langage de programmation:
Python
•
R
•
MATLAB
•
SQL
•
Colab
Frameworks:
Scikit-learn
•
keras
•
PyTorch
•
Panda
Outils:
Jupyter Notebook
•
opencv
•
tensorflow
•
Excel
•
Colab
•
RStudio
Mon portfolio
Autres services de Data science et machine learning I Offre
FAQ
Traduction automatique
Avec quel type de jeux de données travaillez-vous ?
Tout dataset tabulaire structuré au format CSV ou Excel. Je gère aussi bien les problèmes de classification binaire que multi-classe, ainsi que les datasets fortement déséquilibrés en utilisant SMOTE et d’autres techniques de rééchantillonnage.
Quel modèle ML allez-vous utiliser pour mon projet ?
J’évalue plusieurs modèles (Régression Logistique, Random Forest, XGBoost, SVM) et recommande le meilleur en fonction de vos données et de votre objectif. Les packages Standard et Premium incluent une comparaison complète avec des métriques pour chacun.
Pouvez-vous gérer des datasets déséquilibrés comme pour la détection de fraude ?
Absolument. J’ai une expérience pratique avec SMOTE, RUS et la pondération des classes, spécialement pour les problèmes de données déséquilibrées. Mon projet de détection de fraude a atteint un ROC-AUC supérieur à 0,90 sur un dataset fortement déséquilibré.
Vais-je obtenir le code source ?
Oui, le code source Python complet sous forme de Jupyter Notebook est inclus dans tous les packages. Vous pouvez le réexécuter, le modifier ou l’étendre indépendamment.
Pouvez-vous déployer le modèle en tant qu'API ?
Oui, une intégration API via Flask ou FastAPI est disponible, incluse dans le package Premium. Contactez-moi pour plus de détails.

