Je vais effectuer le nettoyage des données et l'ingénierie des caractéristiques pour améliorer votre modèle

Certaines informations ont été traduites automatiquement.

Maroc

Je parle Français, Anglais, Arabe
Je suis Abdelwahed (appelez-moi Abdel), un data scientist de haut niveau avec plus de 7 ans d’expérience. Je possède deux Master en Big Data Analytics et Data Science Executive, et j’ai été reconnu co...
À propos de ce service

Vous avez du mal avec des données tabulaires désordonnées ou un modèle peu performant ?

Je me spécialise dans le nettoyage de données, le prétraitement de données et la création de caractéristiques pour le machine learning tabulaire (classification et régression) en utilisant Python, Pandas et scikit-learn.


En tant que Master Kaggle et formateur en science des données, je propose :

  • Des pipelines sûrs contre la fuite de données, reproductibles
  • Des améliorations mesurables sur la précision, F1, AUC ou RMSE


Ce que je fais

  • Nettoyage de données : valeurs manquantes, valeurs aberrantes, doublons, correction de types, encodage et mise à l’échelle
  • Création de caractéristiques : caractéristiques liées au domaine, interactions et temporelles (sans fuite)
  • Reproductibilité : pipelines avec graines + documentation claire


Livrables

  • Notebook Jupyter
  • Dictionnaire de caractéristiques
  • Comparaisons de métriques avant/après


À qui je m’adresse

  • Équipes commerciales ayant besoin de données prêtes pour l’analyse
  • Praticiens en ML et Kagglers cherchant à améliorer leurs modèles
  • Chercheurs académiques exigeant des résultats transparents


Envoyez-moi la taille de votre dataset, la colonne cible, le type de problème et la métrique, et je vous recommanderai la meilleure approche ou élaborerai une offre personnalisée de création de caractéristiques adaptée à vos besoins.

Expertise:

Apprentissage des fonctionnalités

Classification

Langage de programmation:

Python

R

MATLAB

Frameworks:

Scikit-learn

SimpleCV

keras

PyTorch

Panda

Outils:

Jupyter Notebook

opencv

tensorflow

Excel

Colab

RStudio