Je vais effectuer un nettoyage et un prétraitement professionnel des données avec python et Pandas

Certaines informations ont été traduites automatiquement.

Inde

Je parle Hindi, Anglais

Spécialiste en nettoyage et prétraitement de données avec Python Pandas, ensembles de données prêts pour le ML

J’aide les entreprises et les data scientists à transformer des ensembles de données désordonnés et inutilisables en données propres et prêtes pour le ML — rapidement et professionnellement. Ce que j...
À propos de ce service

Votre ensemble de données est-il rempli de valeurs manquantes, de chaînes d’erreur ou de substituts inconnus ? Je vais le nettoyer professionnellement et livrer un ensemble de données prêt pour le ML à 100 %.


CE QUE JE FOURNIS :

Détection de toutes les valeurs sales (INCONNU, ERREUR, N/A, chaînes vides)

Standardisation des substituts en NaN approprié

Conversion correcte des types de données (numérique, datetime, catégorique)

Imputation intelligente des valeurs manquantes par colonne :

  - Échantillonnage probabiliste pour les colonnes catégoriques

  - Logique métier arithmétique pour les colonnes numériques

  - Ingénierie des caractéristiques pour les colonnes de date

Jupyter Notebook - propre, commenté, reproductible

Rapport PDF avec graphiques et explications logiques


POURQUOI MA MÉTHODE EST DIFFÉRENTE :

La plupart des freelances remplissent chaque valeur manquante avec la moyenne ou la médiane. Moi,

j’analyse pourquoi des valeurs sont manquantes et je choisis la stratégie statistiquement correcte

pour chaque colonne séparément.


PARFAIT POUR :

Jeux de données Kaggle avant modélisation

Données de transactions commerciales avec erreurs POS

Données d’enquêtes avec réponses incomplètes

Toute CSV ou Excel avec des entrées désordonnées et incohérentes


OUTILS : Python - Pandas - NumPy - Scikit-learn - Matplotlib - Seaborn

Mon portfolio