Ignorez "XXX Items Cleaned" dans la vue d'ensemble du package, les packages sont facturés en fonction de la taille du dataset spécifiée dans la description du package.
Dataset propre :
- Identifier et corriger les erreurs, incohérences ou problèmes de formatage dans le dataset pour garantir sa précision et sa préparation à l’analyse.
Prétraitement du dataset :
- Fusionner des catégories similaires
- Modifier les types de données des colonnes
- Supprimer les colonnes inutiles
- Création de caractéristiques en fonction de l’objectif d’analyse
- Normaliser le dataset
- Standardiser le dataset
- Masquer / Encoder en one-hot
- Détection des valeurs aberrantes
- Fournir une analyse factorielle (si nécessaire)